SpamBrain : le combat anti-spam de Google fondé sur l’intelligence artificielle

IA : les équipes de Google luttent contre le spam dans les liens avec SpamBrain

Depuis son lancement en 2018, SpamBrain, l’algorithme de détection du spam de Google, s’est fortement développé. Depuis décembre 2022, il est capable de bloquer les sites visant à créer des liens de spam avant leur indexation. L’objectif principal de SpamBrain est de lutter contre toutes les formes de spam.

40 milliards de spams détectés chaque jour

Sécuriser l’index de recherche

C’est le chiffre annoncé par Google. Il a presque doublé en deux ans. Destiné à tromper le moteur de recherche pour favoriser l’indexation d’un site, le spamming entraîne une perte de temps pour l’utilisateur et un fort risque d’escroquerie. Les canaux utilisés sont variables : spam par email, SMS, réseaux sociaux, etc. Les spams sont générateurs de phishing, d’arnaques en lignes diverses, de propositions non sollicitées. La lutte de Google contre le spam est essentielle pour une expérience utilisateur optimale. Il en va de la crédibilité des SERP (search engine results page).

Lutter contre les techniques SEO douteuses

Hôtels, commerce en ligne, agences de voyages cherchent constamment à optimiser leur référencement sur Google pour une raison simple : plus de vues impliquent plus de ventes. C’est la raison pour laquelle les entreprises investissent massivement pour augmenter leur visibilité et le trafic sur leurs sites web. Parallèlement aux techniques commerciales, des pratiques de référencement douteuses comme le « black hat et le grey hat » ont explosé.

Elles consistent à multiplier les mots-clés, dissimuler du texte ou des liens (black hat) ou à dupliquer du contenu, à acheter des noms de domaine expirés (grey hat). Elles cherchent à tromper les règles de bonnes pratiques de référencement pour promouvoir un service ou un produit.

SpamBrain, l’outil anti-spam de Google

Un programme de filtrage intelligent

Fondé sur l’intelligence artificielle (IA) SpamBrain a pour fonction de bloquer tous les spams (logiciels malveillants, tentatives de phishing, courriels indésirables, etc.). Actualisé en temps réel grâce à l’IA (qui permet l’apprentissage automatique), il distingue de plus en plus précisément les référencements naturels et légitimes des tentatives de détournement du type cloaking. Il repère automatiquement les schémas comportements malveillants ou douteux avant l’indexation. Les pages promues de manière illicite ou contraires aux principes d’une bonne pratique SEO sont rétrogradées ou bloquées.

Les résultats de SpamBrain sont éloquents

Google annonce qu’entre 2020 et 2021, SpamBrain a multiplié par 6 son taux de détection de pages douteuses (webspam report 2021). De même, les clics vers des sites frauduleux ont été réduits pour la même période de 50 %. Toujours selon Google, 99% des recherches sont aujourd’hui saines, c’est-à-dire qu’elles ne renvoient pas sur des sites qui abusent du spamming. SpamBrain détecte le spam pendant l’exploration et avant l’indexation.

Les nouveautés de SpamBrain

Le Link Spam Update neutralise les spams

Acheter ou échanger des liens est une technique classique du référencement pour augmenter la visibilité et le trafic sur une page. La nouvelle mise à jour de SpamBrain pénalise les liens qui n’apportent pas une réelle valeur ajoutée. Elle vérifie et détecte les schémas visant à contourner les règles de Google Search, comme les backlinks artificiels. La mise à jour est récente (décembre 2022) et s’étend à toutes les langues proposées par Google.

La lutte contre le cyberharcèlement

Google a mis en place de nombreuses mesures pour lutter contre le harcèlement en ligne (injures, fake news, menaces, etc.).

  • Interdiction de toutes formes de harcèlement dans les politiques de contenu
  • Possibilité de signaler les contenus injurieux
  • Filtrage des commentaires

Grâce à l’IA, SpamBrain est en mesure de détecter et de bloquer les commentaires haineux avant qu’ils ne soient visionnés par les internautes. L’idée générale est de protéger au maximum les internautes.

Vers un renouveau du référencement SEO

Les sanctions immédiates de SpamBrain

Les référencements qui tentent de manipuler les indexations de Google pour booster leur visibilité sur Internet en utilisant les techniques suivantes verront leurs efforts réduits à néant :

  • Présentation de contenus trompeurs (cloaking) ou contenus auto-générés
  • multiplication de pages intermédiaires sans utilité pour l’internaute (doorways)
  • piratage ou vol de contenus, redirections malveillantes ou sournoises
  • dissimulation de textes ou de liens
  • sur-optimisation de mots-clés (keyword stuffing)

SpamBrain vise à pénaliser les contenus destinés à tromper l’algorithme de Google pour obtenir un meilleur classement. Ce n’est pas le cas des contenus généré par l’IA lorsqu’ils visent produire de la qualité et de l’utilité.
A contrario, les bonnes pratiques SEO sont récompensées.

  • liens naturels et externes pertinents
  • contenus authentiques et de qualité
  • une sémantique riche et originale
  • recherche de l’intention de l’internaute

Les sites qui apportent une réelle valeur ajoutée seront donc mieux classés dans la SERP.

Favoriser les contenus à forte valeur ajoutée (Helpful Content)

Les nouvelles mises à jour de SpamBrain ont perturbé le classement des sites web. Par exemple, les acheteurs de liens dont l’objectif est le seul classement, se sont vus pénalisés fortement. Les webmasters sont invités à respecter les quatre piliers d’un contenu efficace :

  • expertise (connaissance poussée du sujet)
  • expérience (contenu produit par une personne)
  • autorité (source fiable d’information)
  • fiabilité (site digne de confiance)

Aujourd’hui, pour éviter d’être sanctionné par SpamBrain, les contenus doivent être résolument orientés vers l’humain et non vers le moteur de recherche lui-même.

Pur produit de l’IA, le filtre SpamBrain fait le maximum pour humaniser le contenus de page web. Il cerne l’intention liée à la recherche, favorise les sites véritablement utiles aux internautes et pénalise ceux qui tentent de piéger son algorithme.

Facebook
Twitter
LinkedIn