Une plongée au cœur des secrets de l’algorithme de Yandex

Yandex : le Google russe dans la tourmente !

Le 25 janvier 2023, une nouvelle a secoué le monde du SEO. Une fuite de données (que l’on appelle aussi « leak ») a rendu accessible un document répertoriant 1 922 critères de pertinence de Yandex, le moteur de recherche russe. Des informations ô combien précieuses en SEO car elles nous permettent de mieux comprendre le fonctionnement de l’algorithme de ce moteur… et par la même occasion, celui de Google.

En effet, bien que ces deux algorithmes présentent des différences, on peut supposer qu’ils ont aussi quelques similitudes, notamment au niveau de ces fameux facteurs de classement. C’est pourquoi, l’annonce de ce vol de données (plus de 40 Go), qui a eu lieu en juillet 2022, et leur partage en ligne quelques mois plus tard ont été une aubaine pour les agences et experts en référencement naturel. Et même si l’on sait que certains critères sont dorénavant obsolètes et que d’autres ont été ajoutés, il reste utile de s’y intéresser. D’autant que ce type de fuite est assez rare dans ce domaine, et donne accès à des informations qui suscitent la curiosité de tout bon professionnel du SEO. Notre agence Powertrafic n’y échappe pas !

Yandex, la version russe du moteur de recherche Google

Yandex est un navigateur et un moteur de recherche venant de Russie. Disponible depuis la fin de l’année 1997, il a été créé par la multinationale du même nom, fondée par Arkadi Voloj. Comme le géant américain, l’entreprise a développé au fil des années de nombreux services, assez variés dont un outil de traduction (Yandex Translate), un autre de géolocalisation (Yandex Maps), une messagerie web (Yandex Mail), un réseau de taxis (Yandex Taxi) ou encore, un smartphone (Yandex Phone).

Plutôt fiable et efficace, ce moteur de recherche russe est un bon outil, simple d’utilisation qui, à la différence de Google, est davantage tourné vers l’expérience utilisateur. Ainsi, il peut être considéré comme une alternative intéressante à son célèbre concurrent américain, bien qu’il ne propose pas de services inédits. D’ailleurs, en Russie, il a longtemps été numéro 1… avant d’être détrôné par Google. Désormais, il occupe la deuxième place.

Peu connu du grand public en France, il est pourtant le 4ème moteur de recherche le plus utilisé au monde. Google étant n°1, Bing n°2 et Yahoo n°3. La fuite du code source de quelques-uns de ses services a donc pu échapper aux internautes, mais pas aux spécialistes du SEO qui ont pu (enfin) accéder aux secrets de ce moteur de recherche russe.

À la suite de cette révélation, la réaction de Yandex ne s’est pas fait attendre. La multinationale a indiqué qu’elle n’avait pas été piratée. Son « service de sécurité a trouvé des fragments de code d’un référentiel (repository) interne dans le domaine public, mais le contenu diffère de la version actuelle du référentiel utilisé dans les services Yandex ». Une enquête interne a donc été ouverte, pour connaître « les raisons de la diffusion de fragments de code source au public » mais elle n’y voit « aucune menace pour les données des utilisateurs ou les performances de la plateforme ». Quant à l’auteur de cette fuite, il s’agirait selon les rumeurs d’un ex-employé de l’entreprise. Mais aucune information n’a été confirmée à ce sujet. Le mystère reste donc entier.

1 922 facteurs de classement de l’algorithme de Yandex dévoilés

Comme nous l’avons indiqué précédemment, cette fuite a révélé les critères utilisés par l’algorithme du moteur de recherche russe pour positionner les sites web dans les SERP. Et leur nombre est assez conséquent puisqu’il est de 1 922. Présentés sous la forme d’une liste, ces éléments sont numérotés, décrits, associés à des documents internes et à leurs auteurs. En raison de leur quantité, il est difficile de tous les décrire. En revanche, certains – dont PageRank qui est aussi utilisé par Google – ont davantage attiré l’attention des experts SEO. L’un d’eux, Alex Buraks, les a d’ailleurs listés et mis à disposition des autres spécialistes. En voici quelques-uns.

Les facteurs liés aux backlinks

Sans surprise, les backlinks (ou liens entrants) sont aussi importants pour Yandex que pour Google. L’algorithme du moteur de recherche russe utilise d’ailleurs des filtres pour distinguer les bons backlinks des mauvais. De même, pour positionner un site dans ses SERP, il se réfère à l’ancienneté de ces liens et analyse leur pertinence en fonction du sujet d’une page.

On apprend également que les backlinks publiés sur les pages d’accueil sont jugés de meilleure qualité que ceux issus de pages internes d’un site. L’algorithme prend aussi en compte les ancres des liens, et privilégient celles intégrant tous les mots-clés d’une recherche (et quand ils sont dans l’ordre, c’est encore mieux). Quant à l’origine des backlinks, s’ils proviennent de sites figurant dans le top 100 de PageRank, ils ont davantage d’impact.

Les critères en lien avec le trafic d’un site

Pour classer un site dans les SERP, l’algorithme de Yandex examine notamment les pourcentages de trafic organique et de trafic direct dans l’ensemble du trafic entrant, ainsi que les nombres de visiteurs uniques et de requêtes concernant directement le site web ou l’URL d’une page du site.

Les facteurs se référant au contenu d’une page

En SEO, le contenu est un critère de classement important d’un site. Ainsi, il n’est guère étonnant de découvrir que, pour Yandex, les contenus de qualité améliorent le ranking de tout le site. Le ranking étant, sur une recherche donnée, la position occupée par un site dans les SERP. Il fait aussi attention à l’ancienneté d’un contenu et sa date d’actualisation, et à la quantité de publicités sur une page (plus elles sont nombreuses, plus elles gênent l’internaute dans sa lecture, sa consultation d’une page).

Les critères en rapport avec les URL

Pour l’algorithme du moteur de recherche russe, les chiffres dans l’URL d’une page nuisent à son positionnement dans les SERP, ainsi que le nombre de barres obliques finales (les slashes). En revanche, sont bien considérées la haute disponibilité (ou High Availability) des URL qui améliore l’expérience utilisateur des internautes et la présence de mots-clés (3 au maximum).

Les facteurs liés au comportement des internautes

Divers critères relatifs au comportement des utilisateurs sont utilisés par l’algorithme de Yandex pour classer les pages dans les SERP. Il y a notamment le taux de clics (CTR), le temps passé sur une page, le taux de rebond, le nombre de visiteurs qui reviennent sur la même page au cours d’un même mois et le nombre de fois qu’une page est marquée en favori.

Tous les critères que nous venons de citer sont donc (ou l’ont été puisque plusieurs d’entre eux sont désormais obsolètes) utilisés par l’algorithme du moteur de recherche Yandex pour déterminer la position d’un site dans les SERP. Cependant, il est intéressant d’en avoir connaissance car il est fort probable que certains soient également pris en compte par Google.

Que peut-on retenir en SEO de ces révélations ?

Pour les professionnels du SEO, cette fuite de données représente une opportunité à laquelle, il faut le reconnaître, on ne s’attendait pas. Certes, tous les critères ne sont plus d’actualité, mais ils offrent un aperçu du fonctionnement d’un moteur de recherche. Et en référencement naturel, ce n’est absolument pas un détail négligeable.

En effet, si les moteurs indiquent les mises à jour de leurs algorithmes et les bonnes pratiques à respecter pour bien positionner un site dans les SERP, ils sont en revanche très discrets quant à leurs critères spécifiques de classement. Il est donc impossible de savoir précisément comment avoir un bon ranking dans les SERP. On peut tenter de deviner leurs critères en se référant à leurs recommandations et en analysant les méthodes de leurs algorithmes, mais cela reste de la spéculation.

De même, s’il est intéressant d’en savoir plus sur les facteurs de classement de Yandex, il faut rappeler qu’ils concernent uniquement ce moteur de recherche russe, qui est peu utilisé en France. On peut imaginer que Google se base sur des critères similaires, mais rien ne le garantit puisqu’aucune fuite n’a eu lieu chez le géant du web américain. Et n’oublions pas non plus qu’ils évoluent constamment. Néanmoins, si la divulgation de ces 1 922 facteurs de classement ne va pas révolutionner notre manière de travailler, elle nous fournit un aperçu général du fonctionnement d’un moteur de recherche. Et c’est toujours bon à prendre.

Facebook
Twitter
LinkedIn