Que savez-vous vraiment sur le brevet Panda ?

 

 

Depuis plusieurs jours, des propriétaires de sites internet pénalisés contactent en masse l’agence de référencement pour leur apporter son aide. De là, nous avons eu l’idée de cet article, lequel permet de connaître davantage le brevet de Panda, l’un des noms d’algorithmes servant au référencement d’un site. Une fois n’est pas coutume, notez que la lecture est assez technique, et si vous n’êtes pas passionné(e) par le sujet, vous pourriez avoir des maux de têtes… Pour les aficionados, vous aurez même accès au brevet en ligne :)

 

Qualité de recherche contre spams

Ce n’est pas le premier dépôt de brevet de la firme californienne en matière de lutte contre le spam sur le web, ou si vous préférez, comment lutter contre les tentatives de manipulations des prestataires payés pour faire monter artificiellement, ou trop vite, les sites de leurs clients dans les moteurs de recherches.

 

Le premier brevet a été déposé en 2003, et s’intitule Méthodes et systèmes pour identifier les articles manipulés. D’autres consistent à évaluer les mots significatifs et les expressions qui ont tendance à apparaître plusieurs fois dans les résultats de recherches pour une requête définie, et à faire monter dans les classements les pages où ces expressions apparaissent. Ils visent également à augmenter le poids accordé aux textes d’ancrage en utilisant un des ces termes coïncidents et récurrents. Ce sont les brevets de recherche de qualité.

 

Il y a beaucoup de brevets d’indexation par expression, et au moins un d’eux fait face aux problèmes de spam en analysant statistiquement la présence anormale de mots concomitants à partir des résultats d’une page.

 

Mise au point sur la qualité

Le brevet délivré par Navneet Panda et Vladimir Ofitserov, porte le nom de Positionnement des résultats de recherche. Il vise à améliorer la qualité des résultats de recherche plutôt que de pénaliser les sites, ainsi qu’à identifier les tentatives de manipulation des résultats de recherche. Le brevet ne fait part que d’un seul « avantage » à suivre le processus qu’il décrit : Les résultats de recherche détectant des sources de mauvaise qualité peuvent être déclassés dans l’ordre de présentation des résultats de recherche renvoyé en réponse à la requête de l’internaute. De ce fait, la navigation de l’utilisateur peut être améliorée car les résultats de recherches les mieux placés dans l’ordre de présentation correspondront mieux aux informations dont il a besoin.

 

Avant que la mise à jour Panda ne soit lancée, le public était très critique quant à la qualité des résultats de recherche affichés dans Google. Il y avait vraiment un sentiment que quelque chose était cassé, affichant des résultats visant plus à correspondre aux requêtes qu’à présenter un contenu de qualité. D’ailleurs beaucoup de soi-disant experts en référencement relayent encore sur leurs blogs qu’il faut travailler sur des requêtes exactes, aussi bien dans le contenu de son site que dans le cadre du netlinking. Par exemple si vous avec un site e-commerce et que vous vendez des chaussures rouges pour femmes, il faudrait selon eux trouver cette expression en masse dans les pages du site. Certains prestataires vont même jusqu’à faire du netlinking avec l’ancre chaussures rouges femmes… Bien évidemment, aujourd’hui nous en sommes à l’ère de la longue traîne… !

 

Améliorer la qualité

Ces critiques ont été entendues jusque dans les locaux de Googleplex, et en février 2011 (cela ne nous rajeunit pas…), le blog officiel de Google nous annonçait une mise à jour dans le post intitulé Trouver plus de sites de qualité dans les recherches. Ce changement a eu une incidence sur un important nombre de recherches, et était clairement destiné à promouvoir un contenu de meilleure qualité :

Mais ces derniers jours, nous avons lancé une grosse amélioration algorithmique à notre classement (un changement qui concerne 11,8 % de nos recherches) et nous voulions que les gens le sachent. Cette mise à jour est prévue pour réduire le positionnement de sites de mauvaise qualité (les sites qui ont une faible valeur ajoutée pour les utilisateurs, qui copient le contenu d’autres sites ou simplement qui ne sont pas très utiles). En même temps, elle fournira un meilleur positionnement des sites de haute qualité (les sites qui ont un contenu propre à eux et qui contiennent des informations liées à des recherches, des rapports détaillés, des analyses réfléchies et bien d’autres).

 

Résumé du brevet

Voici un bref résumé du brevet et de ce qui se passe dans le processus qu’il décrit :

 

Ainsi, le brevet est composé de différentes parties complémentaires.

 

La première consiste à examiner les liens pointant vers les pages d’un site et à supprimer tous les backlinks qui pourraient être liés au site, appartenant à un ou deux propriétaires, ou à réduire le nombre de liens indépendants. Il est tout à fait possible que cela soit fait de sorte à avoir une idée de combien de pages sans rapport et de liens indépendants pointent vers un site ; les liens indépendants provenant de plusieurs ressources pouvant être considérés comme un signe de qualité.

 

La deuxième est une analyse permettant de voir si oui ou non des pages sont ciblées dans des recherches spécifiques. Bien qu’il ne soit pas inhabituel que quelqu’un ait recours à une stratégie de SEO pour essayer de transformer chaque page d’un site en une page de destination potentielle, la plupart des sites appelés fermes de contenus utilisent souvent toutes leurs pages pour cibler des requêtes commerciales, ainsi que d’autres variations de celles-ci. Un site considéré comme ferme de contenu pourrait inclure plusieurs pages qui tentent de répondre à beaucoup de requêtes.

 

Les liens indépendants et les requêtes de référence pour les différents groupes dans lesquels un site peut être réparti, sont examinés comme un ratio. Si il y a beaucoup de liens indépendants et peu de requêtes de référence, le ratio peut être supérieur à un. Si il y a peu de liens indépendants et beaucoup de requêtes de référence, le nombre peut être inférieur à un. Ce nombre, basé sur les liens et les requêtes, est ensuite multiplié par un score qui a été modifié en fonction de si oui ou non chaque page est considérée comme une requête de navigation pour un terme ou une expression.

 

Des groupes plutôt que des pages

Plutôt que de cibler des pages ou sites spécifiques comme la plupart des algorithmes le font, le brevet analyse les groupes de ressources. Un groupe peut être défini de plusieurs façons. Il peut être basé sur une adresse, et toutes les ressources de ce groupe sont référencées sous le même nom de domaine, comme www.exemple.fr. Elles peuvent aussi être référencées sous le même nom d’hôte dans un domaine, comme http://item1.exemple.fr ou http://item2exemple.fr.

 

De même, un site peut ainsi être réparti dans plusieurs groupes, ou peut être intégré à un groupe qui contient plus d’un site. Pour positionner les pages au sein de ces groupes, le ratio de liens indépendants par rapport aux requêtes de référence est multiplié par un score prenant en compte des signaux de navigation pour déterminer un classement final.

 

Il faut rechercher les liens indépendants

Si le but de ce brevet est de mieux positionner les pages de meilleure qualité, l’une des manières consiste à regarder le nombre de liens indépendants vers ces pages, ou groupes de pages. A titre d’illustration, notre agence a reçu ce lundi un demande de devis pour aider un site à sortir d’une pénalité manuelle ; son porteur de projet avec 34 000 liens sur environ 900 sites différents (en fait, 37 liens par site ou blog). Il est évident que le site soit sacrifié…  

 

Pour chacun de ces groupes de ressources, le brevet peut donc compter le nombre de liens vers ces groupes. Il peut aussi compter les liens implicites, qui correspondent à ce que nous appelons souvent référence à une ressource. Un hyperlien peut être utilisé pour naviguer vers une autre page, alors qu’un lien implicite ne peut pas être cliqué pour renvoyer une personne vers la cible du lien en question.

 

Un lien indépendant provient d’une source indépendante de la sa cible. Le groupe source dans lequel se trouve un lien indépendant, peut être comparé au groupe cible pour déterminer si eux aussi sont indépendants l’un de l’autre. Certains référenceurs soutiennent que Pingouin se charge de cette vérification ; hé bien non ! C’est bien une mise à jour de Panda qui le fait !

 

Observer le fait que les liens d’un groupe vers un autre ne sont pas indépendants peut aussi vouloir dire que ces groupes de ressources sont sûrement reliés, possédés, hébergés ou créés par la même entité. Il peut y avoir sanction, ou pour le moins une pénalité. Si les ressources ont un contenu, des images, un formatage, un style CSS, etc., similaires voire identiques, c’est un autre signe qu’elles ne sont pas indépendantes, ou qu’il y a eu duplicate content (ne serait-ce de code). Sur les plusieurs liens d’une ressource vers un groupe cible, un seul peut être compté comme indépendant. Bien que ce ne soit pas expliqué dans le brevet, cela pourrait permettre de ne compter qu’une seule fois les liens.

 

Les requêtes de référence

En plus d’une analyse des liens renvoyant vers les différents groupes références, le processus examine également les pages du site et les requêtes que chacune est susceptible de cibler. Comment ces pages répondent aux requêtes ? Si une page comporte l’expression exemple.fr, il est possible que ce soit pour se référer à la page d’accueil d’un site, et ce peut être cette dernière qui sera affichée dans les résultats. Si elle comporte des termes habituellement employés par les utilisateurs pour chercher les pages d’un site, il est possible que ce soit pour inclure des requêtes de référence renvoyant vers ces pages.

 

Le brevet entier est visible ici : Ranking Search Results - Positionnement des résultats de recherches
Co-écrit par Navneet Panda et Vladimir Ofitserov
Assigné à Google
États-Unis
Brevet 8,682,892
Déposé le 28 septembre 2012
Accordé le 25 mars 2014

Observation et conclusions

Déjà, bravo d'avoir lu jusque là (vous n'avez pas triché, dites ?). Il est clair que Google a ajusté et modifié l’algorithme Panda dans les semaines, puis les mois, après qu’il ait été mis en place, et a même apporté beaucoup de changements à ce dernier lors d’une période bêta. Maintenant, l’analyse d’un lien impliquant les liens indépendants, ainsi que les requêtes de référence, est plus une tentative d’évaluation de la qualité d’un site internet. Les analyses de requêtes de navigation sont également des tentatives de compréhension de la qualité des pages.

 

 

Commentaires

@ patrick33 : Merci pour le commentaire. Nous pensons qu’il ne s’agit pas de parler de Panda ou d’un autre algorithme, sans montrer un moment donné que l’on sait de quoi il en retourne. Pas mal de prestataires se disent experts mais n’en savent que ce qu’ils lisent dans des blogs qu’ils copient ailleurs, et parfois rien d’actualisé en plus. Nous avons souhaité apporter une élément nouveau, une information qui est si pénible à avoir (!), que vous l’avez constaté par vous-même, nous ne sommes pas nombreux à l’éditer.
Envoyé le 12/08/2014 à 15:28 par Agence BreizhMasters
L'article est un peu long à lire mais très complet, donc très intéressant. J'ai pratiqué de nombreux blog sur le référencement, à la fois d'agences et des freelance, mais c'est la 1 fois que j'ai accès à quelque chose d'aussi poussé. ça change !
Envoyé le 12/08/2014 à 11:33 par patrick33
Votre Pseudo :
Votre E-Mail :
Votre Message :
Code de confirmation :anti-flood
A recopier ci-contre * :