SEO : comment Google identifie qu’un contenu est prioritaire sur celui d’une autre page web ?

Sans aller jusqu’au duplicate content qui est pénalisé, à savoir que le contenu d’une page est le plagiat à 100% d’une autre page, Google ne pénalise pas les pages dont le contenu est proche. Quand vous traitez d’un sujet sur votre site Internet, il existe différentes façons d’exprimer en doublon cette substance, sans pour autant la reprendre mot pour mot. De la même manière, la matière que vous exprimez sur vos pages est sans doute déjà abordée sur d’autres sites concurrents.

Dans ces conditions, Google tente de déterminer quelle version représente le mieux le sujet considéré. Face à ces différentes versions, il doit choisir la meilleure, selon ses critères. Mais comment, pourquoi et avec quels critères ? C’est ce que je vais vous expliquer, après avoir trouvé 2 brevets dont je suis fan en tant que seo manager.

Pas de score d’autorité, mais des règles de priorité

Aucun score d’autorité

John Mueller a annoncé dans un tweet de 2019, que la firme de Mountain View ne confère aucun score permettant à un site de faire autorité comparé à un autre. Manifestement, c’est un mythe ou une unité de mesure créée par d'autres experts. Mais pour simplifier mon discours, j’accepte l’imprécision de dire que l'URL de la plus haute autorité devient la version canonique. Les autres pages web sont alors considérées comme des doublons.

Comment fait Google ?

Sans donner des notes d’autorité, Google trouve pourtant le moyen de distinguer les pages dupliquées sur différentes domaines, en se basant sur des règles de priorité. Elles sont expliquées dans un brevet dont la traduction du nom en français donnerait Identifier une version primaire d'un document.

Le 1er brevet au bénéfice de Google

Les 2 développeurs sont Alexandre A. Verstak et Anurag Acharya , et Google a obtenu le brevet sous le N° 9 779 072 le 03 octobre 2017. Il a fallu 4 ans entre le dépôt et l’accord.

 
Devis de référencement du seo manager


Que propose ce brevet de 2017 ?

Ce brevet dispose que l’algorithme est capable d’identifier une version principale parmi différentes versions du même document. Le système détermine une priorité pour chaque version grâce à ces règles et d’autres informations associées à la version du document considéré.

La première partie du brevet aborde comment Google détermine quelle est la version principale d’un texte :

Un premier système existe depuis 2014

Un second brevet toujours en place - qui est antérieur à celui de 2017 en fait - dispose que les informations identifiant l’ensemble des documents avec un contenu similaire, sont fusionnées en éléments caractérisant chacune de ces pages. Chacune d'elles peut être exclue de cet ensemble - ce qui mauvais pour son référencement -, et chaque nouvelle page trouvée sur le web avec contenu proche, peut intégrer cet ensemble (puis en ressortir ou pas).

Un contenu de qualité est un bon signe

Le brevet précise qu’il choisit un seul document représentatif pour chaque ensemble de pages web, dans la mesure où elles sont identifiées conformes à d’autres règles préalables. La qualité de chaque contenu est mesurée sans tenir compte des requêtes auquel il est lié. C’est vraiment la qualité du contenu qui prime. La page peut alors être indexée.

Obtention en 2014

Les 4 développeurs ayant permis à Google d’obtenir le brevet en octobre 2014 sont Daniel Dulitz, Alexandre A. Verstak, Sanjay Ghemawat et Jeffrey A. Dean. Il a fallu 2 ans seulement pour son accord sous le N° US 8.868.559.

 

Pourquoi définir un contenu prioritaire ?

Pourquoi une version parmi un ensemble de pages dupliquées, peut être considérée comme une version principale ? Et surtout, pourquoi le faire ? La première version du brevet souligne 2 arguments :

Optimiser votre site = rédiger du contenu utile et fiable pour les lecteurs

Je veux en venir à un point majeur de ce qu’est le référencement naturel : beaucoup de porteurs de projets liés au SEO de leur site demandent des devis pour gagner des positions dans les résultats de recherches. Ils attendent des optimisations techniques, voire sémantiques. Mais à la lecture de ces 2 brevets, il est clair que l’optimisation la plus importante est de réécrire un vrai article, avec des informations actualisées et utiles aux lecteurs.

Pour rappel, le brevet dit chercher «le résultat de recherche le plus approprié et le plus fiable». Votre rédacteur doit apporter cette fiabilité.

Comment ça marche ?

La comparaison des ressources en ligne

Le brevet indique qu'une méthode d'identification d'une version principale à identifier s’effectue à partir d'un certain nombre de sources différentes, telles que :

Les critères mesurés

Quelles sont les critères servant à prioriser un contenu ? Les quelques critères suivants sont mesurés :

 

 

Dans un second temps seulement, la longueur du texte est qualifiée.

Le choix du contenu prioritaire se fie à un score, qui est l’association de la première mesure et de la seconde. Un texte de 700 mots n’est pas considéré comme prioritaire comparé à un texte de 350 mots, si le plus court a une qualité informative plus utile à l’internaute.

 
Contacter le search expert

Pour compléter votre information, cherchez d'autres conseils sur le site du prestataire indépendant :
4 Commentaires
Commentaire de bleu ciel 44
Je dis que peu importe que ce soit une agence web ou une agence de référencement pour référencer un site internet. Si le webmaster est seo, l'agence web est compétente. EN plus, une agence de référencement fait des tarifs généralement plus cher.
Envoyé le 08 septembre 2011 à 17:25
Commentaire de tartiflette
Il n'y a pas que les agences web de Paris qui ont de la concurrence, lol, les agences de référencecement de France en général ont de la concurrence !
Envoyé le 05 septembre 2011 à 22:14
Commentaire de tarif référencement Paris
Le prix du référencement d'un site internet est une chose, la qualité en est une autre. Aujourd'hui, pour 400 € mensuels, parfois 500 € ça dépend, il est possible d'avoir un très bon référencement Google.
Envoyé le 05 septembre 2011 à 13:04
Commentaire de pelmele
De toute façon, le référencement d'un site web ou la création d'un site web, c'est pareil : un devis pas cher est un signe que l'agence web va mal travailler et le référencement ne pas être à la hauteur des attentes, et un tarif trop cher montre que l'agence web s'en met plein les poches ! Bref, le juste prix d'un référencement ou pour créer son site web est un tarif pas trop cher et pas le moins cher non plus, un juste milieu.
Envoyé le 02 septembre 2011 à 19:42

Un commentaire, une question ?
Tous les champs sont obligatoires