Vous allez entendre parler de SMITH !

Google a récemment publié un article de recherche sur un nouvel algorithme appelé SMITH. Je partage avec vous ce document qui est toutefois en anglais : téléchargez le document sur SMITH (en PDF). Selon la firme de Moutain View, il surpasse le précédent algorithme BERT pour la compréhension de longues requêtes et des longs documents. Il comprend bien sûr les passages dans les documents de la même manière que BERT comprend les mots et les phrases.

A propos de SMITH

Les bases de l'algorithme

Son petit nom est l’acronyme de Siamese Multi-depth Transformer-based Hierarchical. C’est de l’intelligence artificielle, puisqu’il est question de réseau neuronal. Or les réseaux de neurones permettent l’analyse de l’existant et prédictive. Il ne faut surtout pas oublier ce second volet, même si au départ la prédiction est liée à l’apprentissage des signaux d’un documents.

Ceci demande énormément de ressources, et je comprends mieux pourquoi une majorité de modifications du côté de Google en 2020 lui permettait, selon mon avis de l’époque, d’en économiser. Peut-être que je dis une ânerie sur le rapport entre mon analyse et l’arrivée de SMITH, mais le lien me semble spontanément évident.

Un nouveau modèle, pas de nouvelles règles

L’algorithme SMITH est un nouveau modèle pour essayer de comprendre des documents entiers, et moins accessibles. Les modèles tels que BERT sont formés pour comprendre les mots dans le contexte des phrases, et des phrases dans des paragraphes. Il est ici question d’un contenu entier. Plus le texte est long, plus il est performant.

Dans une description très simplifiée, le modèle SMITH est formé pour comprendre des passages dans le contexte du document entier. Pour ce faire, il fonctionne par blocs. La structure des paragraphes vont prendre beaucoup plus d’importance.

Les professionnels du SEO vont me dire que BERT le faisait déjà. En partie seulement, de façon limitée. La longueur du texte et du bloc pouvait être une limite. Certains experts avances que la longueur de l’introduction d’un document est sa première limite. Je n’ai pas remarqué cette caractéristique. Il m’arrive d’écrire des introductions longues, ce qui n’empêche pas le positionnement d’un site Internet considéré d’évoluer sur les mots clés travaillés. En revanche, il était préférable de rédiger des phrases courtes jusqu’à fin 2020.

Commencez à voir loin en comprenant SMITH

Ne pas séparer ce qui est siamois pour établir l’ordre (règle universelle)

L’enjeu est la rédaction SEO notamment, à des fins de ranking. Le mot Siamese laisse entendre en français qu’il y a une comparaison entre plusieurs passages d’un même texte (ou de plusieurs). Cet algorithme a donc besoin d’une compréhension plus approfondie des relations sémantiques. Ce qui implique de mesurer la correspondance entre des fragments de texte. Plus que jamais la rédacteur SEO devra définir une stratégie éditoriale pour chaque page Web, avec une logique compréhensible dans le déroulement de son discours.

SMITH est sensé regarder la correspondance entre les textes eux-mêmes, intégrés sur différentes pages Web. La structure des documents et de la navigation entre les pages du sites Internet influence la compréhension de l’algorithme.

Attention, le modèle SMITH ne remplace pas BERT, il le complète en réalisant un travail que le second est juste incapable de faire.

Outre l’aspect siamois, l’autre qui me saute aux yeux est le contexte Multi-depth et le based Hierarchical. Vous comprenez sans doute le premier : la profondeur à différents niveaux.

La profondeur à différents niveaux

La notion de profondeur en SEO est un aspect structurel. Les experts font correspondre les différents niveaux à un degré d'accessibilité d'une page dans un site Internet considéré. Cesont les notions de silos sémantiques et de maillage interne. C’est une très bonne nouvelle pour les contenus plus anciens.

Dans la mesure ou il est très rare qu’un site soit capable de produire tous les jours beaucoup de rédactionnels d’une longueur supérieure à 550 mots, voire de 2 100 mots, la longueur des articles est fatalement courte. Si bien que Google favorise aujourd'hui les nouvelles publications dans cet environnement. Avec SMITH, les textes de 1 500 mots devraient pouvoir remonter plus facilement, si tant est que la qualité soit présente.

Autre bonne nouvelle : les pages un peu plus profondes sont moins considérées par BERT. Les pages de niveau IV voire V vont pouvoir acquérir un impact plus important. J’aime cette perspective enlaquelle je crois.

 

Sur une même page Web, la notion de profondeur fait référence à la hiérarchisation. C'est-à-dire la hiérarchisation d’un élément d’une page vis-à-vis d’un autre. Ceci se réfère évidemment aux H1, H2, H3. Mais sans doute également aux différentes zones d’une même page, ce qui apparaîtra plus clairement lorsque l’algorithme sera complètement effectif.

 

 

Proposer un projet au freelance spécialisé en SEO

Pour compléter votre information, cherchez d'autres conseils sur le site de l'expert seo :
0 Commentaire

Un commentaire, une question ?
Tous les champs sont obligatoires