John Mueller de Google a répondu à une question sur LinkedIn sur la façon dont Google choisit les canoniques, offrant des conseils sur ce que les référenceurs et les éditeurs peuvent faire pour encourager Google à choisir la bonne URL.
Qu’est-ce qu’une URL canonique ?
Dans le cas où plusieurs URL (les adresses de plusieurs pages Web) ont le même contenu, Google choisira une URL qui sera représentative de toutes les pages. La page choisie est appelée URL canonique.
Google Search Central a publié une documentation expliquant comment les référenceurs et les éditeurs peuvent communiquer leur préférence quant à l’URL à utiliser. Aucune de ces méthodes n’oblige Google à choisir l’URL préférée, elles servent principalement d’indice fort.
Il existe trois manières d’indiquer l’URL canonique :
Redirection des pages en double vers l’URL préférée (un signal fort) Utilisez l’attribut de lien rel=canonical pour spécifier l’URL préférée (un signal fort) Répertoriez l’URL préférée dans le plan du site (un signal faible)
Certains des Google documentation de canonisation fait référence à tort au rel=canonical en tant qu’élément de lien. La balise de lien, , est l’élément. Le rel=canonical est un attribut de l’élément link. Google appelle également rel=canonical une annotation, qui pourrait être une manière interne pour Google d’y faire référence, mais ce n’est pas la bonne façon de faire référence à rel=canonical (c’est un attribut HTML de l’élément de lien).
Il y a deux choses importantes que vous devez savoir sur les éléments et attributs HTML :
Les éléments HTML sont les éléments constitutifs de la création d’une page Web. Un attribut HTML est quelque chose qui ajoute plus d’informations sur ce bloc de construction (l’élément HTML).
La documentation HTML de Mozilla Developer Network (une source faisant autorité pour les spécifications HTML) note que «lien” est un élément HTML et que “rel =” est un attribut de l’élément link.
La personne a lu le manuel mais a encore des questions
La personne lisant la documentation de Google qui répertorie les trois façons ci-dessus de spécifier un canonique avait encore des questions, alors il les a posées sur LinkedIn.
Il a appelé la documentation « doc » dans sa question :
« Le document mentionné suggère plusieurs façons de spécifier une URL canonique.
1. Ajout d’une balise dans
section de la page, et une autre, 2. Via le plan du site, etc.
Donc, si l’on considère uniquement le point 2 de ce qui précède.
Ce qui signifie que le plan du site : techniquement, il contient tous les liens canoniques d’un site Web.
Alors pourquoi, dans certains cas, quelques URL du plan du site renvoient : “Dupliquer sans canonique sélectionné par l’utilisateur”. ?”
Comme je l’ai souligné plus haut, la documentation de Google indique que le plan du site est un signal faible.
Google utilise plus de signaux pour la canonisation
La réponse de John Mueller révèle que Google utilise plus de facteurs ou de signaux que ce qui est officiellement documenté.
Il a expliqué :
“Si les systèmes de Google peuvent déterminer que les pages sont suffisamment similaires pour que l’on puisse se concentrer sur l’une d’entre elles, alors nous utilisons les facteurs répertoriés dans ce document (et plus encore) pour essayer de déterminer sur laquelle nous concentrer.”
Les liens internes sont un facteur canonique
Mueller a ensuite expliqué que les liens internes peuvent être utilisés pour donner à Google un signal fort indiquant quelle URL est la préférée.
Voici comment Mueller a répondu :
« Si vous avez une forte préférence, il est préférable de rendre cette préférence très évidente, en vous assurant que tout sur votre site exprime cette préférence – y compris le lien-rel-canonique dans l’en-tête, les plans du site, les liens internes, etc. »
Il a ensuite enchaîné avec :
« Lorsqu’il s’agit de recherche, la page sur laquelle les systèmes de Google se concentrent n’a pas beaucoup d’importance, elles s’afficheront toutes de la même manière dans la recherche. L’URL exacte affichée dépend principalement de l’utilisateur (qui pourrait la voir) et du propriétaire du site (qui pourrait vouloir surveiller et suivre cette URL).
Points à retenir
D’après mon expérience, il n’est pas rare qu’un grand site Web contienne d’anciens liens internes pointant vers la mauvaise URL. Parfois, ce ne sont pas d’anciens liens internes qui en sont la cause, ce sont des redirections 301 d’une ancienne page vers une autre URL qui n’est pas la canonique préférée. Cela peut également amener Google à choisir une URL qui n’est pas préférée par l’éditeur.
Si Google choisit la mauvaise URL, il peut être utile d’explorer l’intégralité du site (comme avec Screaming Frog), puis d’examiner les modèles de liens internes ainsi que les redirections, car il se peut très bien que des liens internes oubliés soient cachés au plus profond du site Web. ou des redirections enchaînées vers la mauvaise URL amènent Google à choisir la mauvaise URL.
La documentation de Google indique également que les liens externes vers la mauvaise page pourraient influencer la page que Google choisit comme canonique. C’est donc une chose supplémentaire qui doit être vérifiée pour déboguer la raison pour laquelle la mauvaise URL est classée.
Le point important à retenir ici est que si les méthodes standard de spécification du canonique ne fonctionnent pas, il est possible qu’il existe des liens externes, ou des liens internes involontaires, ou une redirection oubliée qui amène Google à choisir la mauvaise URL. Ou, comme l’a suggéré John Mueller, augmenter le nombre de liens internes vers l’URL préférée peut aider Google à choisir l’URL préférée.
Lisez la discussion sur LinkedIn ici :
Ma question – La documentation mentionnée suggère plusieurs façons de spécifier une URL canonique
Image en vedette par Shutterstock/Cast Of Thousands