Dés-indexer pour mieux dés-optimiser

Parce que parfois une image vaut mieux qu'un long discours, voici encore la preuve d'un dysfonctionnement du moteur de recherche Google, qui mélange tout et ne sait plus retrouver son index.

La capture d'écran ci-dessous date du 29.05.2019.

site desoptimisation serps, mai 2019

Légende : Commande site:desoptimisation.com pour voir combien de pages de ce site sont (des)indexées par Google.

La page de résultat du moteur de recherche indique "environ 46 résultats (0,35 secondes)".

Or en voit clairement la pagination en pied de page, indiquant 1 et 2.

Pas besoin d'être prix Nobel en mathématiques pour savoir que Google affiche 10 résultats par page, et donc qu'ici les informations sont contradictoires : 46 résultats pour Desoptimisation.com pour 20 résultats au maximum...

commande site google, mai 2019

Légende : page 2 des serps Google.fr pour la commande site:desoptimisation.com

Effectivement, il n'y a même pas 10 résultats sur la 2ème page de Google. Seulement 8.

Il arrive souvent qu'il y ait une différence (majoritairement proportionnelle au nombre de pages d'un site) entre le nombre de résultats affichés en haut de première page et la réalité, lorsqu'on parcourt toute la pagination.

 

Là où la situation est cocasse, c'est en analysant les faits côté webmaster : ce blog comporte actuellement 18 billets. Et quelques pages ("contact", "on parle de nous", "charte éditoriale"..). Si on compte les résultats de type "bruit" voire "parasites" (la fameuse pagination en fonction du nombre de billets qu'on veut voir apparaître sur une page), on peut dénombrer 25 URL au total. Il n'y a pas eu de suppression de page, d'articles ou de quoi que ce soit.

Donc : d'où peuvent bien provenir les 46 résultats affichés ?

Desindexation de pages fantômes

Ainsi donc, pour ce site, Google a désindexé 21 pages qui n'ont jamais existé.

Ca pourrait prêter à rire, si ce n'était que dans les 18 résultats issus de son index, Google préfère des pages mineures ou sans importance (pagination, pages avec peu de contenu) aux billets de blog comme celui-ci.

En tout état de cause, voilà une forme de désoptimisation avec laquelle il faudra composer dorénavant...

Autres cas de désindexation de page

Je parle bien de désindexation, c'est à dire de la disparition d'une URL de l'index d'un moteur de recherche. Il faut donc que cette URL ait au préalable été indexée ! Cela exclue donc de facto les pages :

  • qui ne passent pas les critères de crawl
  • qui ont été supprimées
  • désavouées
  • redirigées
  • bloquées par le fichier robots.txt
  • etc

Les pages en ligne et "normales" peuvent être désindexées dans les cas suivants :

  1. Une page qui a été indexée mais qui ne comportait peu voire aucun lien externe pointant vers elle : "avec le temps va, tout s'en va" comme le chantait Leo Ferrer... La page, relativement isolée, n'est plus gardée.
  2. Une page qui a été indexée mais qui a été dénoncée (contenu jugé offensant, non respect des copyrights etc)
  3. Une page qui a été indexée, qui ne présente rien de spécial, mais dont justement le contenu ressemble trop à tout ce qu'il y a ailleurs sur le web : d'abord jugée intéressante, elle ne l'est plus...
  4. Une page qui a été indexée, mais qui ne l'est plus à cause du bug de Google !