Ne pas suroptimiser ses textes

Ah oui, car les articles sur l'art de l'optimisation textuelle pleuvent en ce moment sur la blogosphère liée au référencement. On peut lire un peu partout qu'il faut enrichir ses écrits avec du vocabulaire proche et des synonymes. La vulgarisation de formations données depuis un an ou deux ne souffre pas beaucoup la comparaison avec la finesse d'analyse d'origine. Là où on parle de cocon sémantique, certains billets de rédacteurs n'ayant manifestement pas suivi la formation mais simplement lu ici ou là quelque compte-rendu plus ou moins laudatif (souvent plus que moins, ça fait toujours espérer quelques RT et autres relais par les formateurs portés aux nues) finissent par donner dans le cliché en essayant d'expliquer qu'il faut optimiser son maillage interne comme une coquille d'escargot. Du cocon à la coquille, le glissement sémantique est lui aussi de taille...

Si on tente d'appliquer à la lettre près les bons conseils prodigués dans ces tutoriels, on en vient à recopier l'intégralité du Petit Robert dans un article de 350 mots. Le tout avec des liens génériques en masse vers d'autres pages internes du site. Le genre d'article truffé de "cliquer ici", "lire l'article", "en savoir plus" qui envoient vers des billets antérieurs. Lesquels avaient systématiquement 1 lien vers Wikipedia en plus de 2 liens vers un moneysite, le tout sans aucune relation inter-articles, ni d'ailleurs aucun point commun thématique...

Dictionnaires et duplicate content

Du coup, chaque nouvel article de ceux qui ont tout bien compris le référencement sémantique se veut être une référence. Tous les aspects doivent être couverts. Tous les mots utilisés. Un peu comme avant, en fait. Quand les mauvais référenceurs inséraient dix liens par paragraphe. Sauf que maintenant c'est plus dur, il faut ouvrir le dico ou aller chercher des synonymes en ligne sur des sites qui scrappent les bases de données - par ailleurs déjà bien pillées par tous les spammeurs industriels du monde entier. Larousse, Littré,

My syntax is rich

So what ? Les plus malins creusent un peu plus profond, dans le web invisible, et en rapportent parfois de gros mots bien spécialisés. Le genre de vocabulaire utilisé uniquement par des experts, qui n'en découvrent l'existence et le sens qu'au bout de longues années d'études.

Et du coup, fiers de leur trouvaille linguistique, ils saupoudrent leurs articles - par ailleurs aussi plats et intéressants qu'un encéphalogramme de gallinacée ayant trouvé un couteau (ce qui représente toutefois un pic d'activité) - d'un jargon professionnel qui est alors aussi incongru et décelable qu'un panda sur la banquise à côté d'un penguin. Pour sûr, ces auteurs-là n'ont pas suivi la formation SEO + moteurs des Frères Peyronnet. Parce que sinon, après avoir clamé haut et fort que "Frères Peyronnet m'a tué" ils comprendraient bien vite leur erreur, à associer et empiler au sein d'un même document des termes rares. Trop élitistes pour être plausibles dans une page de type publi-reportage ou guest-blogging, au sein d'un site dont la grille de lecture se qualifie souvent au niveau d'entrée d'enseignement secondaire.

Désoptimiser l'écrit

Donc on en revient aux bases : adapter son contenu à la cible visée. Inutile de chercher à noyer le lecteur sous une tonne de vocabulaire. Le raz-de-marée lexical peut en effet vite se transformer en ras-le-bol. Et pourtant, les blogueurs qui préconisent l'optimisation syntaxique sont ceux qui prônent par ailleurs le respect de l'utilisateur, plutôt que le robot de Google (je choisis le moteur de recherche de Mountain View parce que jusqu'à maintenant c'est le plus efficace à qualifier et thématiser des contenus d'après les mots utilisés).

En fait, les conseils sur l'enrichissement sémantique des écrits qu'on voit fleurir sur le web sont à bien des égards comparables au fantasme lié à des procédés comme le spinning. De base, le postulat du texte spinné repose sur la création automatique de rédactionnels grâce {au remplacement|à la substitution} de mots, dans la phrase mais aussi dans le paragraphe. Plus élaboré au fil des années, il est aujourd'hui érigé en méthode qui permet de générer des écrits présentant non seulement des n-grams différents, mais également des structures complètes présentant des différences syntaxiques : ordre des phonèmes, longueur de phrases, conjugaison... Il devient alors difficile pour un algorithme de déceler l'automatisation via les méthodes d'investigation les moins coûteuses, comme le calcul de distance.

Alors qu'un bon masterspin passe les filtres des classificateurs, une optimisation grossière des contenus comme je viens de vous l'expliquer renvoie un signal d'alerte flagrant. Du coup, il devient urgent (pour ceux qui suivent l'actualité du référencement) de ne pas tomber dans le piège. Laissez donc le travail de rédaction aux professionnels qui maîtrisent leur sujet plutôt que d'essayer d'étaler un vernis de connaissance qui ne trompera ni le lecteur, ni le moteur !