Yourtext.guru est un outil d’aide à la rédaction. En tant que tel il fournit des guides indiquant quels mots il faut utiliser dans un texte pour ne pas laisser de doute au moteur de recherche sur la qualité d’un contenu. Mais comment arrivons-nous à générer des guides, quelle est notre méthodologie ?
Yourtext.guru est un outil au fonctionnement simple : nous faisons en sorte de déconstruire efficacement les SERPs afin de générer des guides efficaces, en ayant en tête les algorithmes et les principes de fonctionnement des moteurs de recherche dont nous avons parlé auparavant.
L’internaute demande un guide dans yourtext.guru
Récupération des SERPs
Nous récupérons les résultats d’un moteur de recherche pour la requête entrée par l’internaute, et nous crawlons ensuite une sélection des pages indiquées. Oui, nous récupérons les contenus depuis les sites web. Pas pour les stocker, mais pour faire des statistiques et ainsi décider, grâce à un algorithme particulier, quels sont les termes qui sont important par rapport à la requête de l’internaute. Pour les plus curieux, il y a deux choses importantes :
nous faisons un équivalent des vecteurs de contexte, calculés de façon précise ;
nous utilisons un corpus différentiel. Prenons un exemple concret : un mot apparait dans toutes les pages qui sont désignées par la serp. Que doit-on faire ? Considérer que le mot est important ? Pas forcément ! Si ce mot est aussi omniprésent en général sur le web, c’est en réalité un mot très commun qui n’apporte rien pour la requête. Au contraire, si le mot est rare sur le reste du web, c’est important de se rendre compte qu’il est très présent sur les pages qui sont “bien vues” par le moteur de recherche.
Dans cette seconde partie, l’enjeu est de comprendre comment fait un moteur de recherche moderne pour “comprendre” un texte issu du web. Vous verrez que c’est intuitivement facile, et déjà vous allez imaginer ce qu’on peut faire pour “aider” le moteur à mieux comprendre vos écrits.
Un moteur de recherche, c’est un site qui doit renvoyer des résultats pertinents par rapport à un besoin informationnel exprimé par un internaute à travers sa requête.
C’est la définition facile.
Mais un moteur de recherche c’est aussi et surtout une énorme machine à classer des pages. En effet, un moteur c’est d’abord de beaux scripts de parcours du web. En passant de pages en pages, ces scripts récupèrent les contenus pour qualifier les pages.
Et une bonne façon de qualifier des contenus pour ensuite pouvoir les comparer, c’est de les transformer tous en une structure identique. Et seuls des “poids” différents sur la structure constitueront les différence entre les textes.
Prenons un exemple.
J’ai deux pages qui parlent du “secret de la cuisson des pâtes”. Nous allons toutes les transformer en un “vecteur”. C’est à dire très prosaïquement en un tableau. Les entêtes du tableau seront les mots que l’on trouve sur le web, et le corps du tableau sera le poids des termes dans le document concerné. Je n’affiche pas tous les mots existants, mais l’idée est là.
Je peux ensuite tracer les deux documents dans un espace en trois dimensions (chaque axe sera un mot). Quand un interne tape la requête “secret de la cuisson des pâtes” dans le moteur de recherche, je transforme la requête en vecteur.
Requête cuisson : 0,15 pâte : 0,42 secret : 0.76
J’ajoute ce vecteur à l’espace. Je procède ensuite à une projection de l’espace vers un espace en deux dimensions, de la même manière que l’on transforme un globe terrestre en carte plate.
Dès lors, si je me demande de quel document la requête est la plus semblable, c’est à dire la plus pertinent, la réponse est facile à donner : ce sera le document le plus proche géométriquement.
En tant que moteur, en réalité, l’espace n’est pas en trois dimensions, mais en autant de dimensions que de mots existants. Et je ne possède pas qu’un ou deux documents mais des milliers de milliards certainement. Mais ça ne change rien à l’idée qui gouverne.
La pertinence c’est la similarité
Les pages en bleu sont donc les pages qui apparaissent dans les serps. Ce sont des pages qui sont assez semblables entre elles car elles ont des poids à peu près similaires. En récupérant les contenus classés dans le moteur de recherche, je vais pouvoir découvrir les termes qui leur permettent d’être similaires. Utiliser un outil d’aide à la rédaction est donc indispensable pour comprendre les points communs entre les pages renvoyées par les serps.
Le besoin informationnel capté
Ce n’est pas tout ! Un moteur de recherche c’est beaucoup d’algorithmes. Ce qui définit un bon algorithme c’est qu’il donne de bons résultats.
Mais des bons résultats, qu’est-ce que c’est ? Ce sont des serps dont les utilisateurs sont contents. En évaluant leurs appréciations, on peut se rendre compte facilement si telle ou telle page est bien classée ou non. Et dans ce cas là on peut… estimer que le besoin informationnel est mal exprimé par la requête. On corrige le tir en déplaçant le point d’arrivé de la requête dans l’espace vectoriel.
En tant qu’humain ce nouveau vecteur n’est pas évaluable. Il n’y a qu’en utilisant un outil d’aide à la rédaction qui va faire du retro-engineering que l’on peut le connaître implicitement, et donc le prendre en compte dans la rédaction.
Dans cette première partie, nous aborderons les motivations qui poussent à utiliser un outil d’aide à la rédaction tel que yourtext.guru. Il y a plusieurs très bonnes raisons.
La première raison, la plus évidente, d’utiliser un outil d’aide à la rédaction c’est le gain de temps. Le guide fournit des listes de mots important pour votre sujet de rédaction. Dès lors cela évite d’oublier une partie essentiel du sujet, voire même cela permet de découvrir des choses qu’on n’avait pas anticipées.
Bien entendu, si l’on souhaite faire un article de très grande qualité, cela n’évite pas de faire de la recherche documentaire. Mais quand on a clés en mains une liste des termes importants, élargir les connaissances devient beaucoup plus rapide et aisé.
Bien se faire comprendre du moteur de recherche
Sur le web, pour faire connaître une page web, un site, il existe plusieurs façons de faire. On peut payer de la publicité, faire des newsletter, partager sur des forums… mais la façon généralement la plus rentable consiste à avoir un bon référencement. C’est à dire qu’une page qui ressort bien classées sur une page de résultat de moteur de recherche à toutes les chances d’obtenir beaucoup de trafic. Pour parvenir à bien positionner une page web, le processus est parfois complexe, (c’est un métier à part entière) mais se résume principalement à agir sur trois catégories de critères :
n’avoir aucune problématique technique : tout est d’équerre sur le site ;
obtenir de la popularité (que d’autres sites que le vôtre fassent des liens vers vous) ;
présenter un contenu qui correspond au besoin informationnel de l’internaute faisant une recherche dans un moteur.
La partie sur laquelle yourtext.guru peut vous aider, en tant qu’outil d’aide à la rédaction web, c’est la troisième bien entendu.
YTG (yourtext.guru) va guider le rédacteur afin de l’amener à couvrir suffisamment le besoin informationnel de l’internaute.Il faut utiliser les bons termes, ceux que le moteur de recherche va considérer comme qualitatifs. Mais pour pouvoir faire une bonne recommandation, il faut connaître quelques principes de fonctionnement des moteurs.
En tant que créateurs de l’outil d’aide à la rédaction yourtext.guru, son utilisation nous semble assez balisée. Cependant, c’est loin d’être le cas pour tout le monde, puisque l’outil, vu de l’extérieur, peut sembler être une boite noire.
Il n’en est rien.
Vous êtes certainement un client ou un futur client. Nous aimerions vous emmener dans ce voyage documentaire qui va vous révéler en quelques billets comment fonctionne yourtext.guru et comment nous pensons qu’il doit être utilisé pour obtenir les meilleurs résultats.
Comme beaucoup d’outils, on peut l’utiliser de façon classique, mais on peut aussi parfois trouver des usages détournés, et généralement cela est rendu possible car la compréhension de l’outil devient à un moment si grande qu’on imagine de nouvelles formes d’utilisation (dans le 7e billet, je présenterai une utilisation pour fabriquer un cocon sémantique).
Sans plus attendre, voici la porte vers des contenus que nous espérons assez clairs et pédagogiques. Vous avez peut-être déjà un abonnement illimité yourtext.guru ou des jetons et vous utilisez peut-être déjà l’outil depuis longtemps… mais un éclairage nouveau pourrait vous permettre d’en tirer encore plus !
Voici le programme détaillé de ce que vous pourrez apprendre ici :
Si vous utilisez activement l’outil de vérification de yourtext.guru, vous avez du apercevoir que deux scores y étaient récemment apparus (depuis le week-end du 20 mai 2018).
Nous avons effectivement remplacé l’ancien score d’optimisation par deux nouveaux scores, de façon à rendre mieux compte du niveau d’optimisation seo tout en donnant une information de dangerosité plus évidente à appréhender.
une courbe indiquant le niveau d’optimisation terme à terme pour les 50 termes considérés comme les plus importants. Cette courbe n’a subi aucun changement, vous pouvez continuer à l’utiliser comme auparavant.
un score d’optimisation seo (soseo) : c’est une valeur située dans une fourchette de 0% à 300%. 0% indique que les optimisations sont pour le moins inexistantes. 100% indique que le texte est déjà bien optimisé, mais globalement respectueux. Au dessus de 100%, on a des textes qui poussent l’optimisation encore plus loin. Nous avons posé une limite à 300% car si l’on peut toujours pousser davantage un texte sur son aspect seo, il faut surtout garder en tête le danger d’en faire trop (keyword stuffing mon ami).
un score de danger seo (dseo) : c’est une valeur située en 0% et 200%. Plus elle est élevée, plus on considère que le texte risque d’être vu comme un texte spammy.
Quelles sont les valeurs idéales à atteindre ?
Il n’y a pas de valeurs idéales à atteindre. En effet, ce que l’on cherche s’est à améliorer son classement. On veut donc être devant quelqu’un d’autre. Il faut alors étudier le niveau d’optimisation des concurrents, et en déduire les valeurs qu’il vous faut pour être devant. Si le concurrent principal a un soseo de 10% et un dseo de 0%, peut-être qu’avec une très légère optimisation (20% ?) vous aurez une bonne efficacité. Mais si tous les concurrents de la serps sont à 10% et que vous optimisez votre texte à 150%, que risque-t-il de se passer ?
Ainsi, en fonction des requêtes, il est avisé de ne pas cibler toujours les mêmes valeurs de soseo et de dseo.
De même, l’optimisation sémantique, si on sait que c’est un critère influent, n’est pas le seul critère lié au classement. Si les concurrents ont des optimisations sémantiques faibles mais de gros backlinks, il faudra s’adapter :
vous avez aussi de gros backlinks ? Essayez de les battre sur la sémantique, faites mieux qu’eux, simplement.
vous avez de petits backlinks ? Faites de l’acquisition de liens en priorité (la force de la popularité est pour beaucoup de requêtes bien plus importante que la force de la sémantique). Ou alors, essayez de pousser largement plus l’aspect sémantique que les concurrents. Peut-être arriverez-vous à contrebalancer en étant plus complet, plus raffiné, plus optimisé ?
Des exemples valent mieux que de longs discours
Voici quelques exemples d’optimisations vus par l’outil d’analyse de l’optimisation seo de yourtext.guru.
C’est royal !
Voici un premier exemple, assez typique de ce que l’on peut trouver dans la presse : les mots importants sont plutôt bien couverts, sans optimisation forcenée pour chaque mot indépendamment. La courbe est décroissante car le coeur de l’information est plus couverte que les parties annexes (les mots les plus à gauche de la courbe sont les plus importants pour la requête. Plus on va sur la droite, moins les mots ont d’importance pour l’optimisation seo).
Il n’y a pas de danger particulier (dseo faible), et l’optimisation est plutôt bonne.
Quand on optimise
Là, on est sur un cas de figure où l’on sent bien qu’un·e professionnel·le est passé·e dans le coin pour optimiser le contenu. Les 50 mots les plus importants pour la requête sont présents sur la page. Ils sont globalement tous poussés assez fortement. L’optimisation SEO est haute (147%) et le danger seo bien que réel est managé de façon réfléchie en évitant de monter trop souvent les termes dans les zones rouges.
Pour une requête un peu concurrentielle, sur laquelle on ne peut pas espérer se positionner sans prendre quelques risques, cela peut avoir de l’effet.
Ce qu’on trouve (trop) souvent Maintenant, on est sur du texte peu travaillé en terme de seo. C’est le cas typique de l’article d’actualité qui a du paraître rapidement et dans lequel le nombre de mots est réduit ainsi que la portée de l’information ou la mise en perspective.
On a peu à attendre d’un tel contenu en terme seo à moins que la concurrence soit du même acabit. Pourtant, dans cette exemple, c’est une page qui se classe plutôt bien… grâce à un site qui possède des backlinks qui en rendraient beaucoup jaloux.
33% en soseo ce n’est pas non plus honteux, mais il manque tellement de vocabulaire utile qu’on pourrait placer sans augmenter énormément le dseo que c’est dommage de ne pas en avoir fait plus.
Rappelez-moi pourquoi vous n’avez pas conservé l’ancien score ?
L’idée du score est de proposer un indicateur qui résume la courbe d’optimisation terme à terme. Car bien sûr, si vous pouvez choisir, mieux vaut regarder la courbe qui en dira toujours plus long que le score.
Mais il existe des cas où l’on a besoin de comparer de nombreux textes ou d’avoir un aperçu très rapide de l’optimisation seo. Et dans ces cas là, le score est très utile.
Mais l’ancien score avait le gros, l’énorme défaut d’être sans limite. C’est à dire qu’en ajoutant de plus en plus un terme à un même texte, le score montait. L’optimisation seo pouvait paraître extrêmement forte alors qu’il n’y avait qu’un seul mot répété pour tout texte. De plus, en faisant ainsi, on était largement dans la suroptimisation, chose que l’on ne pouvait voir que grâce au graphe.
Dès lors, l’ancien score n’était pas très praticable, sauf pour ceux qui gardaient aussi la courbe sous les yeux.
Avoir une limite haute et séparer l’optimisation seo du danger seo était donc indispensable et urgent.