2. L’idée de la compréhension sémantique par le moteur de recherche

Dans cette seconde partie, l’enjeu est de comprendre comment fait un moteur de recherche moderne pour “comprendre” un texte issu du web.
Vous verrez que c’est intuitivement facile, et déjà vous allez imaginer ce qu’on peut faire pour “aider” le moteur à mieux comprendre vos écrits.

Table des matières

1.Pourquoi utiliser un outil d’aide à la rédaction web ?
2. L’idée de la compréhension sémantique par le moteur
3. Comment fonctionne yourtext.guru ?
4. Qu’est-ce que le guide premium et l’outil d’analyse de l’optimisation sémantique ?
5. Pourquoi et comment se comparer à la concurrence ?
6. BONUS : Comment fabriquer un cocon sémantique avec yourtext.guru ?

Un moteur de recherche, c’est un site qui doit renvoyer des résultats pertinents par rapport à un besoin informationnel exprimé par un internaute à travers sa requête.

C’est la définition facile.

Mais un moteur de recherche c’est aussi et surtout une énorme machine à classer des pages. En effet, un moteur c’est d’abord de beaux scripts de parcours du web. En passant de pages en pages, ces scripts récupèrent les contenus pour qualifier les pages.

Et une bonne façon de qualifier des contenus pour ensuite pouvoir les comparer, c’est de les transformer tous en une structure identique. Et seuls des “poids” différents sur la structure constitueront les différence entre les textes.

Prenons un exemple.

J’ai deux pages qui parlent du “secret de la cuisson des pâtes”. Nous allons toutes les transformer en un “vecteur”. C’est à dire très prosaïquement en un tableau. Les entêtes du tableau seront les mots que l’on trouve sur le web, et le corps du tableau sera le poids des termes dans le document concerné. Je n’affiche pas tous les mots existants, mais l’idée est là.

Document A
cuisson : 0,1
pâte : 0,23
secret : 0,004

Document B
cuisson : 0,15
pâte : 0,44
secret : 0.9

Je peux ensuite tracer les deux documents dans un espace en trois dimensions (chaque axe sera un mot).
Quand un interne tape la requête “secret de la cuisson des pâtes” dans le moteur de recherche, je transforme la requête en vecteur.

Requête
cuisson : 0,15
pâte : 0,42
secret : 0.76

J’ajoute ce vecteur à l’espace. Je procède ensuite à une projection de l’espace vers un espace en deux dimensions, de la même manière que l’on transforme un globe terrestre en carte plate.

Dès lors, si je me demande de quel document la requête est la plus semblable, c’est à dire la plus pertinent, la réponse est facile à donner : ce sera le document le plus proche géométriquement.

En tant que moteur, en réalité, l’espace n’est pas en trois dimensions, mais en autant de dimensions que de mots existants. Et je ne possède pas qu’un ou deux documents mais des milliers de milliards certainement. Mais ça ne change rien à l’idée qui gouverne.

La pertinence c’est la similarité

Les pages en bleu sont donc les pages qui apparaissent dans les serps. Ce sont des pages qui sont assez semblables entre elles car elles ont des poids à peu près similaires. En récupérant les contenus classés dans le moteur de recherche, je vais pouvoir découvrir les termes qui leur permettent d’être similaires.
Utiliser un outil d’aide à la rédaction est donc indispensable pour comprendre les points communs entre les pages renvoyées par les serps.

Le besoin informationnel capté

Ce n’est pas tout ! Un moteur de recherche c’est beaucoup d’algorithmes. Ce qui définit un bon algorithme c’est qu’il donne de bons résultats.

Mais des bons résultats, qu’est-ce que c’est ? Ce sont des serps dont les utilisateurs sont contents. En évaluant leurs appréciations, on peut se rendre compte facilement si telle ou telle page est bien classée ou non. Et dans ce cas là on peut… estimer que le besoin informationnel est mal exprimé par la requête. On corrige le tir en déplaçant le point d’arrivé de la requête dans l’espace vectoriel.

En tant qu’humain ce nouveau vecteur n’est pas évaluable. Il n’y a qu’en utilisant un outil d’aide à la rédaction qui va faire du retro-engineering que l’on peut le connaître implicitement, et donc le prendre en compte dans la rédaction.

Nous allons maintenant découvrir Comment fonctionne yourtext.guru