Méthode d'optimisation sémantique on-page
![]() |
Méthode pour optimiser une page sémantiquement |
Cet article présente une liste de techniques d’optimisations on-page seo issus de brevets, de rapports, d’observations de
nombreux marketers et d’études rigoureuses permettant de mieux définir
le contenu sémantique d’une page et d’envoyer de meilleurs signaux aux
moteurs pour accroître le référencement et le classement des pages d’un
site sur les requêtes visées. Ce dossier s’appuie également sur les
nombreuses études et recherches effectuées par Bill Slawski, chercheur
et expert en moteurs de recherche, langage naturel, et responsable du
site seobythesea .
On
ne le répétera jamais assez, il faut aider les moteurs à comprendre
votre contenu, et pour cela, vous devez leur donner plusieurs indices
qui leur permettront de classer votre site dans une catégorie de leur
index, un corpus bien défini.
Je
précise que cet article n’est pas une traduction, même s’il reprend en
grande partie les points du dossier de Cyrus Shepard, il représente
plutôt une synthèse des méthodes énoncées, enrichie de mon avis sur le
sujet.
L'optimisation sémantique d'une page
L'utilisation des mots-clés
La méthode ancestrale consistant à rechercher les mots-clés associés à un contenu et à les parsemer dans les balises title, entêtes (titres), alt, et le contenu textuel, est toujours d’actualité et joue encore un rôle essentiel dans l’interprétation du contenu d’une page, aidant ainsi les moteurs à mieux identifier les pages. Mais nous allons voir qu’elle connaît ses limites et qu’elle nécessite d’être enrichie de techniques complémentaires.
Votre
contenu fait référence à un sujet en particulier. Vous aidez les
moteurs de recherche à comprendre le thème de votre page en alimentant,
avec vos mots-clés, le title, les titres, les attributs ALT et les
textes contenus dans le corps de vos pages.
Le TF-IDF
Le TF-IDF
(Term Frequency – Inverse Document Frequency) est une méthode de calcul
destinée à évaluer l’importance d’un mot-clé dans une page, par rapport
à un nombre de documents pour un corpus donné. Cette méthode pertinente
est souvent utilisée dans les algorithmes des moteurs de recherche pour
afficher leurs résultats dont celui de Google.
La formule savante définissant le TF-IDF est la suivante :
P(i,j) = TF(i,j) x log (N / DF(i) )
TF(i,j) est la fréquence d’apparition du terme i dans le document j
DF(i) est le nombre de documents contenant i
N est le nombre de documents dans le corpus
A titre indicatif :
- Un mot très fréquent dans un texte et présent dans beaucoup de documents aura un TF-IDF <= 1
- Un mot peu fréquent dans un texte et présent dans peu de documents aura un TF-IDF > 1
Ce
qui voudrait dire qu’un terme prend plus d’importance lorsqu’il est
moins présent sur une page mais également sur l’ensemble des pages du
corpus (TF-IDF élevé).
Prenons l’exemple du mot-clé « médecine »
dont le nombre de résultats dans les serp est de 1 400 000 et du
mot-clé « ophtalmologie, qui lui, obtient un nombre de résultats de
1 170 000. Le terme « ophtalmologie » est beaucoup plus judicieux que le terme « médecine », du fait d’un TF-IDF plus élevé.
Mais
le TF-IDF n’est qu’une composante parmi tant d’autres de l’ensemble des
facteurs d’optimisation on-page et ne peut en aucun cas être considéré
comme le seul critère déterminant de l’optimisation d’un contenu.
L’indice
TF-IDF est une base pour beaucoup de moteurs de recherche et permet
d’évaluer l’importance d’un mot-clé dans une page, par rapport à la
fréquence d’apparition du terme dans un ensemble de documents d’un
corpus donné.
Synonymes et variantes proches
Lorsque
l’on créée un contenu, on a souvent la mauvaise habitude de l’associer
systématiquement à un mot-clé en particulier. Hors ce qui était valable
avant, ne l’est plus maintenant et on oublie bien souvent que les
internautes n’accèderont pas à la source d’informations de la manière
qu’on l’aurait imaginé.
C’est ce que Google a tenté d’améliorer dans ses algorithmes avec Hummingbird
en allant matcher les synonymes et mots proches d’une requête dans ses
immenses bases de corpus. D’après une étude de Bill Slawski,
l’algorithme Hummingbird se servirait des co-occurrences pour identifier les synonymes pour les substituer dans une requête.
Par exemple, utiliser les expressions :
« Recettes
culinaires », « recettes gourmandes », « bonnes recettes de cuisines »,
« recettes gastronomiques », recettes de cuisine simples », « recettes
pour cuisiner », « fiches de recettes de cuisine », « recettes pour
tous », « recettes de plats cuisinés »
Sera plus pertinent et plus productif que de répéter abondamment, dans un contenu, l’expression « recette de cuisine ».
La
recherche de synonymes et de termes proches par rapport à une requête
est très bénéfique pour votre contenu sémantique car elle permet une
meilleure compréhension de la page par les moteurs de recherche.
La segmentation des pages
L’idée
de croire qu’un mot-clé ou une expression se suffit à elle-même dans
une page est totalement fausse avec la progression du web sémantique.
Bien au contraire, le sens et la signification d’une expression seront
renforcés par le contexte sémantique qui l’entoure.
C’est
pourquoi, les mots prendront tout leur sens si on les utilise en
majeure partie dans le corps d’une page contrairement aux entêtes, pieds
de page et menus de côté beaucoup moins valorisants.
Les
expressions et les mots-clés ont beaucoup plus de poids dans les
sections dédiés au contenu plutôt que dans les parties header, footer et
sidebar.

Méthode d'optimisation sémantique on-page
Informations pour intégrer l'infographie sur votre site
Image source à télécharger : http://www.pinterest.com/pin/381257924679016449/
Lien associé à ajouter : http://www.pole-position-seo.com//2014/10/web-semantique-methodes-avancees-d-optimisation-on-page.html
Distance sémantique et relations entre les termes
![]() |
Méthode d'optimisation sémantique on-page |
Informations pour intégrer l'infographie sur votre site
Image source à télécharger : http://www.pinterest.com/pin/381257924679016449/
Lien associé à ajouter : http://www.pole-position-seo.com//2014/10/web-semantique-methodes-avancees-d-optimisation-on-page.html
Distance sémantique et relations entre les termes
Un
concept également très important pris en compte par les moteurs de
recherche, est celui de la distance sémantique et les relations entre
plusieurs termes au sein d’une même page. Placer un terme dans un
paragraphe et ce même terme dans 2 paragraphes plus loin n’aura pas le
même poids pour les moteurs. Afin de capitaliser toute la puissance
sémantique d’un terme, il est indispensable de placer ses occurrences en
fonction des balises HTLM d’un contenu.
Les
termes placés dans un même paragraphe ou une même liste, auront un
poids sémantique plus élevé. De même que tous les termes présents dans
le titre et l’entête du document seront considérés comme très proches de
tous les autres termes.
Co-occurrence et indexation syntagmique
L’avancée
des algorithmes des moteurs de recherche est telle que ceux-ci sont
dorénavant capables d’associer des phrases (ou des syntagmes)
co-occurentes entre elles, consolidant un peu plus la pertinence d’un
contenu. Cette méthode peut être approfondie en intégrant, dans votre
contenu, des liens entrants sur différentes expressions co-occurentes.
Une
technique bien utile qui permet de ne plus laisser d’ambiguïté au
moteur sur la qualité de votre contenu lors de l’indexation de la page
dans le corpus correspondant.
Par exemple les groupes de mots :
« Joanne
Kathleen Rowling », « Daniel Radcliff », « Emma Watson »,
« Dumbledore », « Les reliques de la mort », « les moldus »,
« Azkaban »
Permettent d’enrichir sémantiquement le contenu d’une page dont la requête visée serait, vous l’avez deviné, « Harry Potter ».
Les
phrases ou groupes de mots co-occurents permettent aux moteurs de
recherche de renforcer la pertinence d’un contenu sur une expression.
Des liens entrants sur ces expressions permettent d’enrichir un peu plus
le sens sémantique de la page.
L’importance de l’entité
La
notion d’entité sémantique dépasse actuellement toutes les techniques
traditionnelles d’enrichissement sémantique d’une page pour les moteurs,
car elle est fondée sur le principe des relations connues entre ces
entités. Les relations entre chaque entité viennent appuyer la valeur et
le sens sémantique d’une page.
Bien
évidemment, le choix doit être rigoureux et méticuleux car les entités
n’ont pas toutes la même valeur et la même importance dans l’algorithme
de Google.
Prenons par exemple le groupe de rock « maroon five ».
Cette entité, présente une seule fois dans un contenu, aura beaucoup
plus de poids et d’autorité avec la citation des entités suivantes en
relation directe :
« daylight », « Adam Levine », « Overexposed », « Payphone », « Groupe Rock »
Contrairement à l’entité « Grammy awards » même si celle-ci est répétée plusieurs fois.
Intégrer
des entités directement en rapport avec son contenu améliore sa
perception par les moteurs. Plus les relations entre les entités seront
fortes, plus celles-ci prendront d’importance.
Quelle méthodologie pour une meilleure optimisation on-page ?
L’ensemble
des techniques énoncées précédemment est tout à fait applicable à
chaque contenu même si nous n’avons pas vraiment les moyens d’évaluer le
poids sémantique d’une page par le calcul des occurrences d’entité et
les relations sémantiques entre chacune d’elles. Sans pour autant négliger la partie off-site et netlinking de vos contenus, la partie on-site d’un site et l'optimisation des pages web doit être le point de départ et la priorité de vos optimisations.
Voici une liste de conseils simples pour réussir l’optimisation sémantique d’un contenu :
Etudiez en profondeur vos-mot-clés Il est essentiel de toujours commencer ses investigations par une analyse détaillée de mots-clés, en recherchant les termes de signification proches, les termes concurrents, populaires, souvent saisis par les internautes, à partir des outils de recherche de mots-clés existant sur le web. Ne recherchez pas un mot-clé unique Prenez l'habitude de rechercher des thèmes différents de mots-clés et non un mot-clé unique. Examinez en détail chaque mot-clé secondaire et surveillez les réseaux, les moteurs pour voir comment les internautes abordent et interagissent sur le sujet pour ensuite réutiliser ces termes dans votre contenu.
Etudiez en profondeur vos-mot-clés Il est essentiel de toujours commencer ses investigations par une analyse détaillée de mots-clés, en recherchant les termes de signification proches, les termes concurrents, populaires, souvent saisis par les internautes, à partir des outils de recherche de mots-clés existant sur le web. Ne recherchez pas un mot-clé unique Prenez l'habitude de rechercher des thèmes différents de mots-clés et non un mot-clé unique. Examinez en détail chaque mot-clé secondaire et surveillez les réseaux, les moteurs pour voir comment les internautes abordent et interagissent sur le sujet pour ensuite réutiliser ces termes dans votre contenu.
Ecrivez comme des humains pour les humains
Rédigez
votre contenu en faisant en sorte de répondre aux questions que
pourraient se poser les internautes et les moteurs de recherche. soyez
meilleur que votre concurrence ! Think users and humans !
Explorez d'autres méthodes de recherche
Utilisez d'autres techniques de recherche sémantique, telles que les "related searches", Google Suggest, Google Trends
mais également les mots-clés associés aux sites et aux plateformes
sociales, ...etc.
Vous pouvez vous-même explorer et trouver de nouvelles
idées intéressantes pour approfondir le contenu sémantique de vos
textes.
Rendez votre contenu visible pour les moteurs
N'oubliez
pas d'intégrer le contenu pertinent dans les sections à contenu visible
au niveau du corps d'une page et non dans l'entête, le pied de page et
les menus de côté.
Structurez vos contenus
Pour
accroître la visibilité de vos contenus, il est essentiel de les
structurer et les décomposer en résumés, introductions, paragraphes,
conclusions, listes, de manière à ce qu'ils soient mieux interprétés par
les moteurs de recherche et les utilisateurs. Par ailleurs, sans stratégie de contenu,
ni plan éditorial, vos contenus auront moins de relief et risquent
d'être isolés, vous devez penser à les inclure dans une stratégie
globale de marketing de contenu.
Conclusion
Toutes
ces techniques, même si elles ne sont pas révélées par Google, font
tout de même l’objet d’études rigoureuses au niveau des brevets acquis
par le géant du web.
Alors
que jusqu'à présent, nous n'avions pas réellement d'outils pour évaluer
l'optimisation sémantique d'une page, une nouvelle application très
prometteuse vient de faire son apparition sur le web, il s'agit de
l'outil Visiblis,
développé par Jerôme Rossignol. Je n'ai pas encore pu bien testé cet
outil mais l'aperçu que j'en ai eu m'a déjà énormément convaincu,
Laurent Bourrelly l'a, en revanche, testé de fond en comble, et je vous
conseille fortement d'écouter les explications de son utilisation au
travers d'un cas pratique avec le podcast, un cas concret vaut bien mieux que toutes les théories !
Encore merci à Laurent Bourrelly, pour la découverte de cet outil, qui j'en suis sûre, va révolutionner le monde sémantique changer la vie de bien des webmasters, experts seo, et entrepreneurs !