vendredi 31 octobre 2014

Méthode d'optimisation sémantique on-page

Méthode d'optimisation sémantique on-page

Méthode d'optimisation sémantique on-page
Méthode pour optimiser une page sémantiquement
L’article de Cyrus Shepard publié cette semaine sur le blog de Moz ayant particulièrement retenu mon attention, je voulais mettre en avant, en français, toutes les méthodes de ce dossier qui me font penser que la recherche de mots-clés actuelle ne suffit plus et qu’elle nécessite beaucoup plus de travail et de techniques différentes qu’auparavant. Pourquoi cela me direz-vous ? La réponse est assez simple, les algorithmes de recherche évoluent, il est donc évident que la recherche de mots-clés évolue, si possible dans le même sens  :-)

Cet article présente une liste de techniques d’optimisations on-page seo issus de brevets, de rapports, d’observations  de nombreux marketers et d’études rigoureuses permettant de mieux définir le contenu sémantique d’une page et d’envoyer de meilleurs signaux aux moteurs pour accroître le référencement et le classement des pages d’un site sur les requêtes visées. Ce dossier s’appuie également sur les nombreuses études et recherches effectuées par Bill Slawski, chercheur et expert en moteurs de recherche, langage naturel, et responsable du site seobythesea .

On ne le répétera jamais assez, il faut aider les moteurs à comprendre votre contenu, et pour cela, vous devez leur donner plusieurs indices qui leur permettront de classer votre site dans une catégorie de leur index, un corpus bien défini.

Je précise que cet article n’est pas une traduction, même s’il reprend en grande partie les points du dossier de Cyrus Shepard, il représente plutôt une synthèse des méthodes énoncées, enrichie de mon avis sur le sujet.

L'optimisation sémantique d'une page


L'utilisation des mots-clés

La méthode ancestrale consistant à rechercher les mots-clés associés à un contenu et à les parsemer dans les balises title, entêtes (titres), alt, et le contenu textuel, est toujours d’actualité et joue encore un rôle essentiel dans l’interprétation du contenu d’une page, aidant ainsi les moteurs à mieux identifier les pages. Mais nous allons voir qu’elle connaît ses limites et qu’elle nécessite d’être enrichie de techniques complémentaires. 

Votre contenu fait référence à un sujet en particulier. Vous aidez les moteurs de recherche à comprendre le thème de votre page en alimentant, avec vos mots-clés, le title, les titres, les attributs ALT et les textes contenus dans le corps de vos pages.  

Le TF-IDF

Le TF-IDF (Term Frequency – Inverse Document Frequency) est une méthode de calcul destinée à évaluer l’importance d’un mot-clé dans une page, par rapport à un nombre de documents pour un corpus donné. Cette méthode pertinente est souvent utilisée dans les algorithmes des moteurs de recherche pour afficher leurs résultats dont celui de Google.

La formule savante définissant le TF-IDF est la suivante :

P(i,j) = TF(i,j) x log (N / DF(i) )

TF(i,j) est la fréquence d’apparition du terme i dans le document j

DF(i) est le nombre de documents contenant i

N est le nombre de documents dans le corpus

A titre indicatif :  
  • Un mot très fréquent dans un texte et présent dans beaucoup de documents aura un TF-IDF <= 1
  • Un mot peu fréquent dans un texte et présent dans peu de documents aura un TF-IDF > 1

Ce qui voudrait dire qu’un terme prend plus d’importance lorsqu’il est moins présent sur une page mais également sur l’ensemble des pages du corpus (TF-IDF élevé).

Prenons l’exemple du mot-clé « médecine » dont le nombre de résultats dans les serp est de 1 400 000 et du mot-clé « ophtalmologie, qui lui, obtient un nombre de résultats de 1 170 000. Le terme « ophtalmologie » est beaucoup plus judicieux que le terme « médecine », du fait d’un TF-IDF plus élevé.

Mais le TF-IDF n’est qu’une composante parmi tant d’autres de l’ensemble des facteurs d’optimisation on-page et ne peut en aucun cas être considéré comme le seul critère déterminant de l’optimisation d’un contenu.
L’indice TF-IDF est une base pour beaucoup de moteurs de recherche et permet d’évaluer l’importance d’un mot-clé dans une page, par rapport à la fréquence d’apparition du terme dans un ensemble de documents d’un corpus donné.

Synonymes et variantes proches

Lorsque l’on créée un contenu, on a souvent la mauvaise habitude de l’associer systématiquement à un mot-clé en particulier. Hors ce qui était valable avant, ne l’est plus maintenant et on oublie bien souvent que les internautes n’accèderont pas à la source d’informations de la manière qu’on l’aurait imaginé.

C’est ce que Google a tenté d’améliorer dans ses algorithmes avec Hummingbird en allant matcher les synonymes et mots proches d’une requête dans ses immenses bases de corpus. D’après une étude de Bill Slawski, l’algorithme Hummingbird se servirait des co-occurrences pour identifier les synonymes pour les substituer dans une requête.

Par exemple, utiliser les expressions :

« Recettes culinaires », « recettes gourmandes », « bonnes recettes de cuisines », « recettes gastronomiques », recettes de cuisine simples », « recettes pour cuisiner », « fiches de recettes de cuisine », « recettes pour tous », « recettes de plats cuisinés » Sera plus pertinent et plus productif que de répéter abondamment, dans un contenu, l’expression « recette de cuisine ».

La recherche de synonymes et de termes proches par rapport à une requête est très bénéfique pour votre contenu sémantique car elle permet une meilleure compréhension de la page par les moteurs de recherche.

La segmentation des pages

L’idée de croire qu’un mot-clé ou une expression se suffit à elle-même dans une page est totalement fausse avec la progression du web sémantique. Bien au contraire, le sens et la signification d’une expression seront renforcés par le contexte sémantique qui l’entoure.

C’est pourquoi, les mots prendront tout leur sens si on les utilise en majeure partie dans le corps d’une page contrairement aux entêtes, pieds de page et menus de côté beaucoup moins valorisants.

Les expressions et les mots-clés ont beaucoup plus de poids dans les sections dédiés au contenu plutôt que dans les parties header, footer et sidebar.




Méthodologie d'optimisation sémantique on-page
Méthode d'optimisation sémantique on-page
Informations pour intégrer l'infographie sur votre site

Image source à télécharger :   http://www.pinterest.com/pin/381257924679016449/
Lien associé à ajouter :   http://www.pole-position-seo.com//2014/10/web-semantique-methodes-avancees-d-optimisation-on-page.html


Distance sémantique et relations entre les termes

Un concept également très important pris en compte par les moteurs de recherche, est celui de la distance sémantique et les relations entre plusieurs termes au sein d’une même page. Placer un terme dans un paragraphe et ce même terme dans 2 paragraphes plus loin n’aura pas le même poids pour les moteurs. Afin de capitaliser toute la puissance sémantique d’un terme, il est indispensable de placer ses occurrences en fonction des balises HTLM d’un contenu.

Les termes placés dans un même paragraphe ou une même liste, auront un poids sémantique plus élevé. De même que tous les termes présents dans le titre et l’entête du document seront considérés comme très proches de tous les autres termes.

Co-occurrence et indexation syntagmique

L’avancée des algorithmes des moteurs de recherche est telle que ceux-ci sont dorénavant capables d’associer des phrases (ou des syntagmes) co-occurentes entre elles, consolidant un peu plus la pertinence d’un contenu. Cette méthode peut être approfondie en intégrant, dans votre contenu, des liens entrants sur différentes expressions co-occurentes.

Une technique bien utile qui permet de ne plus laisser d’ambiguïté au moteur sur la qualité de votre contenu lors de l’indexation de la page dans le corpus correspondant.

Par exemple les groupes de mots : 

« Joanne Kathleen Rowling », « Daniel Radcliff », « Emma Watson », « Dumbledore », « Les reliques de la mort », « les moldus », « Azkaban » 

Permettent d’enrichir sémantiquement le contenu d’une page dont la requête visée serait, vous l’avez deviné, « Harry Potter ». 

Les phrases ou groupes de mots co-occurents permettent aux moteurs de recherche de renforcer la pertinence d’un contenu sur une expression. Des liens entrants sur ces expressions permettent d’enrichir un peu plus le sens sémantique de la page.


L’importance de l’entité

La notion d’entité sémantique dépasse actuellement toutes les techniques traditionnelles d’enrichissement sémantique d’une page pour les moteurs, car elle est fondée sur le principe des relations connues entre ces entités. Les relations entre chaque entité viennent appuyer la valeur et le sens sémantique d’une page.

Bien évidemment, le choix doit être rigoureux et méticuleux car les entités n’ont pas toutes la même valeur et la même importance dans l’algorithme de Google.

Prenons par exemple le groupe de rock « maroon five ». Cette entité, présente une seule fois dans un contenu, aura beaucoup plus de poids et d’autorité avec la citation des entités suivantes en relation directe : 

« daylight », « Adam Levine », « Overexposed », « Payphone », « Groupe Rock »

Contrairement à l’entité « Grammy awards » même si celle-ci est répétée plusieurs fois. 

Intégrer des entités directement en rapport avec son contenu améliore sa perception par les moteurs. Plus les relations entre les entités seront fortes, plus celles-ci prendront d’importance.

Quelle méthodologie pour une meilleure optimisation on-page ?

L’ensemble des techniques énoncées précédemment est tout à fait applicable à chaque contenu même si nous n’avons pas vraiment les moyens d’évaluer le poids sémantique d’une page par le calcul des occurrences d’entité et les relations sémantiques  entre chacune d’elles. Sans pour autant négliger la partie off-site et netlinking de vos contenus, la partie on-site d’un site et l'optimisation des pages web doit être le point de départ et la priorité de vos optimisations.

Voici une liste de conseils simples pour réussir l’optimisation sémantique d’un contenu :
Etudiez en profondeur vos-mot-clés Il est essentiel de toujours commencer ses investigations par une analyse détaillée de mots-clés, en recherchant les termes de signification proches, les termes concurrents, populaires, souvent saisis par les internautes, à partir des outils de recherche de mots-clés existant sur le web.  Ne recherchez pas un mot-clé unique Prenez l'habitude de rechercher des thèmes différents de mots-clés et non un mot-clé unique. Examinez en détail chaque mot-clé secondaire et surveillez les réseaux, les moteurs pour voir comment les internautes abordent et interagissent sur le sujet pour ensuite réutiliser ces termes dans votre contenu.  
Ecrivez comme des humains pour les humains Rédigez votre contenu en faisant en sorte de répondre aux questions que pourraient se poser les internautes et les moteurs de recherche. soyez meilleur que votre concurrence ! Think users and humans ! 
  Explorez d'autres méthodes de recherche Utilisez d'autres techniques de recherche sémantique, telles que les "related searches", Google Suggest, Google Trends mais également les mots-clés associés aux sites et aux plateformes sociales, ...etc. 
 
Vous pouvez vous-même explorer et trouver de nouvelles idées intéressantes pour approfondir le contenu sémantique de vos textes. Rendez votre contenu visible pour les moteurs N'oubliez pas d'intégrer le contenu pertinent dans les sections à contenu visible au niveau du corps d'une page et non dans l'entête, le pied de page et les menus de côté.
  Structurez vos contenus Pour accroître la visibilité de vos contenus, il est essentiel de les structurer et les décomposer en résumés, introductions, paragraphes, conclusions, listes, de manière à ce qu'ils soient mieux interprétés par les moteurs de recherche et les utilisateurs. Par ailleurs, sans stratégie de contenu, ni plan éditorial, vos contenus auront moins de relief et risquent d'être isolés, vous devez penser à les inclure dans une stratégie globale de marketing de contenu.

Conclusion
Toutes ces techniques, même si elles ne sont pas révélées par Google, font tout de même l’objet d’études rigoureuses au niveau des brevets acquis par le géant du web. 

Alors que jusqu'à présent, nous n'avions pas réellement d'outils pour évaluer l'optimisation sémantique d'une page, une nouvelle application très prometteuse vient de faire son apparition sur le web, il s'agit de l'outil Visiblis, développé par Jerôme Rossignol. Je n'ai pas encore pu bien testé cet outil mais l'aperçu que j'en ai eu m'a déjà énormément convaincu, Laurent Bourrelly l'a, en revanche, testé de fond en comble, et je vous conseille fortement d'écouter les explications de son utilisation au travers d'un cas pratique avec le podcast, un cas concret vaut bien mieux que toutes les théories ! 

Encore merci à Laurent Bourrelly, pour la découverte de cet outil, qui j'en suis sûre, va révolutionner le monde sémantique changer la vie de bien des webmasters, experts seo, et entrepreneurs !

Aucun commentaire:

Enregistrer un commentaire