Gérez votre site avec Google Outils pour les webmasters

Nous l'avons vu : le référencement se construit sur la durée. Forcément, il va falloir effectuer un suivi de son référencement. Vous aimeriez savoir si la stratégie de référencement que vous avez mise en place sur votre site est payante et, si ce n'est pas le cas, vous aimeriez corriger le tir en tentant autre chose.
Google sait qu'il est difficile de travailler le référencement d'un site web. Pour cela, une suite d'outils à destination des webmasters a été mise en place par le moteur de recherche. Ces outils sont incontournables, nous verrons dans ce chapitre à quoi ils vont nous servir et nous en profiterons également pour découvrir la notion très importante de sitemap.

Découverte des outils pour les webmasters

La clé d'un référencement réussi : le suivi

Qu'est-ce que le suivi ?
La notion de suivi est assez simple à comprendre. Vous savez que le référencement se construit sur la durée : si vous mettez en place une stratégie de référencement payante, il n'y a que peu de chances pour que vous voyiez votre site remonter dans l'heure dans la SERP de Google. En effet, se construire un bon référencement prend plusieurs semaines, plusieurs mois, plusieurs années. L'inverse étant aussi vrai, si vous mettez en place une stratégie de référencement très mauvaise, vous ne verrez pas tout de suite votre site baisser dans les résultats du moteur de recherche ; vous ne verrez ces effets qu'après un certain temps. Pourtant, chaque expert en SEO doit être capable d'estimer rapidement si la stratégie de référencement adoptée est bonne. Et si elle n'est pas bonne, l'expert en SEO doit rapidement corriger le tir. C'est ce qu'on appelle le « suivi du référencement ». Vous devrez constamment vous poser ce type de questions :
  • Est-ce que j'ai choisi les bons mots-clés pour référencer cette page ?
  • Cette nouvelle structure HTML adoptée rend-elle réellement mon site plus lisible pour Googlebot ?
  • Ai-je suffisamment de bons backlinks pour remonter dans la SERP ?
Bien sûr, vous devez être prêts à réagir, à modifier votre stratégie si elle est mauvaise, et à vous reposer ces questions ensuite.
Ce que j'essaie de vous faire comprendre, c'est que le suivi est très important. Vous ne pouvez pas vous contenter de lancer votre site web, de mettre au point une stratégie de référencement, et de vous endormir en laissant les choses se faire. Vous devez au contraire sans arrêt vous tenir prêt à effectuer des modifications à tous les niveaux pour toujours remonter un peu plus dans la SERP. N'oubliez pas non plus que les stratégies de référencement évoluent en même temps que les algorithmes de Google. Ne vous laissez donc pas surprendre et tenez-vous constamment informés des dernières évolutions !
Comment effectuer un suivi de son référencement ?
Il existe fort heureusement une tonne d'outils différents pour faciliter le suivi de son référencement. Les meilleurs de ces outils ont été programmés par Google. Le chapitre que vous lisez actuellement est dédié à une suite d'outils signés Google, baptisée tout bêtement « Google Outils pour les webmasters ». À partir de maintenant, on n'apprendra plus grand-chose en termes de référencement pur, mais l'on apprendra surtout à faire du suivi, parce que c'est incontournable !

Accéder aux outils pour les webmasters

Une suite d'outils pour gérer votre site web

Que sont les outils pour les webmasters ?
Google Outils pour les webmasters, souvent abrégé GWT pour Google Webmasters Tools, est une suite d'outils signés Google. Ces outils sont, comme leur nom l'indique, destinés aux webmasters. Vous n'avez rien à télécharger, car les outils pour webmasters sont regroupés directement sur les serveurs de Google, sous la forme d'une application web accessible depuis n'importe quel navigateur. Pour y accéder, vous n'aurez besoin que d'un compte Google actif.
Voici, entre autres, à quoi vont nous servir ces fameux outils :
  • effectuer le suivi de votre référencement ;
  • obtenir des statistiques des visites de Googlebot sur votre site web ;
  • obtenir des rapports sur l'état de santé de votre site web ;
  • envoyer un plan de votre site pour aider Google à le référencer ;
  • créer directement en ligne votre robots.txt ;
  • connaître le PageRank de votre site ;
  • et bien d'autres choses encore !
C'est sympathique tout cela, non ? Je pense que vous pouvez déjà sentir que vous ne pourrez bientôt plus vous passer des outils pour webmasters... En effet, nous avons déjà commencé à parler de l'importance du suivi de votre référencement et, vu l'aide énorme que représentent ces outils, il serait bête de ne pas les exploiter.
Maintenant que vous êtes au point au niveau du référencement in-page et off-page, les outils pour webmasters sont un bon moyen pour voir si vous avez bien appris votre leçon, ou si au contraire vous avez fait n'importe quoi. 

Les outils pour les webmasters

S'inscrire aux outils pour les webmasters
Vous le savez déjà, pour accéder aux outils pour webmasters, vous avez besoin d'un compte Google actif. Si vous n'êtes pas inscrits, c'est le moment de le faire !
Nous allons travailler avec un grand nombre d'outils signés Google, et l'accès à ces outils est restreint aux utilisateurs possédant des comptes Google actifs. Vous n'irez nulle part dans la galaxie Google sans compte Google, et la suite de ce cours vous serait alors inutile...
Commencez donc par vous rendre à cette adresse.
Une fois connectés, vous accédez à la page d'accueil des outils pour webmasters (voir la figure suivante).


La page d'accueil des outils pour les webmasters

Vous êtes accueillis par un bref texte introductif, ainsi que par une vidéo qui présente elle aussi les outils pour webmasters et que je vous conseille de regarder... enfin, pour peu que vous maîtrisiez l'anglais. La première chose à faire est de repérer le petit formulaire situé tout en bas de la page. On vous demande d'ajouter un site. La raison en est très simple : vous devez renseigner le site dont vous voulez effectuer l'analyse.
Dès lors, le site que vous ajouterez sera en quelque sorte lié à votre compte Google, et vous pourrez commencer à obtenir des rapports sur les outils pour webmasters. Notez bien sûr que votre site doit être en production pour être analysable.
Mais alors... tout le monde peut obtenir des rapports de n'importe quel site ? Mes concurrents peuvent donc obtenir mes stats ?
La question mérite d'être posée, mais je vous rassure tout de suite : la réponse est non. Remplissez le formulaire en indiquant l'URL de votre site web, vous allez très vite comprendre pourquoi. 
Une fois le nom de domaine validé, vous pouvez voir que Google vous redirige sur une nouvelle page... où il vous demande de confirmer que vous êtes bel et bien le propriétaire du site que vous tentez d'analyser. C'est la sécurité qui empêche quiconque de voir les statistiques d'un site qui ne lui appartient pas. Google vous propose quatre méthodes différentes pour que vous puissiez lui prouver que vous êtes bien le propriétaire du site que vous tentez d'analyser :
  • ajouter un enregistrement de type TXT à vos DNS ;
  • uploader un fichier HTML fourni par Google sur votre serveur FTP ;
  • ajouter une balise META fournie par Google dans le code HTML de la page d'accueil de votre site web ;
  • utiliser le code JavaScript fourni par Google Analytics.
La première méthode nécessite que vous ayez accès à un panneau de contrôle chez votre registrar. Puisque l'interface d'administration d'un nom de domaine est différente pour chaque registrar et que d'autres méthodes plus faciles à mettre en œuvre sont proposées par Google, nous n'allons pas nous attarder sur cette solution.
La seconde et la troisième méthode demandent respectivement que vous soyez en mesure d'accéder à votre serveur FTP et que vous puissiez modifier vos templates HTML. À vous de voir, selon l'architecture de votre site et selon votre hébergement, la méthode qui est la plus facile d'accès. Notez cependant qu'une seule méthode suffit à prouver à Google que vous êtes le propriétaire d'un site : mettre toutes les méthodes en œuvre simultanément est recommandé mais pas obligatoire.


Une fois votre nom de domaine validé, vous pourrez accéder à la page principale des outils pour webmasters (voir la figure suivante).


Message de confirmation d'accès aux outils pour webmasters

Le menu principal des outils pour webmasters
Tout d'abord, vous devez savoir que pour le moment, vous n'avez accès ni aux statistiques ni au rapport de votre site. C'est normal, car vous venez juste d'inscrire votre site sur les outils pour les webmasters : Google n'est donc pas encore en mesure de vous fournir un rapport. Il va falloir attendre le prochain crawl de votre site par un Googlebot. Mais qu'à cela ne tienne ! Cela ne nous empêche pas de découvrir ensemble le menu principal des outils pour webmasters.
Vous arriverez d'abord systématiquement sur une page vous présentant tous les sites dont vous êtes reconnus comme propriétaire. Il faut savoir en effet que plusieurs utilisateurs peuvent être les propriétaires d'un même site, de la même manière que plusieurs sites peuvent être possédés par un même utilisateur. C'est pour cela que chaque fois que vous vous connecterez aux outils pour les webmasters, une page vous demandera de choisir le site pour lequel vous souhaitez obtenir les rapports. Attardons-nous sur le menu de cette page d'accueil (voir la figure suivante).


Menu des outils pour les webmasters

Cinq menus nous sont proposés, détaillons-les.
Accueil est la page par défaut. C'est tout simplement la page qui liste tous les sites dont vous êtes le propriétaire.
Tous les messages est une page un peu plus intéressante : elle liste tous les messages d'avertissement importants que Google retrouve sur l'ensemble de vos sites. Cette page ne liste pas forcément les opérations négatives qui ont été effectuées vis-à-vis de vos sites, elle vous donne vraiment les messages importants qui méritent votre attention. Par exemple, cette page pourra vous avertir qu'une nouvelle zone géographique ciblée a été définie pour votre site.
Préférences : c'est ici que vous allez pouvoir configurer une fonction très sympathique des outils pour les webmasters. En effet, les outils pour les webmasters vous permettent de recevoir par email vos messages d'avertissement. C'est très pratique si vous n'avez pas vraiment l'intention de consulter régulièrement ces pages : Google vous propose de vous faire parvenir directement les messages par mail. Dans cette page de préférences, vous avez la possibilité de définir la langue dans laquelle vous souhaitez recevoir les messages, ainsi que le type de ces messages. Vous pouvez choisir :
  • les messages urgents qui nécessitent une réaction immédiate de votre part ;
  • les messages urgents mais aussi les messages moins importants.
Pour illustrer le motif qui justifierait l'envoi d'un message urgent, Google utilise l'exemple d'un logiciel malveillant qui aurait pu être trouvé par le Googlebot sur votre site web : c'est rarissime mais cela peut toujours arriver. Bien sûr, vous pouvez aussi choisir de désactiver complètement les notifications par email. Ce n'est pas recommandé, mais c'est à vous de voir.
Labos est constitué d'outils qui ont pour ambition d'être ajoutés aux outils pour les webmasters mais qui sont encore en phase de test. C'est très expérimental, et à l'heure où j'écris ces lignes un seul de ces outils est présent : les statistiques de l'auteur.


John Resig, le créateur de jQuery, est ici identifié comme l'auteur de l'article

Vous vous en souvenez ? La page « Statistiques de l'auteur » vous permet donc d'obtenir des statistiques sur toutes les pages du web dont vous êtes reconnus comme auteur. Notez que ces pages peuvent tout à fait se trouver sur des sites qui ne vous appartiennent pas (voir la figure suivante).

Statistiques de l'auteur

Bien sûr, vous venez normalement d'activer votre compte sur Google Outils pour les webmasters, il ne faut donc pas vous attendre à des statistiques mirobolantes. Attendez un peu, cela montera au fur et à mesure. Un dernier menu existe : « Autres ressources ». Ce dernier menu n'est pas vraiment intéressant, il s'agit surtout d'une ouverture vers d'autres produits Google tels que Google Adresses.

Le tableau de bord des outils pour les webmasters

Focalisons-nous sur un site

Le tableau de bord
Revenons sur la page d'accueil des outils pour les webmasters, et cliquons maintenant sur le nom de l'un de nos sites. Nous arrivons sur une nouvelle page, et la première chose à remarquer est que le menu de gauche a changé !
Nous nous trouvons maintenant sur le tableau de bord des outils pour les webmasters. Ici, les informations présentées ne sont plus communes à tous les sites mais seulement inhérentes à un site en particulier : celui que nous avons choisi. Vous pouvez également remarquer qu'une liste déroulante se trouve en haut à droite de la page et vous permet de jongler entre les tableaux de bord des différents sites dont vous êtes le propriétaire. Pour commencer, nous allons nous attarder sur le menu de gauche. Comme je l'ai dit plus haut, celui-ci est différent de la page d'accueil des outils pour les webmasters (voir la figure suivante).

Tableau de bord des outils pour les webmasters

Configuration

Comme vous pouvez le voir, la première option qui nous est proposée est Messages.
Cette option, vous la connaissez. Elle était déjà présente dans le menu de la page d'accueil, mais elle s'appelait Tous les messages. Cette fois-ci, au lieu de vous renvoyer tous les messages communs à tous vos sites, elle vous renvoie seulement les messages concernant le site dont vous visitez le tableau de bord.
Nous n'avons pas grand-chose de plus à dire ici, alors continuons à explorer ce menu. Si vous cliquez sur le menu déroulant Configuration, vous verrez ces nouvelles options apparaître :
  • Paramètres
  • Liens de site
  • Paramètres d'URL
  • Changement d'adresse
  • Utilisateurs
  • Associés
Configuration > Paramètres
Paramètres vous permet de définir trois options.
La zone géographique ciblée vous permet de définir où se trouve le public visé par votre site. Si votre site est français, renseignez « France ». Le domaine favori de votre site web est une option intéressante. Elle vous sert à déterminer s'il s'agit du sous-domaine www ou non. À vous de voir ce que vous souhaitez, mais vos URL doivent vraiment comporter soit le www, soit rien du tout... mais pas les deux.
Par exemple http://www.monsite.com/page.html doit être réécrite en http://monsite.com/page.html si vous choisissez http://monsite.com en domaine favori... sans quoi vous risquez un duplicate content. Nous avons déjà vu cela plus tôt. Vous pouvez vous référer au chapitre « Un site web, une arborescence, des URL (1/2) » pour savoir comment travailler vos URL pour le référencement.
La dernière option des paramètres concerne la vitesse d'exploration de Google. Je vous recommande, comme c'est indiqué dans les outils pour les webmasters, de laisser Google déterminer tout seul la vitesse d'exploration de votre site.
Configuration > Liens de site
La prochaine option concerne les liens de site. Les liens de site sont des liens créés dans la SERP de Google sous le résultat principal de votre site web. Sur la figure suivante, les liens de site sont encadrés, il y en a six.

Liens de site du Site du Zéro

La page Liens de site des outils pour les webmasters vous permet d'entrer l'URL des pages à bannir des liens de site. C'est très simple : en renseignant ici des URL de votre site, vous les empêcherez d'apparaître comme liens de site.
Configuration > Paramètres d'URL
Cette page vous permet d'indiquer à Google comment vous souhaitez qu'il indexe les paramètres de vos URL. Il s'agit ici des variables se trouvant après le point d'interrogation ? dans vos URL.
Configuration > Changement d'adresse
La fonction de changement d'adresse vous permet de signaler à Google un changement de nom de domaine. Si vous changez de nom de domaine, Google identifiera le nouveau nom de domaine comme un nouveau site web, et tout le référencement que vous avez acquis sera perdu. Si au contraire vous signalez à Google que votre site change de nom de domaine, alors Google saura que c'est simplement votre site qui a changé de nom, et votre référencement sera conservé.
Il faudra donc signaler impérativement tout changement de nom de domaine à cet endroit. Vous devrez ensuite rediriger tous vos contenus de l'ancien nom de domaine sur le nouveau via une redirection HTTP 301, et enregistrer à nouveau votre nom de domaine sur les outils pour les webmasters.
Configuration > Utilisateurs
Vous êtes reconnus comme étant le propriétaire d'un site web, c'est bien. Comme vous le savez, plusieurs personnes peuvent être propriétaires d'un même site. Cette page vous permet d'ajouter un « propriétaire » à votre site web. Celui-ci aura accès au tableau de bord des outils pour les webmasters de votre site web.
En réalité, l'utilisateur que vous ajouterez aura un statut un peu particulier. Vous aurez la possibilité de lui définir un profil d'autorisations. Un profil avec un accès total lui donnera exactement les mêmes permissions que celles du propriétaire du site, alors qu'un accès limité le privera de certaines fonctions telles que la possibilité de modifier le public visé...
Configuration > Associés
L'option Associé vous permet d'associer un autre compte à votre site web. Vous pourrez par exemple associer une chaîne YouTube à votre site web.

État de santé

État de santé est le deuxième menu déroulant proposé dans le tableau de bord des outils pour les webmasters (voir la figure suivante).

Menu État de santé des outils pour les webmasters

Nous allons détailler ensemble toutes ces nouvelles notions qui vous sont proposées.
État de santé > Erreurs d'exploration
Erreurs d'exploration vous propose une page qui liste toutes les erreurs d'exploration que Googlebot a rencontrées au cours de ses visites sur votre site. Seules les erreurs levées au cours des trois derniers mois (une période de 90 jours) sont listées.
C'est par exemple ici que sont rapportées les erreurs 404. Visitez fréquemment cette page et, surtout, corrigez les erreurs au fur et à mesure qu'elles apparaissent. N'oubliez pas que vous pouvez marquer les erreurs comme corrigées, et donc signaler à Google que vous avez bien tenu compte de son rapport.
État de santé > Statistiques sur l'exploration
Statistiques sur l'exploration correspond à une page où l'on vous propose des rapports sur l'activité de Googlebot sur votre site. Trois graphiques sont proposés. Le premier concerne le nombre de pages que Googlebot à visitées, le second concerne le nombre de kilo-octets que Googlebot a téléchargés sur votre site, et le troisième vous informe sur le temps de téléchargement d'une page. C'est grâce à ce troisième graphique que vous pouvez avoir une idée des performances de votre site web, et donc tenter de vous améliorer en optimisant les temps de chargement. Les statistiques données ici sont encore une fois relevées sur les trois derniers mois. Des données chiffrées sont proposées sur la droite de la page.
État de santé > URL bloquées
URL bloquées est une page d'administration de votre robots.txt. Si vous en avez renseigné, ce que je vous encourage à faire si vous avez des répertoires dont vous voulez interdire l'indexation, les répertoires bloqués seront listés ici.
État de santé > Explorer comme Google
Explorer comme Googlebot présente une page vous permettant d'effectuer une analyse de votre site web, comme Googlebot le ferait. Ne vous y trompez pas, vous ne verrez pas votre page s'afficher comme s'il agissait d'un lecteur d'écran version web... C'est plutôt un moyen de vous assurer que Googlebot visite bien toutes les pages de votre site, et d'effectuer des modifications sur votre code si vous vous apercevez que Googlebot manque certaines pages. Faites attention, car vous êtes limités à 500 explorations. N'oubliez pas de vous référer à l'annexe de ce cours parlant de Lynx Browser. Vous y apprendrez réellement à visiter votre site comme le fait Googlebot.
État de santé > État de l'indexation
État de l'indexation vous propose une courbe listant tout simplement le nombre de pages de votre site web que Google a indexé au cours de l'année précédente. C'est très utile pour savoir si beaucoup de pages sont indexées. N'oubliez pas que plus vous avez de contenu sur Google, plus c'est positif pour vous.
État de santé > Logiciels malveillants
Logiciels malveillants vous indique si des logiciels malveillants ont été repérés sur votre site web. C'est très rare, mais il faut quand même venir visiter cette page de temps à autre, histoire de n'avoir aucune mauvaise surprise.

Trafic

Le prochain menu déroulant de ce tableau de bord se nomme « trafic » et comme son nom l'indique, il dispose de quelques options qui vont vous donner des informations sur le trafic de votre site.
Dans le chapitre suivant, nous parlerons d'une autre application web de Google baptisée Google Analytics. Elle va vous servir à avoir des informations extrêmement précises sur les statistiques de votre site.
Pour le moment, considérez ce menu des outils pour les webmasters comme une version « light » de Google Analytics.

Menu Trafic des outils pour les webmasters

Trafic > Requêtes de recherche
Requêtes de recherche est une page très importante. Elle vous permet d'obtenir la liste des requêtes les plus fréquentes qui ont mené à votre site web. Vous y verrez les notions d'« impressions » et de « clics ». Concrètement le compteur des impressions est incrémenté chaque fois que votre site web ressort dans les résultats de recherche sur Google. Ainsi, chaque fois qu'un internaute aura un lien vers votre site sous les yeux, ceci sera compté comme une impression. Le compteur de clics est quant à lui incrémenté chaque fois qu'un visiteur vient cliquer sur l'un de vos liens, et donc visite votre site. Il est très important de savoir quelles requêtes mènent à votre site web. C'est pour cela que je vous encourage vivement à revenir souvent sur cette page, car c'est un bon moyen de savoir si les mots-clés que vous avez choisis vous rapportent des visites ou non.
Trafic > Liens vers votre site
Liens vers votre site est aussi une page très importante. Ici, Google vous renseignera sur le nombre de backlinks vers votre site qu'il a trouvés sur le web. Comme vous le savez, plus vous avez de backlinks, mieux c'est.
Trafic > Liens internes
Cette page Liens internes vous donne des indications sur votre maillage interne. C'est ici que vous verrez si Google accède efficacement à tout le contenu de votre site et si celui-ci est bien hiérarchisé. En d'autres termes, c'est ici que vous saurez si vous avez bien réparti le Link Juice entre vos pages. Puisque vous venez de vous inscrire aux outils pour les webmasters, vous ne devriez voir aucune statistique sur cette page, au moins jusqu'à ce que Googlebot repasse sur votre site.

Optimisation

Optimisation est le dernier menu déroulant du tableau de bord des outils pour les webmasters. Ce menu vous propose quelques conseils d'améliorations que vous allez pouvoir effectuer sur votre site. Il s'agit, de loin, du menu déroulant le plus intéressant de ce tableau de bord.
Optimisation > Sitemaps
Sitemaps est une page d'administration des plans de votre site. Nous n'avons pas encore vu cette notion, et elle est suffisamment importante pour mériter une sous-partie complète. Nous allons pour le moment continuer à explorer les autres sous-menus, et nous reviendrons sur les sitemaps et ce qu'ils sont en réalité un peu plus loin.
Optimisation > URL à supprimer
URL à supprimer correspond aussi à une page très importante. Google a indexé une page que vous ne souhaitiez pas voir indexée ? Demandez ici à Google la suppression de cette page dans son index. Notez que pour effectuer une demande de suppression à Google, vous devez être le propriétaire d'un site, ou au moins être un utilisateur avec un accès total au tableau de bord des outils pour les webmasters.
Vous devez également réaliser une opération de votre côté afin que la demande de suppression soit bien acceptée par Google.
Pour cela, vous pouvez au choix :
  • renvoyer un code HTTP 404 ou 410 lorsque cette page est demandée ;
  • bloquer le contenu de cette page à l'aide d'un robots.txt ;
  • bloquer l'indexation de cette page à l'aide d'une balise <meta name="robots" content="noindex" />.
Si l'une de ces actions est réalisée, Google acceptera normalement de supprimer la page voulue dans votre index.
Si vous souhaitez supprimer un répertoire complet de l'index de Google, assurez-vous que celui-ci ne soit plus accessible, en plus d'ajouter une ligne dans votre robots.txt. Enfin, si votre contenu a été indexé par Google et qu'une copie en cache a été créée, vous devez ajouter une balise <meta name="robots" content="noarchive" />. Notez bien le noarchive, car c'est une nouveauté dont je n'ai pas parlé avant. Elle sert simplement à indiquer à Google qu'il ne doit pas créer de copie en cache pour cette page web.
Optimisation > Améliorations HTML
La page Améliorations HTML est, elle aussi, très sympathique. Si Googlebot a du mal à indexer vos contenus, car votre code HTML est très sale ou très mauvais, on vous indiquera ici quelques idées d'améliorations de vos codes HTML. N'oubliez pas : dans l'idéal votre code doit être simple, propre et épuré.
Optimisation > Mots-clés de contenu
Cette page Mots-clés de contenu est très importante. C'est ici que vous pouvez voir à quels mots-clés Google associe vos pages. En d'autres termes, c'est ici que vous pourrez voir comment Google interprète vos contenus. Concrètement, cette page vous présentera une liste de mots-clés. Chaque mot-clé est associé à une valeur d'importance et, lorsque vous cliquerez sur l'un de ces mots-clés, vous pourrez voir quelles sont les pages qui y correspondent.
Optimisation > Données structurées
La page Données structurées indique si Googlebot a trouvé ou non des contenus hiérarchisés à l'aide des micro-données sur votre site. Relisez le chapitre sur la sémantique si vous avez un trou de mémoire, il s'agit simplement des balises HTML un peu spéciales que l'on utilise pour donner du sens à son contenu... Vous n'avez pas déjà oublié quand même ! 
Optimisation > Autres ressources
Enfin, la page Autres ressources est la même que sur la page d'accueil des outils pour les webmasters. Elle n'est ici que pour faire la promotion d'autres produits Google.


Vous noterez finalement que le corps de la page d'accueil du tableau de bord d'un site est constitué de raccourcis vers les pages Erreurs d'explorationRequêtes de recherche ainsi que Sitemaps. Vous verrez que lorsque votre site commencera à générer de véritables statistiques, elles apparaîtront également sous la forme d'un raccourci sur cette même page. Ne soyez donc pas étonnés. Parlons maintenant du sitemap.

Un plan du site pour Googlebot : sitemap.xml

Envoyez un plan de votre site à Google

Qu'est-ce qu'un plan de site ?
Le plan de votre site, ou sitemap est un fichier au format .xml listant toutes les pages qui existent sur votre site. D'abord, il vous faudra écrire ce fichier sitemap.xml. Vous devrez ensuite déposer ce fichier sur votre serveur FTP, et en fournir l'URL d'accès à Google, dans les outils pour les webmasters. Faire parvenir un fichier qui liste toutes les pages de son site à Google est utile pour plusieurs raisons :
  • si votre maillage interne n'est pas bien effectué, Google aura du mal à trouver vos contenus, le sitemap est la solution ;
  • si votre site est très récent, peu de liens amènent vers les différentes pages, le sitemap est la solution encore une fois.
En un mot, le sitemap permet de s'assurer que Googlebot visite toutes vos pages.
Par ailleurs, le sitemap, est un fichier au format xml. XML est un langage cousin du HTML. Ces deux langages sont très proches l'un de l'autre et leurs syntaxes sont très ressemblantes. XML est très utile pour présenter et détailler des données. Il est donc particulièrement adapté pour créer un plan de son site pour un programme comme Googlebot. Si vous êtes intéressés par le XML, un tutoriel assez complet sur XML existe.
Écrire son sitemap.xml
Écrivons dès maintenant notre sitemap.xml. Pour commencer, ouvrez votre éditeur de texte favori, et basculez sur une coloration syntaxique XML. Enregistrez dès maintenant le fichier sur lequel vous allez commencer à travailler et nommez-le sitemap.xml pour plus de simplicité.


Commencez par placer cette ligne de code en tête de votre fichier.
<?xml version="1.0" encoding="UTF-8"?>
Cette ligne est un peu l'équivalent du DOCTYPE en HTML. Il s'agit tout simplement d'une ligne servant à expliquer à l'ordinateur que nous travaillons bien en XML. Ensuite, nous allons utiliser des balises. Je vous l'ai dit plus haut, HTML et XML sont des langages cousins, les deux emploient des balises dans leurs syntaxes.
Au sein d'un sitemap.xml, nous n'allons utiliser que quatre balises, qui sont <urlset><url><loc> et <changefreq>. Ces quatre balises permettent à elles seules de décrire votre site à Google.
Pour commencer, il faut placer la balise <urlset>. C'est la balise principale de votre fichier sitemap, un peu comme la balise <html> en HTML.
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
</urlset>
Cette balise prend trois paramètres qui servent simplement à définir le fichier comme un sitemap. <urlset> étant une balise unique, il ne peut pas y avoir deux <urlset> dans un même fichier sitemap.xml. C'est comme pour la balise <html>, ne l'oubliez pas ! Nous allons maintenant utiliser les balises <url><loc> et <changefreq>. Les balises <loc> et <changefreq> s'utilisent au même niveau, c'est-à-dire dans la balise <url><loc> sert à indiquer l'URL de la page que vous souhaitez lister, alors que <changefreq> sert à indiquer à quelle fréquence cette page est mise à jour. Voici un exemple de sitemap valide et complet :
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>http://www.site.com/index.php</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.site.com/index.php</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.site.com/index.php</loc>
<changefreq>weekly</changefreq>
</url>
</urlset>
Je pense que cet exemple vous parle. Faites attention à la balise <changefreq>. Elle ne peut prendre que 7 valeurs :
  • none (mise à jour non indiquée) ;
  • always (mise à jour en permanence) ;
  • hourly (mise à jour toutes les heures) ;
  • daily (mise à jour tous les jours) ;
  • weekly (mise à jour toutes les semaines) ;
  • monthly (mise à jour tous les mois) ;
  • yearly (mise à jour tous les ans) ;
  • never (jamais de mise à jour).
La balise <changefreq> est facultative. La seule balise obligatoire au sein d'un bloc <url> est la balise <loc>. Deux balises supplémentaires existent, il s'agit de <lastmod> et <priority>. Ces deux balises sont, elles aussi, facultatives, tout comme la balise <changefreq>. Pour plus de simplicité, nous n'allons pas trop nous attarder sur ces deux balises, d'autant que les valeurs qu'elles représentent sont aujourd'hui facilement identifiables par Googlebot.
Vous savez maintenant écrire un sitemap. Pour chaque page que vous devrez lister, vous allez devoir ajouter une balise <url> et la remplir avec, au minimum, la balise <loc>contenant l'URL de la page à lister.
Mon site est vraiment gros, je vais mettre des heures et des heures à écrire un sitemap avec toutes les pages que j'ai... Comment faire ?
Bonne remarque ! Je dois en fait vous avouer que je vous ai fait prendre l'option difficile : celle de taper vous-mêmes votre sitemap à la main. Je voulais simplement vous apprendre comment faire, mais sachez que beaucoup délèguent l'écriture des sitemaps à des programmes dédiés. Personnellement je ne le fais pas. Le fonctionnement de ces programmes est généralement assez simple : ils ne font que crawler votre site web comme le fait Googlebot, en explorant les liens, avant de compiler toutes les URL des pages trouvées dans un fichier XML. C'est bien et ça fonctionne, mais l'une des utilités du sitemap est de signaler à Google des pages que Googlebot n'a potentiellement pas vues lors de son passage. L'intérêt d'utiliser ces outils s'avère donc très limité, pour ne pas dire inexistant. En plus, ces programmes sont parfois payants...
Pour ma part, j'ai pris l'habitude de modifier directement le sitemap.xml des sites sur lesquels je travaille via le langage utilisé côté serveur, PHP par exemple. Chaque fois qu'une nouvelle page est créée, je l'ajoute au sitemap automatiquement. C'est le genre de petites idées que je vous conseille de mettre en place sur votre site web si vous voulez toujours garder un sitemap propre et à jour. À vous ensuite de l'améliorer en supprimant du sitemap les pages supprimées du site, et en démarrant un nouveau sitemap2.xml dès que les 50 Mo (ou les 50 000 URL) sont franchis. Cela ne prend QUE quelques lignes de code et le résultat est garanti. 
Autres informations sur sitemap.xml
D'abord, il faut vous rappeler qu'un fichier sitemap.xml peut contenir 50 000 URL au maximum et ne doit pas dépasser 50 Mo. Si votre site est vraiment très gros et que vous avez besoin de plus de place, la bonne nouvelle est que vous pouvez créer autant de sitemaps que vous le voulez.
L'autre bonne nouvelle est qu'il ne vous est pas nécessaire d'envoyer séparément tous vos sitemap.xml à Google. Vous pouvez tout simplement créer un fichier d'index de sitemap, le placer sur votre FTP et envoyer l'URL de ce fichier d'index à Google. Celui-ci sera alors capable de retrouver tout seul tous vos sitemaps. Voici un exemple d'index de sitemap :
<?xml version="1.0" encoding="UTF-8" ?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.site.com/sitemap.xml</loc>
</sitemap>
<sitemap>
<loc>http://www.site.com/sitemap2.xml</loc>
</sitemap>
<sitemap>
<loc>http://www.site.com/sitemap3.xml</loc>
</sitemap>
Une autre balise, baptisée <lastmod>, existe. Elle permet de renseigner la date de dernière modification, mais elle est facultative.


  • Google Outils pour les webmasters est une application web créée par Google dans le but de faciliter le suivi de votre référencement.
  • Cette application fournit énormément de statistiques et d'informations intéressantes sur votre site et sur la manière dont Google le référence.
  • Cette application vous permet aussi d'envoyer un sitemap à Google : un plan de votre site écrit en langage XML.

0 Commentaires