Référencement et fichier Sitemap, du mythe à la réalité

sitemapDescendant direct du Trusted Feed * le protocole Sitemap a été lancé en 2005 par Google. Un an plus tard, une entente entre les trois principaux moteurs de recherches de l’époque (Yahoo, Microsoft et Google) donne naissance à un protocole commun (normalisé) dont toute la documentation se trouve sur le site Sitemaps.org.

L’intérêt de ce Protocole pour les moteurs de recherche et les éditeurs de sites :

  • Permettre aux moteurs de recherche d’indexer facilement et rapidement aux pages d’un site en accédant directement aux url du dit site.
  • Les webmasters référencent plus facilement le site notamment ceux à plusieurs niveaux ou dont la structure est semée d’embuches pour les bots des moteurs de recherche.

Depuis sont lancement le protocole a connus plusieurs évolutions et déclinaisons (Google News, Sitemap pour Images, vidéo…).
Dans cet article nous allons traiter uniquement du Sitemap standard, c’est-à-dire pour un site web ou un blog.

Est-il obligatoire d’avoir un Sitemap pour son site ?

Non, car si un site est bien structuré, le moteur de recherche (et j’entends par moteur de recherche Google) n’a pas besoin d’un Sitemap pour indexer les pages de votre site, il arrive même des fois que des pages ne soient pas indexées même si le Sitemap y fait référence.

Toutefois vu le temps nécessaire pour sa création c’est à dire 5 minutes chrono (beaucoup plus si vous avez 40 000 pages et là il est fortement conseillé d’en avoir) on ne va pas s’en priver.

Comment créer son Sitemap ?

Vous pouvez le crée vous même à l’aide d’un éditeur de texte mais heureusement qu’il existe plusieurs outils en ligne et logiciels qui peuvent le faire pour vous.

Je pense à http://www.xml-Sitemaps.com ou à LinkExaminer (mon préféré) ou à XENU.

Aussi il existe bien des plugins pour WordPress, ainsi que la possibilité de générer le fichier sans se soucier des détails (Merci à nos chers amis développeurs contributeurs).

Quelques contraintes liées au protocole Sitemap:

Bien que particulier, mais un fichier Sitemap de doit pas dépasser 10 Mo et ne doit pas contenir plus de 50 000 urls selon les recommandations de Google.

Aussi j’ai toujours conseillé de créer plusieurs fichiers (disons avec 5000 url max) et de les soumettre via Google Webmatertools. Cette technique permet aux bots (spiders) de charger les urls sans fournir trop d’efforts. (Comme si vous déchargiez  un camion carton par carton au lieu de 3, c’est mieux pour votre dos).

Quel format de Sitemap choisir:

Il n’y a pas que .xml, vous avez la possibilité de choisir le format qui vous convienne : Xml, Ror, Xml.gz (compressé), html, txt…

Personnellement, j’ai une préférence pour le fichier txt car il est simple et léger.
Il suffit juste d’aligner une url par ligne

Ce que le Sitemap ne fait pas:

Il n’intervient pas dans leur positionnement.

Il ne peut pas interdire l’indexation d’une page ou d’un dossier (c’est une fonction propre au Robots.txt)

Ce que le Sitemap fait:

Augmente potentiellement les pages indexés (surtout pour les sites ayant une architecture à plusieurs niveaux).

* : Trusted Feed est la soumission de listes de pages sous format XML à Yahoo (moteurs de recherche) et ce afin de garantir leur indexation. Le modèle économique de cette stratégie marketing repose sur le Coût Par Clic (CPC) mais les positions ne sont pas garanties.

Ressources pour les autres formats :

Vidéo : http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=80472

Images : http://www.seomix.fr/referencement/naturel/sitemap-image-google/

Actualité : http://www.cafe-referencement.com/recherche-universelle/google-actualites-la-faq-385#axzz1SkyXItIe &

http://www.cafe-referencement.com/recherche-universelle/google-actualites-optimisation-avancee-382#axzz1SkyXItIe

VN:F [1.9.20_1166]
Rating: 0.0/5 (0 votes cast)
VN:F [1.9.20_1166]
Rating: 0 (from 0 votes)
Vous avez la possibilité de laisser un commentaire.

2 commentaires pour “Référencement et fichier Sitemap, du mythe à la réalité”

  1. Yassine dit :

    Je ne crois pas que les autres balises servent à quelque chose dans la mesure ou Google passe plusieurs fois sur un site et constate que rien n’a changé

    VN:F [1.9.20_1166]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.20_1166]
    Rating: 0 (from 0 votes)
  2. Je suis d’accord avec tes propos, le sitemap ca ne sert pas à grand chose mais au cas où autant en faire un. Ca ne sert pas à grand chose si le site est correctement architecturé. Mais il est vrai que dans certains cas ca peut être utile pour des gros gros sites.

    Par contre tu ne parles pas des différentes balise priority, changefreq…
    Pour le coup je pense que celles ci ne servent vraiment à rien.
    Ce n’est que mon avis. T’en penses quoi ?
    jérôme – blog marketing recently posted..Notre savoir nous jouerait il des tours ?My Profile

    VA:F [1.9.20_1166]
    Rating: 0.0/5 (0 votes cast)
    VA:F [1.9.20_1166]
    Rating: 0 (from 0 votes)

Laisser un commentaire

Ce blog utilise Commentluv. Si vous possedez un blog, vous pouvez indiquer son URL dans la case « Votre Site/Blog ». Cela aura pour effet d’insérer automatiquement le lien et le titre du dernier article de votre blog sous votre commentaire. les liens seront Dofollow après deux commentaires
This Blog will give regular Commentators DoFollow Status. Implemented from IT Blögg