Sitemap.xml

Guide SEO > Technique > Sitemap.xml

Il peut paraitre un poil trop technique, voire parfois inutile pour certains novices qui débutent dans le référencement naturel. Et pourtant, le fichier sitemap.xml est loin d’être un artifice dans le paysage de Google.

Pourquoi ? Parce qu’il est là pour aider vos pages à être indexées dans le célèbre moteur de recherche. Si vous n’avez pas encore de sitemap sur votre site web, il serait temps de réfléchir à en fournir un à Google. Voyons ça ensemble !

Alors déjà, c’est quoi un sitemap ?

Un sitemap, c’est un document qui répertorie l’ensemble de vos URLs. Littéralement, ça veut dire « carte du site ». Rien de mieux pour expliquer en un mot sa signification, non ? Eh oui, un sitemap est tout simplement un fichier qui explique aux crawlers (robots de moteurs de recherche) comment est fait votre site internet.

Après, il y a aussi son extension XML. Traduction : Extensible Markup Language. Traduction : Langage de balisage extensible. Ne soyez pas effrayé par ce terme, ce n’est ni plus ni moins qu’une liste.

Est-ce que c’est indispensable pour mon site web ?

Alors soyons tout de suite clairs : un fichier sitemap ne favorise pas le positionnement de votre site Internet dans les résultats de moteurs de recherche, mais simplement à indiquer à Google que vos pages existent. En gros, vos pages devraient pouvoir se référencer naturellement, sans avoir besoin de l’aide d’un fichier sitemap. Eh oui, il ne faut pas confondre indexation et référencement web. En revanche, les deux sont indissociables. Explications !

Qu’est-ce que l’indexation d’une page ?

Indexer une page, c’est quand un robot Google passe sur votre site, parcourt et copie son contenu pour le stocker dans ses serveurs. En arrivant sur un site web, le Googlebot va explorer les pages, suivre les liens et découvrir les nouvelles pages et les nouveaux contenus vers lesquels il sera dirigé. D’où l’importance d’un bon maillage interne !

Qu’est-ce que le référencement d’une page ?

Le référencement naturel, c’est un ensemble de techniques qui consiste à faire apparaitre votre page dans les premiers résultats de Google. On retrouve des solutions diverses et qui font souvent leurs preuves : l’optimisation technique du site (vitesse de chargement, poids des images, etc.), l’optimisation sémantique (qualité de la rédaction web, pertinence des informations, volume de mots, etc.) et la popularité du site (liens externes qui pointent vers votre site web).

Mais avant de penser au référencement de la page, encore faut-il qu’elle soit indexée. D’où la corrélation entre les deux !

En résumé, c’est indispensable ou pas ?

Nous ne saurons que trop vous conseiller de fournir un fichier sitemap.xml à Google, ne serait-ce que pour accélérer l’indexation des pages. Notamment pour les gros sites internet qui génèrent beaucoup de contenus, comme un site e-commerce. L’inverse ne se vérifiera pas avec un site vitrine de 5 ou 6 pages.

Autre chose, Google clame haut et fort que le Rapport de couverture de l’index (pour la Search Console) fonctionne encore mieux pour les sites qui envoient des sitemaps. À quoi sert ce rapport ? À détailler les URLs correctement indexées, vous avertir de problèmes potentiels et expliquer pourquoi certaines de vos pages ne sont pas indexées dans le moteur de recherche.

Besoin de plus d’infos sur le Rapport de couverture de l’index ? C’est ici : https://webmaster-fr.googleblog.com/2018/01/la-nouvelle-search-console-arrive.html

Quoi qu’il arrive, un sitemap XML est particulièrement utile en fonction de :

  • la spécificité de votre structure web (ou un nombre important de liens internes)
  • la date de création de votre site web (si votre site est nouveau par exemple)
  • le nombre élevé de contenus archivés ou de pages dynamiques

Du coup, comment je peux générer un sitemap.xml ?

Inutile d’être un crac de l’informatique ou de la programmation pour générer un fichier sitemap XML, surtout si vous votre site est sous le CMS WordPress. Dans ce cas, il suffit de télécharger le plugin mondialement connu Yoast. Une fois dans l’interface :

SEO > Tableau de bord

Fonctionnalités > Pages de réglages avancés > Activé

Enregistrez les modifications en bas de la page, puis retournez dans l’onglet SEO pour cliquer sur Sitemaps XML.

> Fonctionnalité de la sitemap XML > Activé

Et voilà, votre sitemap est généré avec Yoast !

Quoi qu’il en soit, tout fichier Sitemap doit :

  • Débuter par une balise d’ouverture et terminer avec une balise de fermeture
  • Spécifier l’espace de nom (norme liée au protocole) dans une balise <urlset>
  • Inclure une entrée pour chaque URL, en tant que balise XML parent
  • Inclure une entrée enfant <loc> pour chaque balise parent <url>
  • Utiliser un encodage UTF-8

Voilà ce que donne un sitemap en version HTML :

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

  <url>

    <loc>http://mon-domaine.fr/</loc>

    <lastmod>2012-12-15</lastmod>

    <changefreq>daily</changefreq>

    <priority>1</priority>

  </url>

  <url>

    <loc>http://mon-domaine.fr/page-a.html</loc>

    <lastmod>2012-12-15</lastmod>

    <changefreq>monthly</changefreq>

    <priority>0.8</priority>

  </url>

</urlset>

À savoir : un fichier sitemap peut lister uniquement 50 000 URLs au maximum, sans oublier que la taille ne peut excéder 10 Mo (10 485 760 octects exactement). Enfin, toutes les URLs listées doivent bien entendu provenir du même nom de domaine !

Et ensuite, que dois-je faire de plus ?

Première étape : indiquer l’emplacement du sitemap XML dans le fichier robots.txt, en indiquant la ligne Sitemap: http://www.mon-domaine.fr/sitemap.xml.

Ensuite, il va falloir déclarer votre sitemap à Google. Et c’est là que l’interface Google Search Console intervient !

Pour ce faire, rien de plus simple. Cliquez sur Optimisation > Sitemaps, puis cliquez sur le bouton rouge en haut à droite « AJOUTER/TESTER UN SITEMAP ». Il ne vous reste plus qu’à indiquer le nom du fichier, de valider et d’attendre que Google analyse tout ça.

Google reviendra ensuite vers vous avec les statistiques. À savoir le nombre d’URLs qu’il a trouvé dans votre sitemap XML, et combien il en a indexé. En effet, il pourra décider de ne pas en indexer certaines pour plusieurs raisons :

  • Elles peuvent être bloquées par votre fichier robots.txt
  • Elles peuvent être bloquées par votre balise meta robots
  • Elles peuvent être en erreur 404 ou redirigées (redirection 301 ou 302)
  • Elles peuvent être trop similaires à d’autres URLs (duplicate content)

Fort heureusement, vous pourrez obtenir des détails et corriger ces erreurs !

En résumé, qu’est-ce qu’on en pense du fichier sitemap XML ?

Que du bien ! Utile pour améliorer l’indexation des pages d’un site internet, le fichier sitemap XML va permettre à Google de stocker le contenu de vos pages dans sa base de données et de les faire apparaître dans ses résultats de recherche.

C’est particulièrement vrai si votre site génère beaucoup de pages (site e-commerce par exemple). Dans d’autres cas, le fichier sitemap ne sera pas forcément utile pour un petit site qui présente une bonne architecture. À vous de voir !