Srziers – E-nutile Powa !

E-nutile Powa !

Dossier Référencement – Le Sitemap

Par Nicozen • 2 juin, 2009 • Catégorie: Les tutoriels de Papal
Ça parle de : et de

Il y a quelques temps que cela me trottait dans la tête, et surtout que j’avais ça dans ma todo-list, alors je décide de me lancer sachant que l’occasion s’y prête.
Je bosse actuellement pour un client qui souhaite augmenter le trafic de son site, alors je me documente sur les techniques à employer et j’essaye de les utiliser de façon à ce qu’elles soient le plus performantes possible.

Aujourd’hui (car j’espère que je pourrais publier d’autres tutos sur le sujet) on va parler du Sitemap. J’ai conscience que ce n’est pas la première étape du processus de référencement d’un site, mais je bosse dessus actuellement…

1. Le Sitemap qu’es aco l’animal ?

Si vous avez bonne mémoire, pour les plus assidus, vous vous souviendrez que l’amie Gégé à déjà causé sur les Sitemap, je ne fais donc que citer sa définition :

C’est un fichier XML que vous allez déposer par FTP à la racine de votre serveur pour que toutes vos pages soient indéxées par les moteurs de recherches. Ainsi, ils connaissent l’existence de toutes vos pages et pourront les positionner selon les requêtes de vos utilisateurs.

Le site map va être très utile pour un site possédant beaucoup de pages notamment un site marchand avec un gros catalogue de produits. Bien entendu, il est important de le regénérer une fois de temps en temps pour le mettre à jour et ainsi rajouter les nouvelles pages de votre site et supprimer les disparues.

Je rajouterai qu’un Sitemap permet aux webmasters d’indiquer facilement aux moteurs de recherche les pages de leurs sites à explorer. Sa structure est constitué d’un fichier XML qui répertorie les URL d’un site ainsi que des métadonnées complémentaires sur chaque URL (date de dernière modification, fréquence de révision et importance relative par rapport aux autres URL du site), de façon à favoriser une exploration plus intelligente du site par les moteurs de recherche. (source www.sitemaps.org)
Comme le disais Gégé, les robots (déployés par les moteurs de recherche) vont ainsi extraire toutes les urls du site et augmenter les chances du site d’être indexé dans ces moteurs de recherche.

Le protocole Sitemap

Pour être compléter, il faut ajouter qu’un fichier Sitemap est basé sur un protocole, en fait un schéma XML précis. Ça structure est composé de balises obligatoires, et d’autres balises facultives, utiles aux robots. Ce tableau illustre les caractéristiques de ces balises :

Attribut Description
<urlset> obligatoire Encadre le fichier et référence le standard de protocole actuel.
<url> obligatoire Balise parent de chaque entrée d’URL. Les autres balises sont des enfants de cette
balise.
<loc> obligatoire URL de la page. Cette URL doit commencer par l’intitulé du protocole (http, par
exemple) et se terminer par une barre oblique si votre serveur Web l’exige. L’URL
ne doit pas comporter plus de 2 048 caractères.
<lastmod> facultatif Date de la dernière modification du fichier. Cette date doit être au format

date et d’heure W3C. Celui-ci vous permet d’omettre l’heure, si vous le
souhaitez, et de n’utiliser que le format AAAA-MM-JJ.

Notez que cette balise n’est pas la même que l’en-tête If-Modified-Since (304) renvoyée
par le serveur. En outre, les moteurs de recherche peuvent utiliser de façon différente
les informations provenant des deux sources.

<changefreq> facultatif Fréquence probable de modification de la page. Cette valeur fournit aux moteurs
de recherche une information générale et ne reflète pas nécessairement la fréquence
effective d’exploration de la page. Les valeurs acceptées sont les suivantes :

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

La valeur « always » (toujours) doit être utilisée pour décrire les documents qui
changent à chaque accès. La valeur « never » (jamais) doit être utilisée pour décrire
les URL archivées.

Notez que la valeur de cette balise est considérée comme une indication,
et non comme une commande. Même si les robots d’exploration des moteurs de recherche
peuvent tenir compte de cette information, ils ne l’appliquent pas nécessairement
de façon stricte. Ainsi, ils peuvent explorer des pages dont la fréquence de modification
est « hourly » (horaire) moins fréquemment que cela ou, à l’inverse, explorer des
pages dont la fréquence de modification est « yearly » (annuelle) plus fréquemment.
Les robots peuvent explorer régulièrement les pages associées à la fréquence de
modification « never » (jamais), de façon à traiter les modifications non prévues
apportées à ces pages.

<priority> facultatif Priorité de cette URL par rapport aux autres URL de votre site. Les valeurs acceptées
sont comprises entre 0,0 et 1,0. Cette valeur n’a aucune incidence sur
la comparaison de vos pages avec celles d’autres sites. Elle permet uniquement de
signaler aux moteurs de recherche les pages que vous jugez les plus importantes
pour les robots d’exploration.

La priorité par défaut d’une page est égale à 0,5.

Notez que la priorité attribuée à une page n’aura vraisemblablement aucune incidence
sur le positionnement de vos URL dans les pages de résultats du moteur de recherche.
Les moteurs de recherche peuvent utiliser cette information pour hiérarchiser les
URL d’un même site lors de leur sélection. Cette balise vous permet donc d’augmenter
la probabilité que vos pages les plus importantes figurent dans l’index de recherche.

En outre, notez que l’attribution d’une priorité élevée à toutes les URL de votre
site ne vous sera probablement d’aucune utilité. En effet, cette priorité relative
n’est utilisée que pour hiérarchiser les URL de votre site lors de leur sélection.

2.Créer son Sitemap

Après la définition d’un Sitemap, il est temps de mettre les mains dans le code. Il n’y pas selon moi de grosse difficulté, il suffit d’utiliser votre éditeur de texte préféré (notepad++ ou bien smultron) et de saisir les infos selon cette architecture :

<?xml version= »1.0″ encoding= »UTF-8″?>
<urlset xmlns= »http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/page1.php</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/page2.php</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/page3.php</loc>
<changefreq>weekly</changefreq>
</url>

</urlset>

3.Publier le Sitemap

Avant dernière étape, et rien de bien compliqué. Il suffit d’utiliser un logiciel de transfert FTP (Filezilla ou Cyberduck), de mettre le fichier préalablement nommé « sitemap.xml » à la racine du serveur (directement dans le répertoire /www/).

On indique ensuite dans le fichier robots.txt l’endroit où se trouve le fichier avec les instructions suivantes :

Sitemap : <http://www.le-site-ou-il-y-a-le-sitemap.fr/sitemap.xml>

Et voilà le travail !

Pour les plus pointilleux, on peut affiner la publication en utilisant le Google Webmaster Tools.

Nicozen est
Email à cet auteur | Tous les Articles par Nicozen

18 Réponses »

  1. Zen bientôt prof à l’IUT ??? Très bon cour en tous cas …

  2. Bien bien tout ça, merci ! (je triche… oups, j’utilise un générateur automatique… mais chut ! … ^^)

  3. Dodo> Si tu veux dévoiler tes sources, ça peut être intéressant de donner plus d’infos sur les générateurs automatiques.
    C’est vrai que je n’en ai pas parlé.

  4. +1 pour Beber.
    Tu devrais chercher une place à Castres. Olivier Catteau est maintenant à Toulouse. T’as peut-être un coup à faire.

    +1 pour Dodo
    Pour ma part j’utilise ce site : http://www.sitemapbuilder.net/

    +2 pour moi-même
    Ben si je veux !!

  5. Moi aussi générateurs automatiques Yooda Map !! Trop long pour des portails, là tu te casses et il fait tout, tout seul ! Parfait pour des fainéants comme nous !

  6. http://www.xml-sitemaps.com/
    Rien à dl, tout se fait online ;)

  7. J’aime beaucoup ce professionnalisme poilu sortant d’une créativité capillaire avec un caractère sans contexte née sous l’influence du soleil Biterrois…

    Euh…..
    ;-)
    Je repasse en mode Srziers.

    Très sympa ces petits tutos…
    Et le blog en général…
    Je viendrais faire mon sourcing ici
    Je le mets pas en favoris je ne sais pas faire…

    A+che les tits lapinous

  8. Mo> tu es même le bienvenu pour contribuer au blog !
    Fais moi signe si tu veux un accès contributeur ;)

  9. Ecoute pourquoi pas d’ici l’été… mais je préférerai te dépouiller tes chips sur Face…
    Mais si j’ai des sources (je suis pas mal sur Joomla et compagnie)
    avec plaisir…:-)

  10. Ok, pour les sources, tu peux amèner ici ce que tu veux !
    Pour les chips, n’y pense même pas :p !

  11. Mo ?
    Le Mo ?
    Comment est le soleil à Lyon alors ?

  12. Raph > le soleil … quel soleil ?? lol
    Aujourd »hui il fait beau très beau (mon widget météo m’indique 20° ) mais vu les goutellettes qui ruissellent de mon front je dirai qu’il fait au moins 22°.
    Lyon quelle belle ville enfin tu connais mieux que moi ! le bon air surtout…
    bref et toi alors The proffesssorrr … !!! Comment vont les affaires ?

  13. Les affaires m’affairent. Ca n’arrête pas.

    Je pensais que mon Nabaztag pétait les plombs quand il m’a dit qu’il y avait de nouveaux commentaires de « Méga-octets ». En fait non, il fallait que ce soit le « Mo » qui soit surnommé ainsi. Crétin de lapin !

  14. Il est vraiment con ce lapin depuis le temps que je le dis !
    Il avait tjs le chic pour me casser le coup quand le petit jeune (j’ai oublié son prénom au typé asiatique, c’est pas Fred, Fred c’est l’autre donc c’est … « Raphy HELP ») venait réparer la photocopieuse…

  15. C’était un prénom en iiii ! non ?

  16. Jimmy !! (je crois)

  17. Pourquoi c’est toujours un chinois qui répare les photocopieuses ???
    (Au fait c’est Greg qui te l’avais vendue ?? ^^)

  18. ça y est Aline m’a aidé !! il s’appelle JERRY !! Yataaaa…

Laisser un Commentaire

Vous devez être connecté pour poster un commentaire.