Vous trouverez ici la suite de mon premier billet » Exclure des urls de l’indexation » ou j’expliquai comment utiliser le fichier » robots.txt ». Nous allons voir ici comment utiliser les balises » meta ».
Les balises « meta » ( ou » meta tags » ) dont je donne la définition dans mon » vocabulaire du le référencement« , sont placées au début du site, entre les balises <head> et </head> et regroupent toute une série d’instructions pour les navigateurs et les moteurs de recherche.
On y trouve notamment les balises suivantes :
- title ( la plus importante)
- description
- keywords
et pas mal d’autres…
Vous trouverez en surfant nombre de sites qui vont vous lister nombre de balises meta dont beaucoup ne servent plus à rien.Depuis 2 ans maintenant, la balise keywords n’est plus prise en compte par Google, et depuis peu la balise » description » elle aussi semble tomber en désuétude, mais ceci doit encore être confirmé.
Mais d’autres balises gardent toute leur important » technique » :
- indication du » charset » qui évitera d’avoir les caractères « spéciaux » ( lettres accentuées par exemples) remplacés par de » ? » ou autres bizarreries
- indication de la langue du site
- indication de l’indexation ou non de la page
- indication du suivi des liens sur la page ou non
Et nous en arrivons donc au sujet de ce billet : si vous souhaitez qu’une pas ne soit pas indexée, vous pouvez utiliser la balise robots dont les attributs donnent différents ordres aux moteurs de recherche.
- » index » ou » noindex » selon que l’on veut que la page soit indexée ou pas
- « follow » ou « nofollow » selon que l’on veut que les liens de la page soient suivis ou non
Ce qui nous donne comme variantes possibles :
- <META NAME= »robots » CONTENT= »index,follow »> ( inutile car les moteurs de recherche, par défaut, indexent les pages et suivent les liens)
- <META NAME= »robots » CONTENT= »noindex,follow »>
- <META NAME= »robots » CONTENT= »index,nofollow »>
- <META NAME= »robots » CONTENT= »noindex,nofollow »>
Comme vous le voyez, ce n’est pas bien compliqué. C’est ainsi que l’on peut avoir un site en ligne mais privatisé ( pour un travail collaboratif, un intranet ) ou avec des zones privées ( des forums, des sites » corporates » incluant un intranet, des zones payantes etc..
A suivre…


Open Directory