Exclure des urls de l’indexation – 2

FontaineVous trouverez ici la suite de mon premier billet  » Exclure des urls de l’indexation » ou j’expliquai comment utiliser le fichier  » robots.txt ». Nous allons voir ici comment utiliser les balises  » meta ».

Les balises « meta » ( ou  » meta tags » ) dont je donne la définition dans mon  » vocabulaire du le référencement« , sont placées au début du site, entre les balises <head> et </head> et regroupent toute une série d’instructions pour les navigateurs et les moteurs de recherche.

On y trouve notamment les balises suivantes :

  • title ( la plus importante)
  • description
  • keywords

et pas mal d’autres…
Vous trouverez en surfant  nombre  de sites qui vont vous lister nombre de balises meta dont beaucoup ne servent plus à rien.Depuis 2 ans maintenant, la balise keywords n’est plus prise en compte par Google, et depuis peu la balise  » description » elle aussi semble tomber en désuétude, mais ceci doit encore être confirmé.

Mais d’autres balises gardent toute leur important  » technique » :

  • indication du  » charset » qui évitera d’avoir les caractères « spéciaux » ( lettres accentuées par exemples) remplacés par de  » ? » ou autres bizarreries
  • indication de la langue du site
  • indication de l’indexation ou non de la page
  • indication du suivi des liens sur la page ou non

Et nous en arrivons donc au sujet de ce billet : si vous souhaitez qu’une pas ne soit pas indexée, vous pouvez utiliser la balise robots dont les attributs donnent différents ordres aux moteurs de recherche.

  •  » index » ou  » noindex » selon que l’on veut que la page soit indexée ou pas
  • « follow » ou « nofollow » selon que l’on veut que les liens de la page soient suivis ou non

Ce qui nous donne comme variantes possibles :

  • <META NAME= »robots » CONTENT= »index,follow »> ( inutile car les moteurs de recherche, par défaut, indexent les pages et suivent les liens)
  • <META NAME= »robots » CONTENT= »noindex,follow »>
  • <META NAME= »robots » CONTENT= »index,nofollow »>
  • <META NAME= »robots » CONTENT= »noindex,nofollow »>

Comme vous le voyez, ce n’est pas bien compliqué. C’est ainsi que l’on peut avoir un site en ligne mais privatisé ( pour un travail collaboratif, un intranet ) ou avec des zones privées ( des forums, des sites  » corporates » incluant un intranet, des zones payantes etc..

A suivre…

Cette entrée a été publiée dans SEO. Vous pouvez la mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>