
Le nouveau Google Sitemap Generator innove en permettant aux crawlers de réaliser un de leurs vieux rêves… ils ne vont plus péniblement devoir suivre les liens car les données concernant les pages web et leurs modifications se trouveront directement sur les serveurs et elles seront régulièrement et directement transmises aux robots.
Le fonctionnement normal d’un crawler est assez erratique: il suit n’importe quel lien, même les plus inutiles. L’indexation et la vérification des pages web sera plus efficace avec ce nouveau générateur.
Fonctionnement
La génération du sitemap est réalisée à partir de fichiers de log qui sont sur le serveur et sont utilisées pour l’analyse du trafic. C’est sur cette base que seront transmis les sitemaps à tous les moteurs de recherche qui utilisent le protocole standard.
Il suffira d’un seul sitemap par serveur. En effet, on sait qu’un serveur peut héberger plusieurs sites. Le fichier de sitemaps pourra être configuré pour chacun des sites avec des instructions différentes
Des sitemaps peuvent être générés pour les crawlers du web, des téléphones mobiles, ou pour la recherche de code
L’option spéciale pour les blogs gère l’envoie d’un ping à la recherche de blog de Google pour chaque nouveau billet. Avec le Google Sitemap Generator les urls sont enregistrées dans la base de données du générateur de sitemap, les blogs n’ont pas de fichier sitemap en tant que tel.
Vie privée
Les données crées par le Google Sitemap Generator ne sont pas différentes d’un sitemap habituel. Elles ne contiennent pas d’informations concernant l’appel de pages : le générateur de Google élimine automatiquement tous les paramètres qui se terminent pas un point d’interrogation. Il arrive que des données de formulaires passent dans les urls : il est exclu que de telles informations soient transmises par mégarde.
L’administration du Google Sitemap Generator permet de contrôler ces paramètres.
Les webmasters qui utiliseront ce générateur de sitemap sont néanmoins priés de prévenir leurs lecteurs dans leur politique de confidentialité que des parties d’url contenant des données confidentielles sont susceptibles d’être transmises à Google.
Les avantages
Pour les webmasters et les administrateurs de serveurs :
- les crawler ne viendront plus pour rien encombrer les serveures
- seules leurs seront notifiées les modifications vraiment utiles
Pour les moteurs de recherche :
- un filtrage des urls plus facile selon votre configuration
- calcul automatique de certaines metadata telles que la fréquence de modification
- les updates sont enregistrées à la visite de la page
Le Google Sitemap Generator fonctionne sur des webserveurs Apache ou IIS. Au moment de l’installation on doit indiquer si un ou plusieurs personnes auront les droits d’administration. Pour l’administrer il faut donc avoir un serveur dédié. Lorsqu’on est sur un serveur mutualisé c’est l’hébergeur qui doit l’ installer et le configurer.
Vous trouverez toutes les informations complémentaires et pourrez télécharger le programme sur Google Sitemap Generator ( beta)
[ad#dievochka]


Open Directory
Les hébergeurs vont-ils s’embêter à monter ça sur leurs serveurs mmutualisés ? Pas sûr…
ça m’étonnerait aussi…car non seulement il faut l’installer mais l’administrer pour chaque client, ou trouver un moyen de lui laisser la main dessus pour qu’il indiquer ses choix. Mais est-ce bien nécessaire ? Ceux qui ont de gros sites ou plusieurs sites ont intérêt à avoir un dédié.. et tous les gros sites marchands ont les moyens et les compétences.
J’ai hâte de tester cela en pratique, avec les CMS comme WordPress, le sitemap n’est pas un problème mais sur certains gros sites dynamiques cela peut se révéler un vrai problème.
Et comme le rapporte Aurélien sur Oseox suite à un article de SEOmoz ou SEL je ne sais plus, le sitemap a une importance capitale dans l’indexation de ses pages.
ben… c’est pas moi qui vait l’installer sur un serveur
!
Il est peu probable que cela se mette en place sur les serveurs mutualisé dans un proche avenir.
http://etre-heureux.fr