L’avenir des moteurs de recherche

moteurs-rechercheUne des discussions passionnantes de cette journée au SEO Camp’us concernait l’avenir des moteurs de recherche.

Nos deux intervenants,Pascal JANER de la société ARISEM et Claude de Loupy, fondateur de Syllabs sont des spécialistes de l’informatique et de la sémantique.

Fonctionnement et limites des moteurs actuels

Ils nous ont d’abord expliqué comment fonctionne un système d’indexation dans le cadre de la gestion documentaire puis de sémantique pure, allant jusqu’au cosinus de Salton dont Sylvain Peyronnet  nous donne ici une explication relativement accessible. On comprend alors rapidement que les langues ne peuvent être réduites à des équations mathématiques, qu’elles sont une matière vivantes qui sort du champ des sciences exactes et on voit que les moteurs de recherche ne sont qu’un pis aller. Ils trouvent relativement facilement leur place dans un espace limité ( au sein d’une entreprise, dans le cadre de la Gestion Electronique Documentaire) mais les moteurs généralistes se heurtent à de nombreux problèmes techniques

Ils ont par ailleurs des limites financières car, pour   des raisons évidentes d’économies  ils ne peuvent indexer tous les mots et suppriment  les  » stop words » ( articles, pronoms etc…) jugés inutiles. Ceci entraîne alors  des erreurs d’interprétations assez graves.  Les problèmes d’homonymie ne peuvent non plus être résolus facilement.
Voici quelques exemples très parlants proposés par nos intervenants :

  •  » orange »  peut être compris de differentes façon, allant de la ville d’Orange à la couleur en passant par l’opérateur téléphonique
  • être  » à Aix les bains » ou  » à Aix aux bains » n’a pas tout à fait le même sens.

Or les » stop words » représentent environ 30 % de l’ensemble des mots  :  les moteurs ne peuvent se permettre d’augmenter leurs bases de données dans de telles proportions.

On peut penser que les moteurs de recherche ne vont plus pouvoir progresser dans l’amélioration de leurs méthodes d’indexation. Ils ont largement progressé pendant les premières années mais ont maintenant atteint un palier difficile à franchir . Google conserve néanmoins son avance grâce à l’immense index qu’il a su créer. Mais il est évident que tous se trouvent à un tournant : les réponses ne correspondent que rarement à nos demandes et si nous savons nous contenter des réponses partielles, c’est aussi sans doute parce que nous avons surtout su nous adapter à leur fonctionnement, et non l’inverse !

L’avenir ?

Mais quelles sont nos attentes ?
Que pourraient-ils nous proposer comme fonctionnalités vraiment nouvelles et intéressantes ?
Que recherche l’internaute en fait : une réponse ou des réponses en adéquation à sa requête, ceci dans un temps le plus court possible.

Claude de Loupy a suggéré que nous pourrions, par exemple, attendre  de la part d’un  moteur des propositions relatives à ce qu’il a compris de notre requête.
Ainsi, lorsqu’on cherche  » orange » il pourrait nous demander de préciser de quel  » orange » on veut parler. Ceci pourrait être sous forme de  liste de mots et expressions à cocher. Sauf que d’après l’expérience de Claude de Loupy  les utilisateurs ne semblent pas vraiment ravis d’avoir à faire ce  » travail supplémentaire » de tri. Il apporterait néamoins une pertinence beaucoup plus fine des réponses.

Nous avons d’ailleurs déjà les  » recherches apparentées » proposées par Google, mais en bas de page :

recherche-apparentee

Google avec « search wiki  » permet déjà à l’utilisateur  de trier le web à sa convenance en étant connecté sur son compte Google.  Nous commençons aussi a voir  des résultats tenant compte des nos recherches antérieures, ce que personnellement je trouve très réducteur : comment savoir si une recherche X à un jour J sera la même au jour J + 20 ( je peux un jour vouloir me renseigner sur un pays et quelques jours plus tard chercher à m’y rendre ) .  En se basant sur un historique machine on élimine également le fait que plusieurs personnes peuvent utiliser la même machine.

Yahoo vient d’annoncer  le  » search pad » qui permet ( en étant  connecté sous un compte yahoo) de garder des sites en mémoire tout en copiant des extraits des pages, prendre des notes et les comparer). On peut supposer que ces informations mémorisées vont également être utilisées par Yahoo pour proposer des réponses aux requêtes basées sur un historique.

Comme Yandex est en train de s’installer aux Usa, qu’il est le premier moteur utilisé en Russie et que je comprends un peu le russe, je suis allée voir ce qu’il propose : il n’est pas fondalementalement différent des autres.  Je vous parlerai ultérieurement de son fonctionnement …

Je ne pense malheureusement pas que nous pourrons tenter d’infléchir le fonctionnement des moteurs, ne serait-ce que parce que nous avons tous des utilisations et de besoins très différents et ne savons souvent pas nous mêmes ce que nous voulons !

Avez-vous des idées à ce sujet ? Nous pourrions les suggérer ensuite aux différents moteurs ;)   ( Je dois au moins avoir quelqu’un de MSN qui lit ce blog, il revient régulièrement dans mes referers depuis mon article sur Search Live l’autre jour)

Cette entrée a été publiée dans seo-camp, avec comme mot(s)-clef(s) , , , , , , , , . Vous pouvez la mettre en favoris avec ce permalien.

10 réponses à L’avenir des moteurs de recherche

  1. Snipeo dit :

    Cette histoire de Google SearchWiki et une évolution dans ce sens des moteurs de recherche ne m’enchante guère ! J’essaierai de détailler le pourquoi dans un futur billet sur Snipeo. Ceci dit une chose est certaine en ce qui concerne la recherche sur Internet : l’internaute est de plus en plus fainéant et de plus en plus insatisfait :)

  2. Poursan dit :

    L’internaute attend peut être trop du web. Il pense qu’il peut trouver des informations sur des sujets pointus en quelques clics.

  3. Damien dit :

    @Poursan et c’est le cas. Il faut cependant savoir où chercher.

  4. Hubert dit :

    Effectivement, cette conférence/atelier était fort intéressant malgré le fait que les participants avaient un peu déserté la salle. Pas facile de garder son auditoire quand on intervient dans la dernière présentation de deux journées intenses…
    Je ne crois pas que l’on ait eu l’occasion de discuter ensembles, mais j’espère que cela sera possible lors d’une prochaine réunion.

  5. Salut Claudine;

    Merci pour l’organisation du SEO Camp. C’était réellement très réussi.
    J’ai moi aussi bien aimé cette conférence sur l’avenir des moteurs… même si je ne suis sur de rien. ;)

  6. Dievochka dit :

    Effectivement, on s’est croisé sans se voir… ce n’est sans doute que partie remise !

  7. Dievochka dit :

    Merci pour le compliment.. il faut surtout remercie Philippe qui a beaucoup travaillé pour que tout marche comme sur des roulettes !

    Quant à être sûr de quelque chose… surtout dans un domaine qui tient des sciences humaines ! Quand on sait que même les physiciens doutent, et que le doute est à la base du cartésianisme.. soyons cartésiens : doutons !

  8. Thierry dit :

    une petite histoire drôle concernant le fonctionnement des moteurs de recherche:

    Comme vous pouvez le constater en cliquant sur le lien, notre site (en anglais) concerne l’immobilier. Les termes « property » et « properties » y sont donc prédominants. Nous sommes basés à Lautrec (tarn), patrie de l’ail rose. En analysant les requêtes des internautes (il y a 2 ans, c’est corrigé depuis), quelle surprise! En 1ére page de gg sur le terme « garlic properties », propriétés de l’ail!!!

  9. Dievochka dit :

    Comique en effet… manque plus que l’odeur ! voilà une fonctionnalité intéressante à développer d’ailleurs : l’odeur des sites ;)

  10. Rendez-vous au prochain SEO camp j’ai hâte !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>