Un moteur qui me comprend !
Derrière chacune de nos requêtes quotidiennes se cache une question.
Si on classe les requêtes par fréquence d’apparition dans les logs Exalead, il suffit d’un coup d’œil pour voir que les requêtes les plus fréquentes sont celles de type “favoris”.
Lorsque je tape “marmiton” (ouille …), je veux dire “Donne-moi l’url du site marmiton”. Sur les sites connus, c’est tellement plus simple de passer par un moteur que de fouiller les favoris de son navigateur ou les tréfonds de sa mémoire à long terme !
Lorsque je tape un ou deux mots génériques, comme “cuisine” ou “randonnée vercors”, je recherche les sites de référence d’un domaine.
Les algorithmes d’analyse de graphes permettent à nos moteurs préférés de nous apporter des réponses satisfaisantes à ces types de requêtes.
La “long tail” des requêtes utilisateurs cache des questions plus complexes, formulées sous forme de mots-clef ou en langage naturel.
- hauteur eglise madeleine : “Quelle est la hauteur de l’Eglise de la Madeleine ?” (30 mètres)
- définition TCP : “Que signifie TCP ?” (Transmission Control Protocol)
- inventeur barometre : “Qui fut l’inventeur du baromètre?” (Evangelista Torricelli)
Quoi de mieux qu’un système rapportant directement l’information, nous évitant ainsi de devoir aller chercher dans le détail des documents ?! Ces questions s’appellent des questions factuelles.
Dans un texte, on peut trouver la réponse à ces questions sous différentes formes.
Exemples :
* Torricelli, inventeur du baromètre (immédiat !)
* Aussitôt après l’invention du baromètre par Torricelli, (…) (phénomène : dérivation)
* L’italien Torricelli,mathématicien et physicien, découvrit le principe du baromètre. (phénomène : synonymie)
* Le nom de Torricelli est resté associé dans l’histoire au premier baromètre à mercure (phénomène: résolution de la formule “le premier N”)
* Le baromètre a été inventé par Torricelli. (phénomène : dérivation et prise en compte de la forme passive)
* Le mathématicien et physicien italien Evangelista Torricelli était aussi un disciple de Galilée. A la suite de diverses expériences sur la pression atmosphérique, il invente le premier baromètre à mercure. (phénomène : Résolution du pronom “il” avec “Evangelista Torricelli”)
* Zy va c’est pas PasKAL Ka FE le Bar au metre, C Torricelli ! (phénomène : glissement de la langue)
Pas toujours facile de formuler la bonne requête pour trouver LA réponse, mais il est possible au moteur d’avoir une démarche systématique afin de faire avancer le schmilblick.
· Comprendre la requête en identifiant les éléments signifiants (dans l’exemple précédent inventeur et baromètre)
· Identifier le type de réponse attendu (on cherche un nom de personne)
· Reformuler la requête (en tenant compte de la synonymie, des dérivations linguistiques …)
· Faire une analyse textuelle des passages retournés par le moteur
· Identifier les réponses possibles (des noms de personnes en l’occurrence)
· Proposer une réponse (juste !) et mettre en avant les éléments qui la justifient.
C’est un des sujets sur lesquels planchent la R&D d’Exalead, avec nos partenaires toulousains de Synapse Développement pour le Français et l’Anglais dans le cadre de Quaero, et nos partenaires portugais de Priberam pour l’Espagnol et le Portugais. Et un proto devrait prendre corps avant l’été … à suivre.
Et puis, il y a des questions plus difficiles à formuler : “L’écran de mon PC est tout bleu. Comment y remédier ?”. Là, il est peut-être un peu ambitieux de prétendre apporter une réponse toute faite
) … Mais pointer vers des pages qui font référence à un problème peut s’avérer d’une grande utilité.
Et puis, il y a des convergences possibles avec la reconnaissance vocale, la localisation géographique. Posez la question à votre IPhone …
Et puis, … bref, tant qu’on se posera des questions, on ne risque pas de s’ennuyer !








19 février 2009 à 14:30
Bonjour,
Voilà une recherche que j’ai faite et pour laquelle il ne semble pas y avoir de solution actuellement ; pour moi, il s’agit de mémoriser la question, de mieux l’exprimer, éventuellement de comprendre pourquoi ce n’est pas possible.
=====
Il existe des sites comme Virustotal qui peuvent scanner un fichier douteux ; la question est : existe-t-il un ou des sites qui peuvent scanner l’accès à un site sur lequel vous venez d’avoir une alerte antivirus.
Il s’agit pour l’internaute de ne pas avoir à chercher sur son PC un fichier douteux, pour l’envoyer à un site d’analyse, ces manipulations pouvant être préjudiciables?
Merci
20 février 2009 à 17:10
- hauteur eglise madeleine : “A quelle hauteur se situe l’église Madeleine?”
- définition TCP : “Quelle définition est associée à TCP ?”
- inventeur barometre : “Contacter l’inventeur d’un baromêtre”
Tout est question de demande : les internautes ne savent pas s’exprimer.
24 février 2009 à 9:34
[...] Source et suite de l’article : http://blog.exalead.fr/2009/02/19/un-moteur-qui-me-comprend/ [...]
18 mars 2009 à 23:00
Les internautes ne savent pas s’exprimer ?
Peut-être … Prenons donc en compte cette appréciation : le moteur ne pourrait-il pas traduire en langage naturel ce qu’il a compris ? L’internaute réexprimera alors sa question
19 mars 2009 à 10:04
TCP = Transmission Control Protocol, et non Tranfer Control Protocol.
Erreur classique
21 mars 2009 à 1:22
Belle réflexion
Il faut en effet se mettre à hauteur du visiteur (n’y voyez là rien de péjoratif).
J’avais rédigé un billet à ce propos : http://blogmotion.fr/internet/divertissement/etes-vous-atteinte-du-syndrome-du-moteur-de-recherche-2079
Sinon je vois que vous parlez du vercors, une personne de l’équipe a un pied à terre par là-bas ?
Personnellement j’utilise bcp la fonction “define:” de Google pour écrire sur mon blog et définir certains termes précis, il me semble qu’elle n’existe pas sur exalead ?
7 avril 2009 à 13:17
oups! merci E.C., erreur rectifiée.