Exalead image : de l’intérêt de l’indexation par le contenu
Tout le monde se souvient de Tom Cruise dans Minority Report, s’agitant comme un
damné devant un mur d’écrans et soumettant son ordinateur (apparemment doué de vie) les questions : « Montre moi les photos de MrX », « Repars en arrière », « Non pas là, à gauche et zoome un peu s’il te plaît» …
Si ce futur technologique ne tient sans doute pas entièrement de l’utopie, on peut
tout de même douter de la capacité des machines actuelles à interpréter aussi
facilement les intentions de son utilisateur.
Que se serait-il par exemple passé si Tom avait subitement demandé (aussi étrange que cela puisse paraître je vous l’accorde) à sa machine de lui montrer quelques images de Jaguar ?
Dans le monde de Minority Report on peut être certain que la machine en question se serait rendu compte de l’ambiguïté et lui aurait demandé d’une voix suave de préciser sa pensée : «La voiture ou l’animal ? »
Mais nous ne sommes pas dans le monde de Minority Report et pour l’instant les
moteurs de recherche (les bons) donneraient à Tom des résultats comme ceux-ci :

Rien que de très logique ici : des voitures, des animaux et un avion de chasse (le jaguar est un avion de chasse franco-britannique pour les plus curieux d’entre vous).
Si nous admettons qu’un moteur de recherche ne peut pas deviner l’intention de l’utilisateur (ici le sens qu’il donne au terme « jaguar »), ce dernier se doit d’affiner sa requête en ajoutant certains mots clés discriminants.
Passionné de voiture britannique hors de prix, Tom transformerait ainsi la requête «jaguar» en la requête «jaguar voiture» et obtiendrait finalement les résultats suivants :

Sur le moteur web une telle méthode de recherche fonctionne systématiquement: il est en effet très vraisemblable qu’une page relative aux voitures de la marque jaguar contienne le terme jaguar tout comme le terme voiture permettant ainsi d’obtenir des résultats corrects pour la requête « jaguar voiture ».
Dans le cas des images, nous venons de voir que cette méthode pouvait aboutir à des résultats probants. Pour autant, reposer uniquement sur le texte s’avère risqué. En effet, le volume de texte associé à une image est nécessairement plus restreint pour éviter les erreurs (une erreur typique consiste à associer à une image contenue dans un tableau d’images le texte de l’image suivante du tableau).
Fort de ce constat, Exalead entreprend de prendre en compte une autre source
d’informations pour améliorer la recherche d’images : à savoir le contenu celles-ci (leurs pixels).
C’est dans cet objectif que le filtre visage a été mis en ligne (avec le succès qu’on lui connait) grâce aux technologies développées par LTU Technologies tout comme le filtre «photo» plus récemment.
Mais l’activité de recherche d’Exalead en image ne s’arrête pas là et Exalead collabore ainsi avec des acteurs académiques de premier plan dans le cadre de plusieurs projets (R2I, GEORAMA, QUAERO), en vue de tester les méthodes d’analyse d’images les plus innovantes qui permettront d’améliorer la pertinence de ses résultats ainsi que l’expérience utilisateur lors de la navigation.







9 février 2009 à 16:35
nice! J’ai hâte de voir tout ça (j’entends autre que les visages) en œuvre !
13 février 2009 à 18:56
Un des problèmes de la communauté scientifique est qu’elle ne sait pas quels sont les besoins ou les exigences des moteurs de recherche. Actuellement, des méthodes sont développées sans réellement tenir compte des impératifs de mémoire, de temps de calcul, etc. Exemple : combien de ressources (serveur) Exalead peut-il allouer à une requête de recherche d’image ? Selon les modèles proposées, la réponse peut varier entre trois ordres de grandeur.
Il serait intéressant que les moteurs de recherche publient un “white paper” adressé à la communauté scientifique dans lequel vous détailleriez ces points.
Parce que pour l’instant, nous on a le nez dans le code et on ne sait pas trop ce dont le monde a besoin…
19 février 2009 à 13:35
@ Régis B: Exalead est tout à fait conscient de la nécessité d’entretenir des relations privilégiées avec la communauté scientifique et s’implique ainsi dans de nombreux projets dont certains sont relatifs à l’image (un prochain post sur le blog présentera ces projets). S’il est difficilement envisageable de publier un white paper à l’adresse de l’ensemble de la communauté scientifique, les projets collaboratifs représentent pour les académiques le cadre idéal pour confronter leurs technologies aux impératifs industriels du domaine de l’indexation (que cela soit en terme de volumétrie, de ressources machines, de pertinence, …). En espérant que nous entrerons en contact par le biais d’un tel projet
19 février 2009 à 16:18
Il me semble intéressant de souligner un outil de reconnaissance d’images développé par l’armée US. Cette anecdote n’a peut-être jamais existé, mais elle a l’avantage de mettre le doigt sur un problème important. L’idée était de permettre de déterminer le type d’un avion à partir de sa photo pris par satellite.
L’objectif restant militaire, je passe les raisons qui ont poussées à chercher un tel logiciel.
L’armée concoit l’outil qui reconnait les formes des avions, puis pour lui apprendre à reconnaitre, il lui met en entrée une liste de photos d’avions pris par satellite et déjà identifié par des humains. La machine digère tout ça. Elle est maintenant prête à traiter le problème. On lui soumet alors des cas réels … et les résultats sont déplorables : la machine avait appris à reconnaitre les formes, mais elle se basait sur la forme des nuages qui se trouvait sur les photos.
Cette anecdote pour montrer combien il va être difficile pour un moteur de recherche de faire le distinguo sur des images.
Bonne journée à vous !
Kéké