Author Archives: Rémi Landais

About Rémi Landais

Responsable du Labs chez EXALEAD
  • Exalead au cœur de la recherche et de l’innovation en Europe

    15 juillet 2010 by Rémi Landais Actu, Exalabs 0

    Dans le cadre de programmes de recherche européens financés par la Commission Européenne, nos ingénieurs chercheurs mettent leurs savoir-faire à contribution dans des collaborations scientifiques avec des partenaires industriels et académiques pour créer des systèmes d’accès à l’information toujours plus performants.

    Parmi les challenges techniques et scientifiques du moment, la recherche d’informations multimédias bénéficie d’une attention particulière de la part des instances de la Commission Européenne. Un appel à projet spécifique a été lancé sur le thème de « Networked Media » pour favoriser le développement d’outils collaboratifs de recherche et partage de données multimédias sur le web et les réseaux sociaux. En partenariat avec des industriels et universitaires européens, Exalead a répondu à cet appel à projet en décrochant deux projets sur ce thème : I-SEARCH et GLOCAL.

    glocal

    Le projet GLOCAL a pour objectif de développer un système de recherche de photos, vidéos, sons en s’appuyant sur la notion d’événements. L’idée principale consiste à reproduire le comportement humain dans sa manière de représenter mentalement les concepts et objets qui nous entourent. Les fichiers multimédias seront caractérisés en fonction des événements qu’ils représentent (mariage, coupe du monde, élection politique, catastrophe naturelle…).

    schema

    Pour plus d’informations sur ce projet, n’hésitez pas à visiter le site web dédié au projet : http://www.glocal-project.eu/. Exalead jouera un rôle central en motorisant le système GLOCAL avec sa solution de recherche CloudView©.

    isearch

    Le projet I-SEARCH se propose de développer une plate-forme dédiée à la gestion des documents multimédias orienté 2D/3D. Un modèle de données approprié sera développé pour représenter au mieux les caractéristiques d’une image ou vidéo 2D/3D. Il sera alors plus facile de rechercher dans des collections d’images et vidéos 2D/3D en utilisant un système de requête évolué plus riche que de simples mots clés. Dessiner une chaise en utilisant sa souris ou simplement en soumettant la photo d’une chaise existante et la soumettre à la plate-forme feront remonter les chaises ressemblant au croquis que vous avez spécifié dans un catalogue de fournisseur de meubles.

    N’hésitez à visiter le site de ce projet : http://www.isearch-project.eu/isearch/. Le cœur de la plateforme reposera sur la technologie Exalead.

  • Exalead.fr accueille Chromatik

    27 octobre 2009 by Rémi Landais Nouveautés 4

    Vous avez déjà pu tester Chromatik, notre démonstrateur Labs de recherche d’images par la couleur. Fidèles à notre volonté de tirer le meilleur parti de nos applications Labs, cette fonctionnalité vient d’être intégrée au sein de notre moteur de recherche Images : http://www.exalead.fr/search/images. Petite visite guidée :

    Nouvelle présentation de la barre d'affinage de la Recherche Images

    Comme vous pouvez le voir, la barre d’affinage contient désormais une palette de 8 couleurs (du jaune au vert). Cliquez sur une des couleurs pour filtrer les résultats de la recherche en fonction de la couleur sélectionnée.

    Recherche d'images de fleur de couleur violetteRecherche d'images de ferrari de couleur rouge

    Au-delà de ce qui a l’air plutôt évident à première vue, sachez qu’il est également possible de sélectionner plusieurs couleurs simultanément.

    Recherche d'images de Spiderman contenant du bleu et du rouge

    Et il n’y pas de limitations sur le nombre de couleurs qu’il est possible de sélectionner!

    Recherche d'images de drapeaux contenant du jaune, du bleu, du rouge et du vert

    Le dernier élément de la palette permet de limiter les résultats de la requête aux images en noir et blanc comme il était déjà possible de le faire dans la précédente version de la Recherche Images.

    Recherche d'images de "Calvin and Hobbes" en noir et blanc

    Ce n’est bien sûr que le début ! Nous avons déjà commencé à travailler sur l’intégration de certaines des fonctionnalités de Chromatik encore absentes à l’heure actuelle sur la Recherche Images.

    Et surtout n’oubliez pas de nous faire part de vos remarques sur feedback.exalead.fr.

  • Indexation et Recherche Spatiale : Sourcier, une nouvelle démo Exalabs

    15 octobre 2009 by Rémi Landais Exalabs, Nouveautés 0

    Contexte
    De nos jours, de plus en plus d’informations que l’on trouve sur Internet sont géolocalisées :

    • Site Web contenant une adresse physique (page de contact le plus souvent)
    • Articles Wikipedia
    • Photos et vidéos sur les services de partage “Web 2.0″
    • POI (Point Of Interest) apparaissant sur les différents services de cartographie…

    De nombreux services tirant partie de ces informations géolocalisées sont apparus sur le web, permettant aux utilisateurs de faire le pont entre le “monde réel” et les résultats de recherche trouvés en les affichant sur une carte.

    Nous aimerions donc pouvoir utiliser notre carte comme outil de saisie d’un véritable critère de recherche spatiale, et non pas comme une simple vue des résultats. Pour se faire il suffirait que nous puissions dessiner les zones qui nous intéressent sur la carte, et se limiter aux résultats inclus dans ces zones.

    Faire de la recherche géospatiale avec Exalead
    Sourcier est un démonstrateur des technologies Exalead réalisé en collaboration avec le BRGM basé sur des données métiers : les relevés qualimétriques des eaux souterraines en France métropolitaine disponible publiquement sur le site ADES.

    Sourcier permet de rechercher les points d’eaux ainsi que les relevés associés en fonction :

    • D’un composant chimique, d’un facteur environnemental ou d’éléments micro-biologiques
    • D’une plage de concentration
    • D’une période de temps
    • D’une zone géographique sélectionnée sur la carte au moyen d’outils de dessin ou du choix d’une entité administrative (région, département, ou commune)

    Recherche aux alentours de Lyon et en Bretagne

    Sourcier propose également à l’utilisateur des services d’aide à la recherche sous forme de suggestions riches pour :

    • Les éléments mesurés avec la plage de concentration disponible, l’unité de mesure normalisée et la période pour laquelle des relevés existent
    • Les entités administratives accompagnées de leur représentation sur la carte qui est alors utilisée comme critère de recherche spatiale

    L’affichage des résultats de recherche se fait directement sur la carte sous forme de marqueurs parmi lesquels on peut naviguer afin de consulter les relevés associés sous forme de graphique.

    Recherche dans la commune de Meung-sur-Loire et consultation du graphique détaillé

    A venir…
    Les prochaines expérimentations autour de l’indexation et la recherche géospatiale avec les technologies Exalead concerneront principalement le support d’objets géométriques plus complexes ainsi que le support du calcul de distance, ce calcul n’étant qu’une extrapolation vers une autre forme géométrique. Par exemple la distance à un point se représente par un disque centré sur le point et de rayon égal à la distance maximale.

    L’indexation d’objets géométriques tels que des ensembles de segments et de polygones nous permettrait par exemple d’initier une recherche sur les parcs de la ville de Londres pour ensuite réutiliser leurs empreintes sur la carte comme critères de recherche spatiale et ainsi trouver des photos géolocalisées.

    Recherche de parcs à Londres

    Sourcier est disponible à l’adresse suivante : http://sourcier.labs.exalead.com/

  • Un moteur qui me comprend !

    19 février 2009 by Rémi Landais Exalabs 7

    Derrière chacune de nos requêtes quotidiennes se cache une question.
    Si on classe les requêtes par fréquence d’apparition dans les logs Exalead, il suffit d’un coup d’œil pour voir que les requêtes les plus fréquentes sont celles de type “favoris”.

    Lorsque je tape “marmiton” (ouille …), je veux dire “Donne-moi l’url du site marmiton”. Sur les sites connus, c’est tellement plus simple de passer par un moteur que de fouiller les favoris de son navigateur ou les tréfonds de sa mémoire à long terme !

    Lorsque je tape un ou deux mots génériques, comme “cuisine” ou “randonnée vercors”, je recherche les sites de référence d’un domaine.

    Les algorithmes d’analyse de graphes permettent à nos moteurs préférés de nous apporter des réponses satisfaisantes à ces types de requêtes.

    La “long tail” des requêtes utilisateurs cache des questions plus complexes, formulées sous forme de mots-clef ou en langage naturel.

    - hauteur eglise madeleine : “Quelle est la hauteur de l’Eglise de la Madeleine ?” (30 mètres)

    - définition TCP : “Que signifie TCP ?” (Transmission Control Protocol)

    - inventeur barometre : “Qui fut l’inventeur du baromètre?” (Evangelista Torricelli)

    Quoi de mieux qu’un système rapportant directement l’information, nous évitant ainsi de devoir aller chercher dans le détail des documents ?! Ces questions s’appellent des questions factuelles.

    Dans un texte, on peut trouver la réponse à ces questions sous différentes formes.

    Exemples :

    * Torricelli, inventeur du baromètre (immédiat !)

    * Aussitôt après l’invention du baromètre par Torricelli, (…) (phénomène : dérivation)

    * L’italien Torricelli,mathématicien et physicien, découvrit le principe du baromètre. (phénomène : synonymie)

    * Le nom de Torricelli est resté associé dans l’histoire au premier baromètre à mercure (phénomène: résolution de la formule “le premier N”)

    * Le baromètre a été inventé par Torricelli. (phénomène : dérivation et prise en compte de la forme passive)

    * Le mathématicien et physicien italien Evangelista Torricelli était aussi un disciple de Galilée. A la suite de diverses expériences sur la pression atmosphérique, il invente le premier baromètre à mercure. (phénomène : Résolution du pronom “il” avec “Evangelista Torricelli”)

    * Zy va c’est pas PasKAL Ka FE le Bar au metre, C Torricelli ! (phénomène : glissement de la langue)



    Pas toujours facile de formuler la bonne requête pour trouver LA réponse, mais il est possible au moteur d’avoir une démarche systématique afin de faire avancer le schmilblick.

    · Comprendre la requête en identifiant les éléments signifiants (dans l’exemple précédent inventeur et baromètre)

    · Identifier le type de réponse attendu (on cherche un nom de personne)

    · Reformuler la requête (en tenant compte de la synonymie, des dérivations linguistiques …)

    · Faire une analyse textuelle des passages retournés par le moteur

    · Identifier les réponses possibles (des noms de personnes en l’occurrence)

    · Proposer une réponse (juste !) et mettre en avant les éléments qui la justifient.

    C’est un des sujets sur lesquels planchent la R&D d’Exalead, avec nos partenaires toulousains de Synapse Développement pour le Français et l’Anglais dans le cadre de Quaero, et nos partenaires portugais de Priberam pour l’Espagnol et le Portugais. Et un proto devrait prendre corps avant l’été … à suivre.

    Et puis, il y a des questions plus difficiles à formuler : “L’écran de mon PC est tout bleu. Comment y remédier ?”. Là, il est peut-être un peu ambitieux de prétendre apporter une réponse toute faite :o ) … Mais pointer vers des pages qui font référence à un problème peut s’avérer d’une grande utilité.

    Et puis, il y a des convergences possibles avec la reconnaissance vocale, la localisation géographique. Posez la question à votre IPhone …

    Et puis, … bref, tant qu’on se posera des questions, on ne risque pas de s’ennuyer !

  • Exalead image : de l’intérêt de l’indexation par le contenu

    9 février 2009 by Rémi Landais Côté entreprise, Exalabs, Interviews, Nouveautés 4

    Tout le monde se souvient de Tom Cruise dans Minority Report, s’agitant comme un
    damné devant un mur d’écrans et soumettant son ordinateur (apparemment doué de vie) les questions : « Montre moi les photos de MrX », « Repars en arrière », « Non pas là, à gauche et zoome un peu s’il te plaît» …

    Si ce futur technologique ne tient sans doute pas entièrement de l’utopie, on peut
    tout de même douter de la capacité des machines actuelles à interpréter aussi
    facilement les intentions de son utilisateur.

    Que se serait-il par exemple passé si Tom avait subitement demandé (aussi étrange que cela puisse paraître je vous l’accorde) à sa machine de lui montrer quelques images de Jaguar ?

    Dans le monde de Minority Report on peut être certain que la machine en question se serait rendu compte de l’ambiguïté et lui aurait demandé d’une voix suave de préciser sa pensée : «La voiture ou l’animal ? »
    Mais nous ne sommes pas dans le monde de Minority Report et pour l’instant les
    moteurs de recherche (les bons) donneraient à Tom des résultats comme ceux-ci :

    jaguar

    Rien que de très logique ici : des voitures, des animaux et un avion de chasse (le jaguar est un avion de chasse franco-britannique pour les plus curieux d’entre vous).
    Si nous admettons qu’un moteur de recherche ne peut pas deviner l’intention de l’utilisateur (ici le sens qu’il donne au terme « jaguar »), ce dernier se doit d’affiner sa requête en ajoutant certains mots clés discriminants.

    Passionné de voiture britannique hors de prix, Tom transformerait ainsi la requête «jaguar» en la requête «jaguar voiture» et obtiendrait finalement les résultats suivants :

    jag3

    Sur le moteur web une telle méthode de recherche fonctionne systématiquement: il est en effet très vraisemblable qu’une page relative aux voitures de la marque jaguar contienne le terme jaguar tout comme le terme voiture permettant ainsi d’obtenir des résultats corrects pour la requête « jaguar voiture ».

    Dans le cas des images, nous venons de voir que cette méthode pouvait aboutir à des résultats probants. Pour autant, reposer uniquement sur le texte s’avère risqué. En effet, le volume de texte associé à une image est nécessairement plus restreint pour éviter les erreurs (une erreur typique consiste à associer à une image contenue dans un tableau d’images le texte de l’image suivante du tableau).

    Fort de ce constat, Exalead entreprend de prendre en compte une autre source
    d’informations pour améliorer la recherche d’images : à savoir le contenu celles-ci (leurs pixels).
    C’est dans cet objectif que le filtre visage a été mis en ligne (avec le succès qu’on lui connait) grâce aux technologies développées par LTU Technologies tout comme le filtre «photo» plus récemment.

    Mais l’activité de recherche d’Exalead en image ne s’arrête pas là et Exalead collabore ainsi avec des acteurs académiques de premier plan dans le cadre de plusieurs projets (R2I, GEORAMA, QUAERO), en vue de tester les méthodes d’analyse d’images les plus innovantes qui permettront d’améliorer la pertinence de ses résultats ainsi que l’expérience utilisateur lors de la navigation.