english version

Archives pour la catégorie ‘Exalabs’

15 octobre 2009

Indexation et Recherche Spatiale : Sourcier, une nouvelle démo Exalabs

Contexte
De nos jours, de plus en plus d’informations que l’on trouve sur Internet sont géolocalisées :

  • Site Web contenant une adresse physique (page de contact le plus souvent)
  • Articles Wikipedia
  • Photos et vidéos sur les services de partage “Web 2.0″
  • POI (Point Of Interest) apparaissant sur les différents services de cartographie…

De nombreux services tirant partie de ces informations géolocalisées sont apparus sur le web, permettant aux utilisateurs de faire le pont entre le “monde réel” et les résultats de recherche trouvés en les affichant sur une carte.

Nous aimerions donc pouvoir utiliser notre carte comme outil de saisie d’un véritable critère de recherche spatiale, et non pas comme une simple vue des résultats. Pour se faire il suffirait que nous puissions dessiner les zones qui nous intéressent sur la carte, et se limiter aux résultats inclus dans ces zones.

Faire de la recherche géospatiale avec Exalead
Sourcier est un démonstrateur des technologies Exalead réalisé en collaboration avec le BRGM basé sur des données métiers : les relevés qualimétriques des eaux souterraines en France métropolitaine disponible publiquement sur le site ADES.

Sourcier permet de rechercher les points d’eaux ainsi que les relevés associés en fonction :

  • D’un composant chimique, d’un facteur environnemental ou d’éléments micro-biologiques
  • D’une plage de concentration
  • D’une période de temps
  • D’une zone géographique sélectionnée sur la carte au moyen d’outils de dessin ou du choix d’une entité administrative (région, département, ou commune)

Recherche aux alentours de Lyon et en Bretagne

Sourcier propose également à l’utilisateur des services d’aide à la recherche sous forme de suggestions riches pour :

  • Les éléments mesurés avec la plage de concentration disponible, l’unité de mesure normalisée et la période pour laquelle des relevés existent
  • Les entités administratives accompagnées de leur représentation sur la carte qui est alors utilisée comme critère de recherche spatiale

L’affichage des résultats de recherche se fait directement sur la carte sous forme de marqueurs parmi lesquels on peut naviguer afin de consulter les relevés associés sous forme de graphique.

Recherche dans la commune de Meung-sur-Loire et consultation du graphique détaillé

A venir…
Les prochaines expérimentations autour de l’indexation et la recherche géospatiale avec les technologies Exalead concerneront principalement le support d’objets géométriques plus complexes ainsi que le support du calcul de distance, ce calcul n’étant qu’une extrapolation vers une autre forme géométrique. Par exemple la distance à un point se représente par un disque centré sur le point et de rayon égal à la distance maximale.

L’indexation d’objets géométriques tels que des ensembles de segments et de polygones nous permettrait par exemple d’initier une recherche sur les parcs de la ville de Londres pour ensuite réutiliser leurs empreintes sur la carte comme critères de recherche spatiale et ainsi trouver des photos géolocalisées.

Recherche de parcs à Londres

Sourcier est disponible à l’adresse suivante : http://sourcier.labs.exalead.com/

7 octobre 2009

Voxalead News, finaliste du Yahoo! Challenge de l’ACM Multimédia 2009

Exalead est fier de vous annoncer que son projet labs Voxalead News a été retenu comme finaliste du Multimedia Grand Challenge catégorie “Video Segmentation” organisé par l’ACM Multimedia 2009, la plus grande conférence scientifique dédiée aux contenus multimédia qui se tiendra à Pékin du 19 au 24 octobre prochain.

Souvenez-vous, nous vous avions déjà présenté Voxalead News dans cet article. Il s’agit d’une application permettant de naviguer par recherche textuelle à l’intérieur de vidéos, créée en collaboration avec Vecsys et le CNRS-LIMSI dans le cadre du projet Quaero.

Voxalead News

De très nombreuses candidatures sont soumises à ces challenges et seules quelques unes (14 cette année) sont retenues pour la finale qui se tiendra lors de la conférence elle-même. Bon courage et bonne chance à Julien qui partira pour Pékin et aura seulement 3 minutes de présentation pour défendre Voxalead News!

Vous pouvez consulter les détails autour du challenge Yahoo! sur la segmentation vidéo et la liste des 14 finalistes toutes catégories confondues.

Pour ceux qui ne l’auraient pas déjà fait, n’hésitez pas à tester Voxalead News sur voxaleadnews.labs.exalead.com

On vous tiendra bien évidemment au courant de la suite des évènements…

La chronique datée du 13 octobre d’Anicet Mbida sur BFM TV était dédiée à Voxalead News, vous pouvez la consulter sur le site de BFM TV (passage à 22h48 sur l’horloge de la chaîne).

21 juillet 2009

Voxalead News disponible sur votre iPhone !

hadopi22

Vendredi dernier, nous vous présentions une toute nouvelle version de Voxalead, baptisée Voxalead News.
Pour continuer notre marche vers l’innovation, nos ingénieurs ont mis au point une version de Voxalead News, déjà disponible sur l’iPhone.

Avec une interface pensée pour le petit écran tactile, cette version au design épuré est constituée de vignettes de prévisualisation imposantes pour pouvoir être cliquées du bout du doigt.
De la même manière, la page d’accueil présente les sujets les plus tendances et les résultats de recherche sont présentés de manière distincte, pour pouvoir facilement choisir le résultat désiré et visualiser la vidéo en mode plein écran.

Ainsi, depuis votre iPhone et quelle que soit votre localisation, vous pouvez chercher en temps réel dans les news multimedia des plus grandes chaînes d’information, et retrouver précisément les moments qui vous intéressent.

Testez Voxalead News sans plus attendre en vous rendant sur l’AppStore depuis votre iPhone !
Voxalead News est optimisé pour le mode WIFI.

Voxalead News iPhone

17 juillet 2009

Voxalead évolue, découvrez Voxalead News

Il y a quelques mois, vous aviez déjà plébiscité cette création de notre Labs, fruit du partenariat fructueux entre Exalead et Vecsys. Nous vous invitons aujourd’hui à découvrir une nouvelle version plus riche, plus verticale, nommée Voxalead News qui propose de rechercher directement dans les news vidéos et podcasts des plus grandes chaînes d’information (CNN, France 24, ABC, BBC, Europe 1, etc.).

Voxalead News repose sur Exalead CloudView et intègre le module de transcription “Speech-to-text” élaboré par Vecsys, dans le cadre de notre collaboration sur le projet Quaero.

voxalead-yab7

Avec Voxalead News :

- Vous recherchez par mots-clés dans plusieurs milliers de contenus multimédia mis à jour quotidiennement et plus
- Vous disposez d’une vision synthétique à jour de tous les sujets qui font l’actualité dans les médias : personnes, événements, pays, etc.
- Vous visualisez les vidéos directement aux moments clés correspondant à votre recherche
- Vous accédez à la transcription texte de la vidéo
- Vous retrouvez les personnes, lieux ou organisations cités dans la vidéo

voxalead-yab22

Voxalead est disponible en 4 langues: français, anglais, chinois et arabe.

Parmi les propositions, un module de type « timeline ». Disponible en cliquant sur « Show Timeline », cette fonctionnalité permet de visualiser les archives d’un média par mois ou année. Vous pouvez ainsi choisir un intervalle de temps qui vous intéresse et restreindre vos recherches en conséquence à l’aide de réglettes !

Voxalead News repose sur des technologies avancées de traitement du texte, d’extraction et de normalisation automatique des données, ce qui rend possible la génération automatique de termes associés et de tendances.

Pour les sites à contenus audio ou vidéo, ça peut aussi vous donner un bon coup de pouce en terme de référencement.

Venez découvrir cette nouvelle version d’Exalead News sur http://voxaleadnews.labs.exalead.com/

25 février 2009

L’ICOMTEC reçoit Exalead

Les étudiants du Master Intelligence Economique et Communication stratégique de l’ICOMTEC ont reçu le 21 janvier dernier Jean-Marc Lazard, Responsable des projets stratégiques chez Exalead.

Jean-Marc était venu présenter Exalead, ses travaux, ses innovations, à travers, entre autres, Exalabs et des dernières démos mises en ligne.

L’auditoire semble avoir apprécié l’approche technique et concrète de Jean-Marc qui a axé sa présentation sur la problématique de ces étudiants : la recherche et la gestion de l’information.

Jean-Marc a mis en avant le caractère innovant des solutions Exalead qui doivent pouvoir répondre aux nouveaux enjeux de l’accès à l’information dans les organisations.

“En tant que jeunes professionnels de la veille et de l’intelligence économique, il est apparu plus avantageux pour nous d’utiliser des solutions évolutives” commente Camille Alloing, un des étudiants du Master.

“Reste que cela a été un peu court, il nous aurait aussi plu de discuter plus en détail des pratiques d’intelligence économique d’Exalead en tant qu’entreprise.” conclue Camille.

… ce sera donc peut être pour une prochaine fois…

19 février 2009

Un moteur qui me comprend !

Derrière chacune de nos requêtes quotidiennes se cache une question.
Si on classe les requêtes par fréquence d’apparition dans les logs Exalead, il suffit d’un coup d’œil pour voir que les requêtes les plus fréquentes sont celles de type “favoris”.

Lorsque je tape “marmiton” (ouille …), je veux dire “Donne-moi l’url du site marmiton”. Sur les sites connus, c’est tellement plus simple de passer par un moteur que de fouiller les favoris de son navigateur ou les tréfonds de sa mémoire à long terme !

Lorsque je tape un ou deux mots génériques, comme “cuisine” ou “randonnée vercors”, je recherche les sites de référence d’un domaine.

Les algorithmes d’analyse de graphes permettent à nos moteurs préférés de nous apporter des réponses satisfaisantes à ces types de requêtes.

La “long tail” des requêtes utilisateurs cache des questions plus complexes, formulées sous forme de mots-clef ou en langage naturel.

- hauteur eglise madeleine : “Quelle est la hauteur de l’Eglise de la Madeleine ?” (30 mètres)

- définition TCP : “Que signifie TCP ?” (Transmission Control Protocol)

- inventeur barometre : “Qui fut l’inventeur du baromètre?” (Evangelista Torricelli)

Quoi de mieux qu’un système rapportant directement l’information, nous évitant ainsi de devoir aller chercher dans le détail des documents ?! Ces questions s’appellent des questions factuelles.

Dans un texte, on peut trouver la réponse à ces questions sous différentes formes.

Exemples :

* Torricelli, inventeur du baromètre (immédiat !)

* Aussitôt après l’invention du baromètre par Torricelli, (…) (phénomène : dérivation)

* L’italien Torricelli,mathématicien et physicien, découvrit le principe du baromètre. (phénomène : synonymie)

* Le nom de Torricelli est resté associé dans l’histoire au premier baromètre à mercure (phénomène: résolution de la formule “le premier N”)

* Le baromètre a été inventé par Torricelli. (phénomène : dérivation et prise en compte de la forme passive)

* Le mathématicien et physicien italien Evangelista Torricelli était aussi un disciple de Galilée. A la suite de diverses expériences sur la pression atmosphérique, il invente le premier baromètre à mercure. (phénomène : Résolution du pronom “il” avec “Evangelista Torricelli”)

* Zy va c’est pas PasKAL Ka FE le Bar au metre, C Torricelli ! (phénomène : glissement de la langue)



Pas toujours facile de formuler la bonne requête pour trouver LA réponse, mais il est possible au moteur d’avoir une démarche systématique afin de faire avancer le schmilblick.

· Comprendre la requête en identifiant les éléments signifiants (dans l’exemple précédent inventeur et baromètre)

· Identifier le type de réponse attendu (on cherche un nom de personne)

· Reformuler la requête (en tenant compte de la synonymie, des dérivations linguistiques …)

· Faire une analyse textuelle des passages retournés par le moteur

· Identifier les réponses possibles (des noms de personnes en l’occurrence)

· Proposer une réponse (juste !) et mettre en avant les éléments qui la justifient.

C’est un des sujets sur lesquels planchent la R&D d’Exalead, avec nos partenaires toulousains de Synapse Développement pour le Français et l’Anglais dans le cadre de Quaero, et nos partenaires portugais de Priberam pour l’Espagnol et le Portugais. Et un proto devrait prendre corps avant l’été … à suivre.

Et puis, il y a des questions plus difficiles à formuler : “L’écran de mon PC est tout bleu. Comment y remédier ?”. Là, il est peut-être un peu ambitieux de prétendre apporter une réponse toute faite :o ) … Mais pointer vers des pages qui font référence à un problème peut s’avérer d’une grande utilité.

Et puis, il y a des convergences possibles avec la reconnaissance vocale, la localisation géographique. Posez la question à votre IPhone …

Et puis, … bref, tant qu’on se posera des questions, on ne risque pas de s’ennuyer !

9 février 2009

Exalead image : de l’intérêt de l’indexation par le contenu

Tout le monde se souvient de Tom Cruise dans Minority Report, s’agitant comme un
damné devant un mur d’écrans et soumettant son ordinateur (apparemment doué de vie) les questions : « Montre moi les photos de MrX », « Repars en arrière », « Non pas là, à gauche et zoome un peu s’il te plaît» …

Si ce futur technologique ne tient sans doute pas entièrement de l’utopie, on peut
tout de même douter de la capacité des machines actuelles à interpréter aussi
facilement les intentions de son utilisateur.

Que se serait-il par exemple passé si Tom avait subitement demandé (aussi étrange que cela puisse paraître je vous l’accorde) à sa machine de lui montrer quelques images de Jaguar ?

Dans le monde de Minority Report on peut être certain que la machine en question se serait rendu compte de l’ambiguïté et lui aurait demandé d’une voix suave de préciser sa pensée : «La voiture ou l’animal ? »
Mais nous ne sommes pas dans le monde de Minority Report et pour l’instant les
moteurs de recherche (les bons) donneraient à Tom des résultats comme ceux-ci :

jaguar

Rien que de très logique ici : des voitures, des animaux et un avion de chasse (le jaguar est un avion de chasse franco-britannique pour les plus curieux d’entre vous).
Si nous admettons qu’un moteur de recherche ne peut pas deviner l’intention de l’utilisateur (ici le sens qu’il donne au terme « jaguar »), ce dernier se doit d’affiner sa requête en ajoutant certains mots clés discriminants.

Passionné de voiture britannique hors de prix, Tom transformerait ainsi la requête «jaguar» en la requête «jaguar voiture» et obtiendrait finalement les résultats suivants :

jag3

Sur le moteur web une telle méthode de recherche fonctionne systématiquement: il est en effet très vraisemblable qu’une page relative aux voitures de la marque jaguar contienne le terme jaguar tout comme le terme voiture permettant ainsi d’obtenir des résultats corrects pour la requête « jaguar voiture ».

Dans le cas des images, nous venons de voir que cette méthode pouvait aboutir à des résultats probants. Pour autant, reposer uniquement sur le texte s’avère risqué. En effet, le volume de texte associé à une image est nécessairement plus restreint pour éviter les erreurs (une erreur typique consiste à associer à une image contenue dans un tableau d’images le texte de l’image suivante du tableau).

Fort de ce constat, Exalead entreprend de prendre en compte une autre source
d’informations pour améliorer la recherche d’images : à savoir le contenu celles-ci (leurs pixels).
C’est dans cet objectif que le filtre visage a été mis en ligne (avec le succès qu’on lui connait) grâce aux technologies développées par LTU Technologies tout comme le filtre «photo» plus récemment.

Mais l’activité de recherche d’Exalead en image ne s’arrête pas là et Exalead collabore ainsi avec des acteurs académiques de premier plan dans le cadre de plusieurs projets (R2I, GEORAMA, QUAERO), en vue de tester les méthodes d’analyse d’images les plus innovantes qui permettront d’améliorer la pertinence de ses résultats ainsi que l’expérience utilisateur lors de la navigation.

8 janvier 2009

Miiget expliqué par son créateur

Les étudiants du Master en Intelligence Economique de Poitiers, qui étaient passés nous voir sur ICC, ont récemment repris contact avec Exalead. Ils en ont profité pour rencontrer Jérémie Bordier, Ingénieur Recherche et Développement au sein de Exalead et en savoir plus sur l’outil qu’il a créé : Miiget.

miiget

Qu’est-ce que Miiget ? Miiget est à la base un démonstrateur technologique pour exposer la capacité d’Exalead à créer de l’information structurée autour de personnes extraites directement à partir du Web… Cela vous semble encore obscur ?

Découvrez toute l’interview de Jérémie réalisée pour VIGIE, la newsletter du master de Poitiers (page 7) ou rendez-vous sur Exalabs, le laboratoire en ligne d’Exalead.

Découvrez également toute l’activité du Master de Poitiers à travers le site IE-Poitiers.

Jean-Marc Lazard, Responsable du Labs, interviendra le 20 janvier auprès des étudiants de Poitiers. Nous vous raconterons…