Sommaire general


VOXALEAD Les vidéos ont enfin leur moteur de recherche



Yüklə 212,87 Kb.
səhifə14/31
tarix10.01.2022
ölçüsü212,87 Kb.
#99753
1   ...   10   11   12   13   14   15   16   17   ...   31

VOXALEAD Les vidéos ont enfin leur moteur de recherche


Retrouver une vidéo en tapant les mots qui y sont prononcés, c’est ce que propose pour la première fois aux internautes la société française Exalead avec son nouveau moteur de recherche baptisé Voxalead (http://voxaleadnews.labs.exalead.com). Sans équivalent, ce service s’appuie sur des technologies de traitement de la parole développées entre autres par des chercheurs du CNRS. Celles-ci permettent de retranscrire sous forme de texte tous les mots prononcés dans une vidéo. L’internaute peut ainsi dénicher très rapidement l’information qui l’intéresse en tapant simplement un mot ou une expression. Il est alors envoyé directement au passage de la vidéo durant lequel le mot en question est prononcé. Pour l’instant, Voxalead indexe uniquement les vidéos provenant de chaînes d’information, et ce, en six langues : le français, l’anglais, le chinois, l’arabe, l’espagnol et le russe. Dans quelques années, d’autres sources d’information et d’autres langues devraient être disponibles. Si quelques tentatives ont déjà eu lieu sur la Toile pour offrir ce type de service, Voxalead, soutenu par le programme de recherche et d’innovation Quaero, est le premier moteur à atteindre une telle finesse de recherche et à proposer autant de langues aux internautes. « Cette technologie est le résultat de plus de vingt années de recherche sur la reconnaissance de la parole », confie Jean-Luc Gauvain, chercheur au Laboratoire d’informatique pour la mécanique et les sciences de l’ingénieur (Limsi) (Laboratoire CNRS / Universités Paris 6 et 11), à Orsay. C’est dans ce laboratoire qu’ont été développées les techniques utilisées aujourd’hui par Exalead. « À partir du dictionnaire complet d’une langue, de la façon dont chaque phonème se prononce suivant sa place dans un mot et dont les mots s’organisent pour former une phrase, nous construisons un modèle statistique qui permet d’identifier dans une phrase prononcée la séquence de mots la plus probable, commente le chercheur. Chaque langue a sa difficulté, par exemple la prononciation pour l’anglais, la syntaxe pour le français. Il faut donc prendre en compte ces spécificités dans nos modèles. » La méthode est particulièrement efficace quand l’élocution de la personne est claire. Le commentaire du présentateur d’un journal télévisé, la voix off d’un reportage ou encore le discours d’un homme politique (Le site Web de l’Élysée utilise Voxalead depuis le 29 mars dernier pour indexer tous les discours du président de la République.) sont ainsi retranscrits avec très peu d’erreurs. Par contre, dès que le langage devient spontané (micros trottoirs, débats en direct...), la technique se fait moins précise. Les chercheurs du Limsi travaillent actuellement à améliorer cet aspect-là, en affinant un peu plus encore leur modèle. À terme, Voxalead devrait ainsi être capable de retranscrire tous types de vidéos. « Après les informations, il sera bientôt possible de proposer aux internautes une recherche sur les podcasts et les cours en ligne », note Jean-Luc Gauvain. Et pourquoi pas, un jour, sur les millions de vidéos postées sur YouTube et Dailymotion.

Julien Bourdet

Contact : Jean-Luc Gauvain, gauvain@limsi.fr

Retour sommaire



Yüklə 212,87 Kb.

Dostları ilə paylaş:
1   ...   10   11   12   13   14   15   16   17   ...   31




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin