Unité mixte de recherche Ircam-cnrs



Yüklə 1,72 Mb.
səhifə287/312
tarix02.01.2022
ölçüsü1,72 Mb.
#15570
1   ...   283   284   285   286   287   288   289   290   ...   312

4.9.5.7Projet AngelStudio


Générateur d’Avatars Personnalisés

Équipe concernée : Analyse et synthèse des sons

Financement : FEDER-DRIRE Cap Digital Ile de France

Période de réalisation : mars 2009 - février 2010

Partenaires extérieurs : As An Angel, SoBuzzy, TélécomSud Paris

Coordinateur Ircam : Xavier Rodet
Le projet AngelStudio a pour objectif de développer un générateur d’avatars permettant de produire à partir de photos et d’échantillons de voix – correspondant à un utilisateur donné – un avatar de ce dernier, sous la forme d’un visage 3D photo réaliste, animé en temps réel et doté d’une voix de synthèse paramétrable.

L’objectif scientifique du projet est de parvenir à une reproduction de l’animation faciale et de la voix d’un utilisateur avec un niveau de simulation correspondant au seuil d’acceptabilité pour les utilisateurs. L’objectif industriel du projet est d’intégrer ce générateur aux solutions développées par les deux PME du consortium : As An Angel et SoBuzzy. Le développement du marché des agents conversationnels ainsi que de celui du Web3D se heurte à la dure réalité du seuil d’acceptabilité de l’utilisateur final.

De nombreux projets et études, conduits notamment par As An Angel (projet Agent Conversationnel Expressif), le Laboratoire Informatique de Grenoble (ex CLIPS) et le réseau d’excellence HUMAINE, ont montré que ce seuil, qui peut certes varier d’une culture à une autre, reste globalement très élevé. En effet, les attentes des utilisateurs, modelées notamment par la littérature et le cinéma de science-fiction, correspondent à une simulation crédible de l’humain, tant au niveau des capacités de dialogue qu’à celui de la représentation et l’animation d’un visage et d’un corps de synthèse. Le projet AngelStudio vise donc à permettre à des agents conversationnels ou à des avatars d’atteindre le seuil d’acceptabilité pour deux modalités de communication :


  • l’animation faciale expressive de visages « photo-réalistes » ;

  • la simulation crédible d’une voix humaine expressive.

L’Ircam prend en charge le développement et la fourniture d’algorithmes de conversion d’identité de voix, et la fourniture d’algorithmes de transformation d’expressivité de voix, des phrases synthétisées par un système de synthèse à partir de texte (TTS) du marché ou par celui de l'Ircam (Ircam TTS).


Yüklə 1,72 Mb.

Dostları ilə paylaş:
1   ...   283   284   285   286   287   288   289   290   ...   312




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin