4.9.5.7Projet AngelStudio
Générateur d’Avatars Personnalisés
Équipe concernée : Analyse et synthèse des sons
Financement : FEDER-DRIRE Cap Digital Ile de France
Période de réalisation : mars 2009 - février 2010
Partenaires extérieurs : As An Angel, SoBuzzy, TélécomSud Paris
Coordinateur Ircam : Xavier Rodet
Le projet AngelStudio a pour objectif de développer un générateur d’avatars permettant de produire à partir de photos et d’échantillons de voix – correspondant à un utilisateur donné – un avatar de ce dernier, sous la forme d’un visage 3D photo réaliste, animé en temps réel et doté d’une voix de synthèse paramétrable.
L’objectif scientifique du projet est de parvenir à une reproduction de l’animation faciale et de la voix d’un utilisateur avec un niveau de simulation correspondant au seuil d’acceptabilité pour les utilisateurs. L’objectif industriel du projet est d’intégrer ce générateur aux solutions développées par les deux PME du consortium : As An Angel et SoBuzzy. Le développement du marché des agents conversationnels ainsi que de celui du Web3D se heurte à la dure réalité du seuil d’acceptabilité de l’utilisateur final.
De nombreux projets et études, conduits notamment par As An Angel (projet Agent Conversationnel Expressif), le Laboratoire Informatique de Grenoble (ex CLIPS) et le réseau d’excellence HUMAINE, ont montré que ce seuil, qui peut certes varier d’une culture à une autre, reste globalement très élevé. En effet, les attentes des utilisateurs, modelées notamment par la littérature et le cinéma de science-fiction, correspondent à une simulation crédible de l’humain, tant au niveau des capacités de dialogue qu’à celui de la représentation et l’animation d’un visage et d’un corps de synthèse. Le projet AngelStudio vise donc à permettre à des agents conversationnels ou à des avatars d’atteindre le seuil d’acceptabilité pour deux modalités de communication :
-
l’animation faciale expressive de visages « photo-réalistes » ;
-
la simulation crédible d’une voix humaine expressive.
L’Ircam prend en charge le développement et la fourniture d’algorithmes de conversion d’identité de voix, et la fourniture d’algorithmes de transformation d’expressivité de voix, des phrases synthétisées par un système de synthèse à partir de texte (TTS) du marché ou par celui de l'Ircam (Ircam TTS).
Dostları ilə paylaş: |