Projet veille & intelligence artificielle



Yüklə 134,58 Kb.
tarix28.10.2017
ölçüsü134,58 Kb.
#17756

Projet veille & intelligence artificielle

Fabienne Carpentier – Emeline Hemery


Projet veille & intelligence artificielle

Fabienne Carpentier – Emeline Hemery







Projet de veille

« Faire le point sur la Synthèse Vocale & technologies de la voix dans le but de mettre en place un serveur vocal de consultation des comptes bancaires pour nos clients »
I. Panorama global : Les technologies de la voix

II. Focus sur la synthèse vocale

III.Méthodologie

Sujet global : Mise en place d’un service multimédia de consultation de comptes utilisant la technologie de synthèse vocale.

Rôle occupé: DSI d’une grande banque Française
Nous sommes toutes deux rattachées au département des systèmes d’information d’une grande banque française. Dernièrement, la direction nous a soumis le souhait de renouveler leur offre en ce qui concerne la gestion des informations banque > Client (En particulier la consultation & la gestion de comptes) en nous demandant de privilégier les NTIC dans ce nouveau projet. Lors du lancement de ce projet nous avions énoncé l’utilisation de solutions de synthèse vocale.
Dans le cadre de ce projet, nous sommes donc en charge d’établir des plans de veille :

  • Concernant les possibilités marketing de ce nouveau service client.

  • Concernant la technologie et les offres qui y sont liées.

  • Notion de sécurités inhérentes à ce genre de système multimédia touchant à des données personnelles


Mots clés que nous souhaiterions utiliser lors la mise en place de notre plan de veille :

  • Synthèse vocale/ de la parole

  • Reconnaissance vocale

  • Technologie de la voix

  • Lecture assistée par ordinateur

  • Automate(s) intelligent(s)

  • Consultation interactive de compte

  • Service(s) bancaire(s) multimédia

  • Réseaux privé(s)



Acteurs du domaine





  • Pour la partie marketing 

Les autres banques, les offres commerciales


  • Pour la partie technique

Les laboratoires de recherche (Français, Suisses et québécois), universités, les offres commerciales, réseau informel { informaticiens – linguistes }, les entreprises et leur dpt R&D), listes de diffusion & articles de presse Internet, colloques, Entreprises de jeux vidéo, services et associations de recherche médicale pour le handicape. Mais aussi les bases de données du type DIALOG.


  • Pour la partie sécurité

Revue en ligne, magazine informatique, offres commerciales
__________________________________________________________
Ce document est une synthèse des informations que nous avons pu recueillir sur les technologies de la voix, plus particulièrement de la synthèse vocale. Il se présente sous forme d’un état de l’art succinct des aspects qui nous intéressent : Les possibilités offertes par l’offre actuelle en synthèse vocale & la meilleure approche pour notre cas. Même si elles ont été citées dans la page précédente les veilles concernant  la sécurité & les aspects concurrentiels ne seront pas exposées, nous essaierons néanmoins de mettre en lien ces différents types de veille dans notre partie « méthodologie », pour voir comment le croisement des 3 perspectives permet de dresser une cartographie très précise de notre sujet.
Il n’est donc pas question ici de redresser l’histoire des technologies de la voix des années 50 à nos jours (et bien avant en réalité !), mais simplement d’éclairer nos commanditaires sur notre démarche de veille, mais surtout ses résultats…
Ce programme de veille nous est apparu comme un puzzle dont l’image à reproduire nous apparaissait au fur et à mesure de nos découvertes. A l’heure actuelle, même si nous avons constitué les limites (les bords pour continuer la comparaison) nous sommes loin d’avoir découvert entièrement la représentation que nous étions en train de construire. C’est pourquoi nous nous sommes concentrées sur la méthodologie à adopter, plus qu’à l’exposé du contenu théorique de notre travail de veille.
__________________________________________________________
I

TECHNOLOGIES DE LA VOIX : PANORAMA GLOBAL

Pour cette première partie nous avons survolé le fonctionnement des technologies de la voix et pour dresser un panorama global de ce que peuvent représenter ces technologies à l’heure actuelle. Nous sommes donc restées très généralistes concernant ce sujet, même si l’étendu de ce que nous avons découvert nous apparaît plus large.


  1. UNE INTRODUCTION

Le marché des technologies vocales est constitué de trois segments distincts dans les services offerts :




  • Les services de télécommunications

  • Le vocal embarqué (dans les terminaux ou dans les équipements industriels)

  • La dictée vocale

Chacun de ces domaines d’application sera abordé avec plus de précision.


La reconnaissance et la synthèse vocale sont deux technologies de base de ce domaine, mises en œuvre dans la création de dialogue Hommme-Machine. La reconnaissance permet à la machine d’identifier ce que dit un interlocuteur, tandis que la synthèse vocale permet à la machine de restituer de manière vocale un message codé à partir d’une forme écrite.
Les usages des services vocaux sont déjà nombreux, ils permettent par exemple :


  • d’établir une communication en prononçant simplement le nom d’une personne (annuaire)

  • accéder à distance à des services dont le contenu est vocal ou textuel (exemple lecture de mail)

  • Disposer d’un accès multi service à partir du téléphone

  • Pallier un handicape ( mal voyance – surdité – problème de mobilité)




  1. LES TECHNOLOGIES

Les technologies vocales permettent aujourd’hui d’améliorer l’accès à certains services existants et devront permettre à l’avenir d’en proposer de nouveaux. Plusieurs facteurs permettent le développement de ces services : d’une part l’amélioration des performances liées aux technologies de la voix ( Amélioration des performances dans les laboratoires de recherche et départements r&d des entreprises du milieu) : Meilleure fiabilité pour la reconnaissance vocale et évolution vers une voix plus naturelle (son et prosodie) pour la synthèse. D’un point de vue matériel et économique, l’augmentation de la puissance des machines et du volume de stockage profite aussi à une ‘démocratisation’ de ces technologies de pointe.




  • La reconnaissance de la parole

La reconnaissance vocale est la possibilité pour une machine, un ordinateur de reconnaître des messages oraux d’un utilisateur humain. Il y a de nombreuses applications à ce type de technologie, les plus répandues étant la commande vocale (donner un ordre qui sera compris de la machine) et la transcription écrite (dictée vocale). Le processus de reconnaissance qui est engagé dans ces deux types d’applications peut être assez complexe. Dans le cas de la dictée vocale par exemple, le système doit être capable, non seulement de retranscrire en une chaîne phonétique les sons prononcés (en tenant compte des caractéristiques propres à la voix de chacun), mais il doit également utiliser un savoir sur la langue qui doit lui permettre de lever les ambiguïtés linguistiques inhérentes au langage naturel.


Les systèmes de ce type (reconnaissance vocale) sont typiquement composés de deux modules fonctionnels :


  • L’un reçoit le signal (la parole de l’usager) et l’analyse en effectuant des mesures sur ces signaux.




  • L’autre effectue le décodage en comparant l’énoncé de l’usager à des modèles de parole ou sont représentées les phrases et les prononciations.

Certains systèmes sont dits multi-locuteurs (ils sont capables de reconnaître les énoncés produits par plusieurs locuteurs). D’autres ne peuvent reconnaître qu’une seule personne après un temps d’apprentissage. (c’est souvent le cas avec des logiciel grand public du type Dragon naturally speaking)


De la même manière, il existe des différentiations dans les modes d’élocution : mot à mot (mots isolés), plusieurs mots enchaînés ou encore tous les mots de la phrase.
En ce qui concerne la reconnaissance vocale, les performances dépendent directement de l’environnement dans lequel le processus est opéré. L’environnement étant un contexte important dans la conception de ce type de système.


  • La synthèse de la parole

Un système de synthèse vocale à partir du texte reçoit en entrée une forme textuelle et produit en sortie le signal de parole correspondant a la forme vocalisée de ce texte. La synthèse de la parole va permettre de générer automatiquement le signal correspondant à la vocalisation d’un texte écrit. Elle constitue une alternative au pré-enregistrement de données vocales pré-déterminées (scénario de dialogue enregistré). Ce type d’application peut se retrouver dans l’utilisation des nouvelles technologies telles que l’email, le téléphone portable et les services interactifs ou d’autres encore que nous explorerons.




  • Le dialogue vocal

On ne peut pas parler de « technologie » du dialogue puisque ce mode de fonctionnement est un couplage des technologies de synthèse et de reconnaissance vocale

Ce principe utilise en fait les deux technologies précédemment citées (reconnaissance et synthèse), le dialogue vocal suit la logique utilisateur plus qu’une logique applicative, Il existe différents types d’interaction vocale possibles, dont les complexités et le coût sont croissants. Ce « mode dialogue » se découpe en trois niveaux « de difficulté » pour ce type d’exercice :
Niveau 1 : le dialogue directif par mot clef
C’est un mode où l’utilisateur ne prononce qu’un seul mot à la fois.
Exemple : Automates type Banque
Machine : « pour consulter vos compte dites ‘comptes’ »

Homme : « comptes »


Niveau 2 : Dialogue de type ‘ouvert’
Les questions sont plus ouvertes, les réponses apparaissent plus spontanées. La mise en place de ce type de système nécessite une analyse linguistique des patrons de phrases ainsi qu’une anticipation du lexique qui sera utilisé. Ce mode est toujours basé sur l’utilisation de mots clés, mais contrairement au niveau 1 plusieurs mots peuvent être prononcés à la fois.
Exemple : Automate type Banque
Machine : « Quel solde désirez vous consulter»

Homme : « le solde du compte 1234 »

Homme : « Je veux consulter le solde de mon compte chèque »

Homme : «J’aimerais connaître le solde du compte 1234  »

Machine : « 
Niveau 3 : dialogue en langage naturel
L’utilisateur est ‘libre’ de son discours, on parle de coopération ‘homme machine’. Ce troisième niveaux demande une couverture très importante au niveau du vocabulaire comme au niveau sémantique. Même si le système est utilisé dans un domaine très particulier. L’utilisateur parle de sa propre initiative. Ce mode permettra par exemple de traiter les surplus d’informations comme les carences ; les changements de sujet ou des parades linguistiques plus évoluées qu’en niveau 1 et 2.
Exemple : Automate type banque consultation / opérations
Machine : « Quelle opération voulez vous effectuer »

Homme : « un virement »

Machine : « oui, à partir de quel compte ? »


Machine : « Quelle opération voulez vous effectuer »

Homme : « un virement de 1000 € de mon compte épargne à mon compte chèque »

Machine : « Désolée, les virements sont plafonnés à 100 € »

Homme : « Faites un virement de 100 € alors ! »


Machine : « Quelle opération voulez vous effectuer »

Homme : « Un virement de 100 € sur mon compte chèque à partir de mon compte d’épargne »

Machine : « Patientez, nous vérifions votre solde »

Machine : « vous êtes autorisé à effectuer ce virement. Nous transférons 100 € de votre compte chèque 1234 vers votre compte d’épargne 4567 »


Machine : « Quelle opération voulez vous effectuer »

Homme : « j’aimerai connaître le solde de mon compte dépôt »

Machine : « Oui, de quel compte dépôt désirez vous connaître le solde, le compte 1234 ou le compte 4567 . »

Homme : « Combien me reste t il sur mon compte 1234 ? »


Certains services simples vont parfaitement être satisfaits par des systèmes fonctionnant sur les types 1 et 2 tandis que d’autres plus compliqués, plus lourds seront mieux appréhendés par des automates utilisant des traitements et technologies du niveau 3. Le temps de développement et le coût de mise en place sont alors beaucoup plus élevés.




  1. Ergonomie Linguistique

L’ergonomie s’intéresse avant tout aux besoins et aux comportements d’un utilisateur (des utilisateurs). Elle vise dans le cas des technologies vocales à définir chaque étape de conception d’une application : Organisation du dialogue, les erreurs, la définition du vocabulaire, les aides possibles, les commandes possibles.


L’interface doit, grâce au travail d’ergonomie ( Qui s’appuie sur les sciences cognitives), être conçue pour être efficace, mais aussi agréable et facile à utiliser pour l’utilisateur final. L’ergonome doit donc étudier d’une part les contraintes imposées par le service qu’il doit mettre en place : contraintes langagières (vocabulaire par exemple), les contraintes matérielles (liées au type de support sur lequel va être utilisée l’application) et d’autre part les contraintes imposées par l’utilisateur : quelle est la cible du service, sexe, age, accent, origine, motivation, culture … Et enfin l’ergonome doit prendre en compte les contraintes liées à la tache en elle-même (complexité, durée …)

II

FOCUS : LES SYSTEMES DE SYNTHESE VOCALE

Les systèmes de synthèse vocale (restitution à partir d’une entrée texte d’une chaîne acoustique ) sont composés de deux blocs de traitements :


- d'un bloc de traitements linguistiques. Ce bloc produit une analyse du texte a vocaliser, détermine la suite phonétique correspondante et lui attache des consignes prosodiques destinées à introduire une certaine "mélodie" lors de la synthèse (filtres prosodiques).

- d'un bloc de traitements acoustiques. II génère le signal de synthèse en concaténant des segments de parole naturelle préalablement stockés, obtenus a partir de I'enregistrement d'un locuteur expert (un acteur).





Figure : issue de G. Vannier "Etude des contributions des structures textuelles et syntaxiques pour la prosodie : application à un système de synthèse vocale à partir du texte"

La problématique étant de disposer d'une base de données suffisamment riche et d'une algorithmique élaborée pour permettre de sélectionner la séquence de phonèmes la mieux adaptée pour la production du signal de parole attendu en sortie. Actuellement, la plupart des systèmes par corpus utilisent des bases de données acoustiques de très grande taille pour permettre un rendu prosodique le plus intéressant possible.





  1. Fonctionnement global

Grossièrement, le texte à synthétiser est transformé en suite de phonèmes (unité minimale sonore) auxquels on applique un filtre prosodique.


Les principales offres du marché se différencient les unes des autres par la qualité de cette prosodie restituée par la machine, c’est ce qu’on appelle « le naturel » mais aussi par le nombre et la qualité des langues couvertes par l’offre. La qualité du timbre de voix étant un critère important dans l’évaluation de ce type de système. D’un point de vue technologique ( texte son ), les éditeurs s’accordent à dire que nous avons atteint une certaine maturité, c’est donc du point de vue de la qualité que va se faire l’appréciation d’un système par rapport à un autre.
Les premiers systèmes de synthèse vocale procédaient par concaténation des unités acoustiques en utilisant des dictionnaires acous­tiques de taille réduite (environ 5 Mo par voix) ou chaque unité (diphone) avait un seul représentant acoustique. Pour respecter les consignes prosodiques prédîtes, d'importantes déformations étaient alors nécessaires. Ces modifications engendraient cependant des dégradations de la qualité de la parole synthétisée.
La disponibilité récente de ressources informatiques importantes a permis l'émergence de solutions nouvelles, regroupées sous I'appellation de "synthèse par corpus". Dans cette approche, la base de données acoustiques ne se restreint pas a un dictionnaire de diphones mono-représentés, mais contient des unités de taille variable (diphones, triphones, syllabes, etc.) enregistrées dans différents contextes linguistiques (d’après des corpus vocaux) et prosodiques (milieu de phrase, fin de phrase, groupe interrogatif,etc.)
De plus, une prise en compte de paramètres liés à la prosodie pour la sélection des unités acoustiques devrait a terme permettre de reproduire la proso­die la plus satisfaisante. Ces améliorations, qui constituent une véritable rupture, permettront de restituer un signal synthétique très proche de la parole naturelle.
Synthèse par concaténation d’unités acoustiques1
Chaîne d’éléments acoustiques concaténés


Néanmoins, Les efforts qui sont faits sont encore à relativisés :


  • Nous n’avons pas atteint l ‘excellence de HAL2 ! (nous ne confondons jamais une production venant d’un automate avec celle d’un locuteur humain.

  • Ecoute difficile sur un long moment, ces systèmes s’adressent donc à des messages courts et hautement informatifs ( Ce qui s’applique au système que nous désirons mettre en place)

  • Le sujet technologique est loin d’être clos malgré son appropriation par le milieu industriel (voir B. Le marché)

  • Il reste encore de nombreuses pistes à consolider autant au niveau linguistique qu’acoustique :

    • amélioration de l’intelligibilité et de la qualité

    • utilisation de modèles sémantiques

    • Mise en évidence des émotions

    • les styles de voix (timbre et prosodie)




  1. Le Marché

Sous I'impulsion des nouveaux usages, le marché des solutions vocales est en pleine expansion. L’an dernier, en Europe, des sociétés importantes comme British General Motors , RATP 3 (serveur SIEL), SNCF (RECITAL), Chronoposte 2 … ont déployé des applications de Synthèse vocale.


Parmi les solutions, ce n’est pas les technologies ni les offres de serveurs vocaux6 qui nous intéressent bien que nous ayons rencontré dans notre veille de nombreuses mentions à ces produits et technologies (Services Vocaux Interactifs dits « traditionnels » diffusant des voix enregistrées). Nous avons donc uniquement considéré le marché des solutions s'appuyant sur des technologies vocales dites évoluées, c'est-à-dire incluant reconnaissance et/ou synthèse vocale.
Dans cette dernière catégorie, le marché se partage en trois postes fondamentaux :
- les logiciels " vocaux ", reconnaissance, synthèse et dialogue en langage naturel;

- les plates-formes vocales et les infra­structures techniques matérielles et logicielles;

- la conception (en elle-même) du service.


  • Données financières

En moyenne le coût du logiciel vocal représente 15% du coût global du service hébergé sur sa plate-forme. Si le service a une vocation commerciale, l'investissement sera supérieur, le retour se faisant alors sur la vente réalisée grâce à ce media. Cet aspect est important pour nous, car en mettant en place un tel service, nous espérons drainer d’une part de nouvelles inscriptions à notre banque, mais aussi de nouvelles inscriptions aux services multimédias.




  • Acteurs du marché4


Nuance et Speech Works se partagent la moitié de ce marché, les autres acteurs principaux étant ScanSoft5 (qui a racheté très récemment Philips6), IBM, Loquendo et Telisma (issue de France Telecom R&D et qui exploite les technologies de reconnaissance vocale initialement développées par France Telecom R&D).
On estime7 que I'activité générée par ces services, exprimée en revenus provenant des clients utilisateurs, passera de 600 millions de dollars en 2001 a 25 milliards en 2006.

(L’Europe étant au 5eme rang)


- Les solutions embarquées
Le marché des technologies embarquées, sous I'influence de la forte croissance des mobiles, de I'équipement automobile et de l'introduction de processeurs et de mémoires dans les biens de consommation électroménagers, va progresser plus vite encore que celui des réseaux.

III

METHODOLOGIE

Pour mettre en avant les quelques points que nous avons énoncés dans les deux parties précédentes, nous avons effectué une veille regroupant différents aspects que peuvent revêtir les technologies de la voix et plus particulièrement la synthèse vocale. Ce premier travail nous aura permis de dresser un panorama. Néanmoins, la veille n’a pas été assez profonde pour nous permettre de prendre des décisions définitives quant à notre système. Ce premier travail nous aura pourtant permis de mettre en avant différentes choses dont n’avions pas perçu la porté.




  • L’ergonomie

  • L’aide au Handicape

  • Le Dialogue (couplage synthèse / reconnaissance)

  • Les différents niveaux de complexité induit par des systèmes d’IA

  • Les thèmes de recherches explorés actuellement



Méthodologie de veille :



  1. Veille Technologique 1 : La Synthèse vocale

Pour notre veille technologique nous nous sommes principalement orienté vers Internet, nous avons parcouru la littérature sur le sujet en adoptant une attitude relativement prudente quant aux sources des documents (de nombreux site à vocation commerciale ont tendance à fournir une information enjolivée, ces sites nous ont pourtant été d’une grande utilité pour dresser un panorama des grandes entreprises françaises (notre référent) qui utilisent ce type de services. C’est ainsi que nous nous sommes basées sur des travaux et publications scientifiques spécialisées : Informatique, linguistique, informatique linguistique, rapports de conférences …

Le milieu universitaire étant une ressource importante quand il s’agit de jugé de la qualité des résultat d’un produit.
Ce sont les résultats de cette veille qui vous sont présentés de façon succincte. Nous n’avons pas détaillé les aspects techniques de la synthèse vocale (notamment les apports linguistiques ou les éventuelles contraintes de rédaction des messages, le contenu informatif des documents que nous avons pu consulter étant beaucoup plus étendu, nous avons préféré donner un état de l’art « léger » et baser notre compréhension du sujet dans la méthodologie de veille que nous avons employée.
Nos sources pour cette partie du travail :
Linguistique :


  • Revue ATALA (http://www.atala.org/)

  • LN@cines.fr, LN-FR@cines.fr (listes de diffusion de l’Atala)

  • Thèses et laboratoires de recherche en linguistique informatique


Informatique :

  • Le journal du net

  • Le monde Informatique

  • Réseau Informel


Commentaires : Cette partie nous aura permis de mettre en évidence certaines limites fonctionnelles de la synthèse vocale telle qu’elle est actuellement. Néanmoins, ces limites ne semblent pas être bloquantes pour le produit que nous voulons mettre en place : Les informations sont en nombre limité, très formalisées et le message à produire est très court.


  1. Veille Technologique 2 : La sécurité

Nous avons éclipsé la veille technologique concernant la sécurité et l’accès aux données pour des raisons pratiques de temps.


Nos sources pour cette partie du travail (pour commencer):

  • Magazines spécialisés

  • Evidian.com

  • www.vpnc.org

  • zdnet.com sur la sécurité des réseaux




  1. Veille juridique

De même nous ne nous sommes pas penchées sur l’aspect juridique inhérent à ce type de services, pour lesquels transite un grand nombre de données personnelles. Cette veille (pouvant être effectuée en collaboration avec un juriste de l’entreprise) aurait permis de compléter totalement le panorama des services que nous pouvons offrir à nos clients et futurs clients, de façon à élaborer un cahier des charges cohérent qui nous aurait servi de base pour nos tests sur logiciels.


Nos sources pour cette partie du travail (pour commencer):

  • Magazines spécialisés

  • Legifrance

  • Un conseillé juridique de l’entreprise




  1. Veille commerciale

Pour la veille commerciale que nous avons entamée, nous nous sommes principalement posé la question des applications quotidiennes des technologies vocales pour le grand public et nous avons délimité les acteurs principaux du domaine. Autour de ces grands acteurs gravitent d’autres acteurs plus ‘mineurs’ mais qui n’en demeurent pas moins intéressants. A terme, il aurait été intéressant de comparer les fonctionnalités, les apports possibles de chacune des solutions, dans le but de les tester.




  • Produits commerciaux

Voici la liste globale d’éditeurs de plate-formes et technologies de synthèse vocale (niveau international) que nous avons relevés :


AGI International, ASA Solutions, Accuvoice, Altigen, Altitude Software, Amcom Software Inc, Amdev Communications, Apropos Technology, Artisoft, Aspect Communications, Avaya, CTT, Cadcom Telesystems, Call Sciences, CallMiner, Cambridge Voice Tech, Centerpost Corporation, ConServIT, Convergys, EPOS Corporation, Eckoh Technologies, Edify, Engenic, Fluency, Frank Solutions, Frontworks, Genesys Telecommunications Labs, Inc. , IBM Pervasive Computing, Interactive Intelligence Inc., Intervoice Inc. , LocusDialog, LumenVox, Metaphor Solutions, Microlog, NetByTel, Prosodie Interactive, SAP, SOFTEL Communications Inc., Symbionautics, Corporation, TARGUSinfo, TIME Communications, Televoice, Tellme Networks, Tuvox, Unveil, Technologies, Vecsys, Viecore Inc., Voice Automation Inc., Voice Technologies, Vortecs Inc., West Corporation, Wind Telecom, Witness Systems, WorldCom Inc.,speechvantage Inc.
Nos sources pour cette partie du travail :


  • http://www-3.ibm.com/software/pervasive/products/voice/voice_technologies.shtml

Commentaires : produits utilisant les technologies de la voix d’IBM


  • http://www.vecsys.fr/produits/index.htm




  • http://www.kerpape.mutualite56.fr/pageacc/services/page32/page321/p3213.htm

MUTAVOX : Appareil de communication utilisant des langages symboliques avec sortie du message en synthèse vocale. Il s'adresse en priorité à des personnes I.M.C. (infirmes moteurs cérébraux). L'originalité du MUTAVOX est de posséder un module linguistique qui recompose un message à base d'une succession de pictogrammes en un message sonore correct du point de vue de la syntaxe et de la conjugaison. Ce produit ne nous intéresse pas directement, en revanche il nous informe sur l’existant (au niveau de l’offre).

  • http://www.weblmi.com/articles_store/963_45/Article_view

Panorama des interfaces client (logiciels de CRM, dont ceux qui utilisent les technologie de la voix : Elan Speech, IBM, Microsoft, mais aussi TLM Com, Scansoft (anciennement Lernout & Haupsie ), Telisma (distribution de produit de recherche de FT) …




  • http://www.framacom.com/

Information commerciale sur les serveurs vocaux .




  • http://www.speechtechmag.com/

Liste de diffusion et magazine de référence sur les technologies de la voix (reconnaissance comme synthèse). Cette source découverte relativement tard dans notre processus de veille nous a permis de découvrir des acteurs du marché tels que les intégrateurs de solutions, les plateformes d’hébergement ou encore les éditeurs.




  • Plus les sites des entreprises en question ( l’exploitation des sites commerciaux est une partie que nous n’avons pu effectuer, néanmoins, elle aurait représenté une prochaine étape de la mise en place de notre projet)




  1. Veille concurrentielle

La veille concurrentielle s’est orientée quant à elle vers des sources très diverses : Journaux spécialisés, prospectus grands publics, relations personnelles, nous sommes également allées démarcher dans les banques concurrentes pour étudier les produits commercialisés. La totalité des banques concurrentes possède de tels services (nous n’avons malheureusement pas pu en tester la qualité et la facilité d’accès), il est donc évident que l’installation d’un tel système est pour nous obligatoire. Nous nous sommes également penchées sur les produits que nous proposions à nos clients en terme de consultation de compte (Internet nottament) Ce qui nous a permis de nous rendre compte qu’une étude avait déjà était réalisée dans le domaine juridique (accès aux données). Il peut être intéressant de consulter la personne responsable.


Cette étude est à coupler avec une étude des profils de nos usagers, de façon à ce que la mise en place de ces modules vocaux se déroule avec le plus de facilité.

I partie : Produits multimédia des autres banques françaises


Nos sources pour cette partie du travail : BNP – CAISSE D’EPARGNE – CREDIT LYONNAIS – SOCIETE GENERALE – CREDIT AGRICOLE – Connaissances en Interne

Mais aussi :




  • www.afrc.org

Site de l’association française des centres de relation clients


  • Autres adresses utiles




  • http://connectsciences.inist.fr

  • http://www.lpl.univ-aix.fr/sp2002/

  • http://csidoc.insa-lyon.fr/sapristi/digest.html

  • http://www.agentland.fr/cgi-bin/relocationFR.cgi?http://www.agentland.fr/pages/learn/susac/talking_2-3.html

  • http://www.yanous.com



  • http://www.recherche.gouv.fr/technolangue/presentation/default.htm

  • Le projet technolangue

Projet technolangue est un appel d’offre public concernant les technologies du traitement automatique des langues. Il peut être intéressant pour nous de connaître les résultats de cet appel pour découvrir des éditeurs/ fournisseurs de solutions émergeant dans le domaine ( A coupler avec une lecture des listes de diffusion concernant le sujet ln-fr, par exemple)



1 Source : Compte rendu Séminaire Technologies vocales – Lannion 22 mai 2002

2 2001, « Odyssée de l'Espace » de Stanley KUBRICK, d'après Arthur C.CLARKE

Source : http://www.lesechos.fr/formations/manag_info/articles/article_5_10.htm

2 Source : http://www.vecsys.fr/applications/applis-vocales.htm (mini démo en ligne)

33 Source : http://solutions.journaldunet.com/0302/030221_chronopost.shtml

2


6  : http://www.weblmi.com/articles_store/963_45/Article_view



5 Site institutionnel : http://www.scansoft.fr/products/

6 Source : http://www.entreprises.epita.fr/nl/newsletter_336.htm

7 Source : Compte rendu Séminaire Technologies vocales – Lannion 22 mai 2002

/ /

Yüklə 134,58 Kb.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©muhaz.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin