1.2.1.2.1La reconnaissance vocale
La reconnaissance vocale qui a fait des progrès considérables permet de dicter directement les e-mails ou des rapports (c'est le cas d'ailleurs du présent rapport)
Elle s'impose pour des raisons d'ergonomie pour les usages nomades et pour des raisons de sécurité pour les utilisations par un conducteur
Un nouveau standard VoiceXML a été développé pour la navigation vocale
Les leaders de la dictée vocale sont Via Voice d'IBM www.software.ibm.com/speech et l'éditeur américain Scansoft qui a racheté les principaux brevets de Lernout & Hauspie de reconnaissance vocale grand public (Dragon Naturally Speaking) www.dragonsys.com et professionnelle (Automatic speech recognition) ainsi que celles de synthèse vocale (Text-to-speech et RealSpeak).
Nuances www.nuance.com , système multilocuteur de reconnaissance qui permet de prendre les ordres de bourse par téléphone www.voxml.com et SpeechWorks www.speechworks.com sont les leaders de leur domaine
Telisma www.telisma.com né en 2000 d'un transfert de technologie du Cnet se focalise sur le secteur des télécom (alternative au clavier du téléphone): objectif, 15 langues en 2003 il a développé un moteur de reconnaissance vocale, PhilSoft, capables de gérer entre 50 et 10 000 mots de vocabulaire. Il peut effectuer une vérification biométrique du locuteur. En utilisant le standard de description de données vocales VoiceXML. il permet un accès Web depuis un téléphone portable (accès vocal aux intranets pour les commerciaux en déplacement par exemple) et la start-up nordiste Interactive Speech www.interactivespeech.com s'est spécialisée dans la navigation vocale, incontournable pour les applications nomades
Pour un panorama général de ces technologies: www.speachcentral.com et www.voicerecognition.com
Vous pouvez même envoyer un e-mail à un téléphone mobile par numéro@sms.itineris.tm.fr
"de deux choses l'une, ou bien la banalisation des téléphones cellulaires génère un immense marché pour les cure-dents, ou ce sont les technologies vocales qui vont s'imposer" Jo Lernout
1.2.1.2.2La synthèse vocale
C'est un marché en plein développement pour les centres d’appel, les systèmes vocaux, les jeux vidéo, les mal-voyants, l'automobile et de façon générale les usages où le regard ne doit pas être distrait
Des analystes prévoient que le marché des logiciels de "texte-à-voix" atteindra un milliard de dollars sur les prochaines années
Elan Informatique, www.elan.fr l'entreprise Toulousaine qui figure parmi les leaders de la synthèse vocale a réussi à reconquérir son indépendance, devenant Elan Speech en juillet 2002 après avoir été été rachetée par Lernout&Hauspie qui menaçait de l'entrainer dans sa chute
Les laboratoires d’ATT commercialisent depuis mi 2001 un logiciel permettant une synthèse vocale reproduisant avec une grande fidélité votre propre voix (il faut à la machine une trentaine d'heure d'apprentissage pour bien assimiler vos tics verbaux et créer la base de donnée nécessaire). ATT souligne que les phrases synthétisées s’approchant du cas réel posent des problèmes de droits sur les voix, notamment celles des célébrités. Une démonstration est disponible sur www.naturalvoices.att.com
1.2.1.2.3La traduction automatique
Signalons également le développement de logiciels de traduction automatique : même si l'on ne peut, dans l'état de l'art actuel, attendre d'eux des traductions de qualité (il n'est que de se souvenir des gorges chaudes qu'avait provoquée la traduction du rapport Star), par contre on obtient des traductions acceptables de textes techniques simples et l'on dispose d'assez d'éléments sur les autres pour en avoir une compréhension grossière : cela permet de ne faire traduire que les textes qui en valent véritablement la peine (économie de 70 à 90 % des traductions)
C'est un domaine où la France est bien placée avec un des leaders du secteur Systran www.systransoft.com qui est utilisable gratuitement à travers la fonction babelfish du moteur Alta Vista www.altavista.com .(1 million de traductions par jour) et de google http://c.asselin.free.fr/french/traduction.htm notons également le québécois www.alis.com
Systran d'origine américaine (créé par Peter Toma d'origine Hongroise) mais aujourd'hui français et a pour clients le FBI, la CIA, l'US Air Force, la Commission Européenne ce qui l'a ammené à élargir le panel de ses langues jusqu'au Farsi et à l'Ourdou même si ses principales sources de recherche sontGoogle, Yahoo!, AOL ou Wandoo
1.2.1.2.4La reconnaissance de l'écriture manuscrite
Déjà le palm permet une première forme de reconnaissance lettre par lettre avec sa tablette mais des logiciels comme REMUS permet à la fois d'identifier celui qui écrit et de reconnaitre les mots. Il peut être utilisé également pour aider les enfants à apprendre à écrire http://www-eph.int-evry.fr
1.2.1.2.5La Vision 3D, réalité virtuelle
La réalité virtuelle permet aux grandes entreprises comme Renault, Dassault, Airbus,.. ou les concepteurs d'installations complexes (CEA,Valmet, Bechtel,…) de faire l'économie des maquettes et ainsi de pouvoir étudier davantage de variantes et de raccourcir le délai nécessaire pour concevoir leurs produits ou installations. Il en va de même pour l'aménagement de bureaux ou d'usines, permettant au client de visualiser et de simuler de façon réaliste le fonctionnement évitant ainsi beaucoup d'erreur de conception tout en en accélérant le processus
Ces "reality centers" avec salle de projection "immersives" sont relativement onéreuses (1M€ pour Renault) mais vite amorties (une maquette coute 0,15M€).
Total a développé une salle de "Géovision" dans son centre de recherche de Pau qui permet aux spécialistes munis de lunettes spéciales de se promener virtuellement dans les roches (a partir de l'exploitation des données sismiques) et de pouvoir mieux "intuitivement" deviner ou se trouvent les poches de pétrole.leurs "avatars" sont visibles par leurs collègues Cette approche permet tout à la fois de mieux faire travailler ensemble des spécialistes de diverses disciplines et cela … à distance www.total.com/static/fr/medias/topic545/Total_2003_region_sud-atl.pdf
Buronomic www.buronomic.fr à Honfleur qui aujourd'hui offre à ses clients la possibilité d'aménager et de visualiser leur futur bureau en 3 dimensions grace à la technologie VRML: www.buronomic.fr:8028/buronomic/FR/client/client3df.html
La Lyonnaise des eaux s'est associée à l'Insa de Toulouse pour modéliser une usine de traitement d'eau (y compris les process physico-chimiques et biologiques). Cout 2M€ rapidement rentabilisé par les optimisations permises
In VIVO a utilisé les compétences du centre de robotique de l'Ecole des Mines pour ses études de magasins: le client est "plongé" dans la maquette virtuelle du projet de la boutique ce qui permet de tester ses comportements et de modifier en conséquence, en temps réel la conception de celle-ci
L'entreprise israélienne Technomatics fournit les outils logiciels pour concevoir une chaine d'assemblage et simuler son fonctionnement (y compris les opérateurs humains)
Dassault a lancé en 2005 le F7X, premier avion conçu entièrement en réalité virtuelle ce qui a permis de diviser par 2 le cout et la durée de conception, de diviser par 10 le nombre d’erreurs de conception ainsi que de supprimer le prototype physique et le métier d’ajusteur (les pièces s’adaptant parfaitement du premier coup)
Mais ces technologies ne sont pas l'apanage des grands groupes:
Opiocolor www.opiocolor.com PME installée à Opio près de Nice, fabricant des mosaïques en pâtes de verre pour fonds de piscines, salles de bain ou façades, reproduit dessins peinture ou photos que souhaite son client:
Dès 1997, grâce à virtual Mosaïc, un logiciel relié à un casque de réalité virtuelle il permet au client de visualiser immédiatement le résultat final et d'apporter les retouches souhaitées.
Le fichier numérique est alors transmis à l'usine via internet, processus qui a conduit à ramener le délai de conception-fabrication de 3 mois à 10 jours.
L'entreprise dont on pouvait craindre la disparition face à la concurrence italienne espagnole et chinoise compte maintenant 40 personnes et a ouvert des filiales à Hong Kong et Dubaï
1.2.1.2.6de nouveaux outils prêts à sortir des laboratoires: goût, odorat, toucher, reconnaissance des expressions du visage, réalisaion d'objets en 3D
Avec gants et casque la communication (virtual technologie : www.virtex.com), peut également concerner le toucher (la souris tactile), le retour d'effort ainsi que la vision (alioscopie www.micronet.fr/~emuller/FRAMES/Alioframe.html ) et l'audition tridimensionnelle (Qsound: www.qsound.ca ).le marché visé est aujourd'hui principalement celui de la simulation (conception d'une nouvelle voiture…) et du jeu, mais sans doute plus tard aussi celui du commerce électronique ("toucher d'un tissu")
FEELit espèce de souris tactile produite par la société "Immersion" www.immersion.com ou iFeel de Logitech www.logitech.com y rajoute la capacité de sentir la texture de l'objet affichée sur l'écran (on imagine les applications pour le commerce électronique, notamment là où le toucher est important, comme pour les textiles)
Parmi nos "sens" l"un d'entre eux retient particulièrement l'attention des publicitaires : l'odorat (on connaît déjà les diffuseurs d'odeurs de croissants chauds de nos boulangeries pour doper les ventes…). Il peut également parfumer un mail…
En Californie Digiscent http://www.digiscent.com et http://www.stanford.edu/~demian23/captology/DOPE développe un procédé permettant de modéliser des odeur par ordinateur, de les diffuser via Internet et de les synthétiser chez le destinateur avec un petit boitier, un "orgue à parfum" iSmell équipé de cartouches d'odeurs de base ou par un espèce de "balladeur" accompagnant le nomade communicant…
En France signalons les initiatives de Olfacom et en Allemagne de Sniffman qui plus modestement génèrent une gamme limitée d'odeurs parmi lesquelles devront choisir les sites (herbe coupée pour la météo pluvieuse) ou les jeux (caoutchouc brulé pour les courses de voiture)
Alpha Mos http://www.alpha-mos.com de Jean-Christophe Mifsud, a levé 43 MF début 2000 sur le Nouveau Marché à Paris pour numériser l'odorat et le goût : en mars 2000 elle a présenté la "langue électronique".
Les laboratoires de R&D de France Télécom à Rennes travaillent à l'image olfactive de leur entreprise : Orange? Mandarine? Pamplemousse? … et à celle des sites de e-commerce
Des laboratoires (MediaLab, Microsoft,…) s'investissent aussi sur l'interprétation des mouvements du visage afin d'essayer d'en décrypter les expressions (joie, tristesse, surprise,…)
En 2003 ont également vu le jour des "imprimantes" capables de creer des prototypes en trois dimensions a bas cout accessibles au secteur des particuliers et des PME. Ces machines procedent selon une technologie développée au MIT, en ajoutant des couches successives d'un materiau pulverulent, pour obtenir un modele reel d'une image numerique. Aujourd'hui, Sony, Adidas et BMW les utilisent pour creer des prototypes plus rapides et plus economiques a elaborer que par des methodes traditionnelles www.zcorp.com
Cambridge Display Technology, E-Ink http://www.eink.com , IBM, Kodak travaillent sur les écran souples en plastique (technologie OLED www.adit.fr/adit_edition/produits/vigie/br/v62/VOE_62_2.html) permettant par exemple une plus large diffusion du "livre électronique" (e-book) et l'intégration dans l'habillement
IBM de son côté développe dans ses laboratoires un écran intégré dans le verre d'une lunette Sun pousuit un projet analogue que certains proposent déjà de nommer "Sun Glasses" Le Monde
Dostları ilə paylaş: |