Votre bannière ici  
Les dossiers

La synthèse vocale s'humanise

 

L'être humain communique prioritairement par la parole. Pourtant, il doit souvent utiliser différents dispositifs (clavier, souris, boutons, écrans tactiles, etc.) pour échanger de l'information. «Il est certain que l'interaction homme-machine serait considérablement simplifiée, et l'utilisation quotidienne de dispositifs électroniques accrue, si les utilisateurs pouvaient communiquer avec les systèmes en utilisant leur voix», explique Daniel Rappo, professeur à la Haute école d'ingénierie et de gestion du canton de Vaud (HEIG-VD) et coordinateur du projet de recherche Humavox. Celui-ci regroupe une dizaine de chercheurs de la Haute Ecole spécialisée de Suisse occidentale (HES-SO) répartis entre Sion, Fribourg et Yverdon-les-Bains.

Ce projet a pour but de développer des solutions homme-machine. Des chercheurs de la HEIG-VD se consacrent à la synthèse vocale, à savoir la production et la diffusion d'informations sonores à partir de textes. Premiers concernés, les aveugles et les malvoyants. Ils ont déjà la possibilité d'écouter certains articles de presse via ordinateur connecté à Internet. Cependant, l'accessibilité et la qualité sonore sont souvent médiocres. De plus, la voix, très artificielle et monocorde, ne reflète pas la structure du texte lu.

Pour y remédier, les ingénieurs de la HEIG-VD «vocalisent» un texte après en avoir fait une analyse sémantique permettant de rendre son contenu plus intelligible. Grâce à cette méthodologie, la vitesse, le volume ou l'intonation de la voix de synthèse peuvent ainsi être modifiés en fonction des phrases interprétées. En résulte une lecture plus riche et plus agréable de l'information.

«Le marché actuel de la synthèse vocale est en plein essor», note Luc Fontolliet, ingénieur en gestion des médias. Les performances des moteurs de synthèse s'améliorent et les voix sont de plus en plus naturelles. Toutefois, ces systèmes restent chers et nécessitent un développement important. Les ingénieurs de la HEIG-VD travaillent à la réalisation d'une plate-forme capable de diffuser automatiquement la transcription vocale de contenus rédactionnels.

Problèmes d'accessibilité

La diffusion d'informations sous la forme de parole pose des problèmes d'accessibilité. La HEIG-VD souhaite y remédier en permettant à l'utilisateur de naviguer avec sa voix dans l'information sonore, comme il peut le faire dans une page web avec sa souris. Il pourrait ainsi demander de répéter certains passages, d'épeler des mots, d'arrêter la lecture ou de faire une pause. «Un tel outil ne s'adresse pas seulement aux personnes aveugles et malvoyantes, explique Daniel Rappo. Il sera ainsi possible d'embarquer la transcription vocale d'informations textuelles et de la rendre disponible dans sa voiture, son téléphone portable ou son lecteur multimédia.»

Démonstrateurs

Parallèlement, les chercheurs de la Haute Ecole valaisanne travaillent, en collaboration avec l'Institut Dalle Molle d'Intelligence Artificielle Perceptive (IDIAP) à Martigny, sur la reconnaissance de commandes vocales. «La mise en place de solutions d'échange d'informations vocales offre une perspective indéniable sur de nouveaux marchés et propose une approche novatrice en termes d'ergonomie et de confort pour l'utilisateur», souligne Luc Fontolliet. Enfin, grâce au projet Humavox, de nombreux démonstrateurs seront développés avec les compétences de l'Ecole d'ingénieurs et d'architectes de Fribourg dans le domaine des interactions multimodales. Par exemple, un prototype permettra à un opérateur CFF d'effectuer une commande d'un billet avec sa voix. Il s'agit actuellement d'une tâche répétitive, dont l'exécution pourrait être passablement optimisée grâce à un support de commandes vocales.


Partager
 

 
  Votre bannière ici