|
L'être humain communique prioritairement par la parole. Pourtant, il doit souvent utiliser différents dispositifs (clavier, souris, boutons, écrans tactiles, etc.) pour échanger de l'information. «Il est certain que l'interaction homme-machine serait considérablement simplifiée, et l'utilisation quotidienne de dispositifs électroniques accrue, si les utilisateurs pouvaient communiquer avec les systèmes en utilisant leur voix», explique Daniel Rappo, professeur à la Haute école d'ingénierie et de gestion du canton de Vaud (HEIG-VD) et coordinateur du projet de recherche Humavox. Celui-ci regroupe une dizaine de chercheurs de la Haute Ecole spécialisée de Suisse occidentale (HES-SO) répartis entre Sion, Fribourg et Yverdon-les-Bains. Ce projet a pour but de développer des solutions homme-machine. Des chercheurs de la HEIG-VD se consacrent à la synthèse vocale, à savoir la production et la diffusion d'informations sonores à partir de textes. Premiers concernés, les aveugles et les malvoyants. Ils ont déjà la possibilité d'écouter certains articles de presse via ordinateur connecté à Internet. Cependant, l'accessibilité et la qualité sonore sont souvent médiocres. De plus, la voix, très artificielle et monocorde, ne reflète pas la structure du texte lu. Pour y remédier, les ingénieurs de la HEIG-VD «vocalisent» un texte après en avoir fait une analyse sémantique permettant de rendre son contenu plus intelligible. Grâce à cette méthodologie, la vitesse, le volume ou l'intonation de la voix de synthèse peuvent ainsi être modifiés en fonction des phrases interprétées. En résulte une lecture plus riche et plus agréable de l'information. «Le marché actuel de la synthèse vocale est en plein essor», note Luc Fontolliet, ingénieur en gestion des médias. Les performances des moteurs de synthèse s'améliorent et les voix sont de plus en plus naturelles. Toutefois, ces systèmes restent chers et nécessitent un développement important. Les ingénieurs de la HEIG-VD travaillent à la réalisation d'une plate-forme capable de diffuser automatiquement la transcription vocale de contenus rédactionnels.
|