GTM coordinará un proyecto dedicado a las tecnologías del habla en todas las lenguas de España

SpeechTech4All es un proyecto concedido por el Ministerio de Economía y Competitividad en la convocatoria de 2012 del Programa Nacional de Proyectos de Investigación Fundamental. El proyecto tiene una duración de tres años y el total de la concesión es de 155.142€ para AtlantTIC. Carmen García Mateo, directora del Grupo de Tecnologías Multimedia, será la coordinadora del proyecto en el que también participan las Universidades Politécnica de Cataluña y del País Vasco. 

El proyecto está dedicado a la investigación avanzada en las principales tecnologías del habla (reconocimiento de voz, traducción automática, conversión de texto a voz) en todas las lenguas oficiales habladas en España, al reconocimiento del estado emocional del hablante, y a la construcción de marcos experimentales multimodales (voz y facial) y multilingües (castellano, gallego, catalán, y euskara) que permitan mostrar el trabajo realizado.  

siri-tecnologia-voz

Como resultado del proyecto se obtendrán avances de investigación en cada una de las tecnologías mencionadas. Algunos ejemplos de estos avances son la búsqueda de la universalización del servicio de personalización de voces sintéticas, el desarrollo de técnicas de adaptación al dominio en traducción automática, o el desarrollo de sistemas de detección del estado del hablante mediante procesado conjunto de voz y cara. Se prevé que el proyecto participe en campañas de evaluación competitiva, entre ellas las organizadas por la Red Temática en Tecnologías del Habla, y por Interspeech.

 Con el fin de dar visibilidad a los avances logrados en todas las tecnologías, así como de ilustrar el marcado carácter social que se pretende dar al proyecto, se definen dos demostradores:

 1) El primero, que integra la mayor parte de las tecnologías trabajadas, consiste en el subtitulado multilingüe de material audiovisual relacionado con el campo de la educación: documentales, ponencias, seminarios...

 2) El segundo va dirigido a una de las aplicaciones genuinas de las tecnologías del habla, como es dotar de voz a personas que por diferentes motivos presentan un nivel severo de discapacidad oral, usando un sintetizador que se adapte a las características específicas de dicha persona.