Investigación avanzada en tecnologías del habla para aplicación a entornos audiovisuales de interacción hombre máquina inclusiva

SpeechTech4All es un proyecto concedido por el Ministerio de Economía y Competitividad en la convocatoria de 2012 del Programa Nacional de Proyectos de Investigación Fundamental. El proyecto tiene una duración de tres años y en el participan las Universidades de Vigo, Politécnica de Cataluña y del País Vasco.  Carmen García Mateo, directora del Grupo de Tecnologías Multimedia del centro AtlantTIC de la Universidad de Vigo será la coordinadora del proyecto .

El proyecto está dedicado a la investigación avanzada en las principales tecnologías del habla (reconocimiento de voz, traducción automática, conversión de texto a voz) en todas las lenguas oficiales habladas en España, al reconocimiento del estado emocional del hablante, y a la construcción de marcos experimentales multimodales (voz y facial) y multilingües (castellano, gallego, catalán, y euskara) que permitan mostrar el trabajo realizado.

siri-tecnologia-vozComo resultado del proyecto se obtendrán avances de investigación en cada una de las tecnologías mencionadas. Algunos ejemplos de estos avances son la búsqueda de la universalización del servicio de personalización de voces sintéticas, el desarrollo de técnicas de adaptación al dominio en traducción automática, o el desarrollo de sistemas de detección del estado del hablante mediante procesado conjunto de voz y cara. Se prevé que el proyecto participe en campañas de evaluación competitiva, entre ellas las organizadas por la Red Temática en Tecnologías del Habla, y por Interspeech.

 Con el fin de dar visibilidad a los avances logrados en todas las tecnologías, así como de ilustrar el marcado carácter social que se pretende dar al proyecto, se definen dos demostradores:

 1) El primero, que integra la mayor parte de las tecnologías trabajadas, consiste en el subtitulado multilingüe de material audiovisual relacionado con el campo de la educación: documentales, ponencias, seminarios...

 2) El segundo va dirigido a una de las aplicaciones genuinas de las tecnologías del habla, como es dotar de voz a personas que por diferentes motivos presentan un nivel severo de discapacidad oral, usando un sintetizador que se adapte a las características específicas de dicha persona.

Funded by: 
Ministerio de Economía y Competividad
Partners: 
Universidad de Vigo, Universidad Politécnica de Cataluña, Universidad del País Vasco
Start date: 
2013/1/1
End date: 
2015/12/13
Reference: 
TEC2012-38939-C03-01
Number of investigators: 
7
Funds: 
155142
Type: 
National