MI4ALL – Machine Interpretation For All Through a Deep Learning API
Investigador principal
Sede:
UMA
Tecnología
Machine learning, Big Data
Agentes agregados
Intelligenia S.L.
Resumen de la propuesta
La presente propuesta pretende sacar provecho de los avances en IA actuales aplicándolos a las tecnologías lingüísticas multilingües, la lingüística de corpus y el procesamiento de lenguaje natural. De esta forma, se va a desarrollar un sistema software que consistirá en una interfaz completa de Interpretación Automática que pueda utilizarse en cualquier servicio público. Esta herramienta supondrá una mejora de los servicios y el bienestar de sus usuarios.
Objetivo del proyecto
En este proyecto se diseñará y desarrollará una plataforma software (API REST), basada en redes neuronales de aprendizaje profundo, que permita establecer un flujo de comunicación óptimo en los servicios públicos. De esta forma, se creará un sistema de interpretación automática utilizando, principalmente, tres técnicas de PLN: reconocimiento de voz (SR), traducción automática (MT) y síntesis de voz (TS). Para aplicar estas técnicas se entrenará un conjunto de redes neuronales utilizando corpus bilingües (ES/EN) y multimodales específicos que permita ofrecer una comunicación óptima en aquellos casos en los que en un servicio público no pueda ofrecer al usuario la posibilidad de expresarse en su idioma nativo o en un idioma que controle con fluidez. Dado el enfoque de multipropósito del que se quiere dotar a este sistema, el último objetivo será el de ofrecer la posibilidad de reentrenar el sistema creando modelos específicos para servicios concretos.
Resultados esperados e indicadores
Indicadores (esperados hasta el 31/12/2021)
- Nuevo personal investigador (equivalente anual): -
- Patentes: 0
- Nº contratos transferencia: 1
- Congresos: 0 (organización)
- Comunicaciones a congresos: 3
- Publicaciones indexadas: 6
- Tesis doctorales: 2
Justificación potencial impacto tecnológico del proyecto TRL
El sistema desarrollado será una herramienta útil para la atención al usuario en los servicios públicos, mejorando su eficiencia y colaborando a la integración social de turistas e inmigrantes. Dado que el objetivo del proyecto es desarrollar un sistema completamente funcional y robusto que poder utilizar en entornos reales, se pretende llegar a un nivel de impacto TRL8. En caso de no poder cumplirlo, se presentará al menos un prototipo para entorno real, llegando al nivel TRL7.
Avances
Gloria Corpas Pastor y su equipo de investigación, pertenecientes a la Universidad de Málaga, junto con Intelligenia SA, como empresa colaboradora, tienen como objetivo desarrollar un sistema software que consistirá en una interfaz completa de Interpretación Automática que pueda utilizarse en sanidad, especialmente en urgencias y servicios de emergencia. Esta herramienta supondrá una mejora de los servicios y el bienestar de sus usuarios.
El proyecto, aún en desarrollo, ha alcanzado varios hitos importantes, como es el estudio del estado de la cuestión actual sobre desarrollo e integración de tecnologías de traducción automática, reconocimiento de voz y síntesis de voz. Por otro lado, se han compilado varios corpus textuales y multimodales bilingües (ES/EN) que incluyen textos y documentos jurídicos, información de páginas web, descripción de situaciones reales, etc.; así como vídeos y audios sobre situaciones reales en servicios públicos.
También destacar como actividad importante en el proyecto, el diseño y distribución de una encuesta sobre interpretación en servicios públicos a fin de analizar cómo trabajan los intérpretes en dicho contexto, así como para analizar casos de uso. Concretamente, se han obtenido y analizado datos de 21 intérpretes que trabajan como voluntarios en hospitales.
Todo lo relacionado con este proyecto puede consultarse en el micrositio web del proyecto, en el siguiente enlace, que servirá como plataforma de diseminación y difusión de toda la información y resultados relacionados con el mismo.