Librería de intenciones y entidades de propósito general en inglés y español para sistemas conversacionales

El objetivo de la propuesta es identificar las intenciones (intents), entidades (entities) y patrones meta-conversacionales que pueden aparecer en cualquier diálogo hombre-máquina.

Investigador principal

José Gabriel de Amores Carredano

Sede

US

Tecnología

Machine Learning, Iot, Robótica

Sector

2

Agentes agregados

INTELLIGENT INSIGHTS (4i)

Resumen de la propuesta

El objetivo de la propuesta es identificar las intenciones (intents), entidades (entities) y patrones meta-conversacionales que pueden aparecer en cualquier diálogo hombre-máquina y que, por tanto, el usuario asume que deben ser reconocidos si un sistema conversacional pretende presentarse como ‘inteligente’.

No tendría sentido que hubiera que entrenar al sistema para entender dichos patrones, sino que se espera que el sistema los traiga ‘predefinidos de fábrica’ por así decir, pero adaptados al dominio en cuestión.

En los sistemas conversacionales, se entiende como ‘intent’, la intención comunicativa del agente.

Objetivo del proyecto

Algunas plataformas de desarrollo de sistemas conversacionales (Rasa, Luis, Alexa, Cortana, DialogueFlow, Wit, Snips, Watson, Houndify), ya incluyen intents o patrones como pueden ser las despedidas, los saludos iniciales y las confirmaciones.

Otras, sin embargo, tienen un componente discursivo-gramatical que es específico a cada idioma y que ha de ser investigado independientemente. Consideremos por ejemplo las reformulaciones en la siguiente interacción:

Agente1     ¿Cuándo quieres que nos veamos?
Agente2     El próximo jueves me va bien
Agente2     No, mejor el miércoles

En español existen ciertos patrones gramaticales que pueden expresar reformulaciones. En estos ejemplos, Slot1 y Slot2 estarían ‘rellenados’ por entidades del dominio.

  • No, el Slot1 no, el Slot2 (e.g. no, el martes no, el miércoles)
  • El Slot1 no, el Slot2
  • No, perdona, el Slot2
  • No, me he equivocado, el Slot2
  • Disculpa, el Slot1 no, el Slot2
  • Perdona, quiero decir Slot2
  • Disculpa, me he equivocado, el Slot2

De forma análoga, habría también una gramática para expresar reformulaciones en inglés:

  • No, I mean Slot2 instead
  • No, sorry, I mean Slot2
  • Sorry, I mean Slot2
  • No, actually, Slot2 instead
  • No, Slot2

El objetivo del proyecto es identificar las intenciones (intents), entidades (entities) y patrones meta-conversacionales que pueden aparecer en cualquier diálogo hombre-máquina en inglés y español y que, por tanto, el usuario asume que deben ser reconocidos si un sistema conversacional pretende presentarse como ‘inteligente’.

No tendría sentido que hubiera que entrenar al sistema para entender dichos patrones, sino que se espera que el sistema los traiga ‘predefinidos de fábrica’ por así decir, pero adaptados a cada dominio particular.

Resultados esperados e indicadores

Los resultados esperados son fundamentalmente un contrato de transferencia de tecnología hacia la empresa 4i, dada la relevancia que tiene contar con una librería de intents y patrones meta conversacionales aplicables a cualquier dominio y disponibles en inglés y español. Algunos hallazgos pueden ser susceptibles de publicación y/o presentación en congresos especializados en procesamiento del lenguaje natural y sistemas conversacionales.

Indicadores (esperados hasta el 31/12/2021)
    Nuevo personal investigador (equivalente anual):
    Patentes:
    Nº contratos transferencia: 1
    Congresos: 2
    Publicaciones indexadas: 1
    Tesis doctorales:

Justificación potencial impacto tecnológico del proyecto (TRL)

La empresa 4i ofrece soluciones de voz con sistemas conversacionales en distintos entornos. Actualmente despliega sus soluciones usando tecnología de IBM (Watson) y de Amazon (Alexa).
 
Una limitación de la tecnología existente es la falta de librerías que cubran fenómenos lingüísticos presentes en todos los dominios, como por ejemplo correcciones y reformulaciones.
 
Si el presente proyecto genera los resultados esperados, 4i integrará la librería desarrollada en sus soluciones de sistemas conversacionales desplegados en entornos reales y operacionales (TRL 9).