Módulo D
Módulo D: Tratamiento de la ambigüedad en el significado (Resp. M. Palomar)
Varias líneas de investigación en el estado del arte del procesamiento de la ambigüedad en el significado son relevantes para la proyecto. Estos incluyen trabajo relacionado en tres áreas principales: anáfora y resolución de correferencia, el procesamiento de la ambigüedad del significado de las palabras y el procesamiento del lenguaje no literal.
Tarea D.1. Resolución de correferencia (Resp. M. Palomar)
Un proceso importante en la conversión de documentos a un formato que facilite la comprensión lectora es la resolución de correferencia, en la que los enlaces entre pronombres y frases nominales que se refieren al mismo concepto se identifican automáticamente.
Tarea D.2. Desambiguación del sentido de las palabras (Resp. A. Suárez)
Una fuente frecuente de ambigüedad en el lenguaje es la ambigüedad del sentido de las palabras, cuando una sola palabra puede tener varios significados dependiendo del contexto en el que se utilice.
Tarea D.3. Procesamiento de palabras difíciles (Resp. P. Martinez-Barco)
El lenguaje utilizado en los documentos del sector público tiende a ser de naturaleza técnica y sofisticada. Estos documentos suelen contener arcaísmos, lenguaje muy técnico, siglas o aforismos. El objetivo abordado por esta tarea, a través de la construcción o adaptación de una herramienta compleja de procesamiento de textos, será la detección y evaluación del grado de complejidad de estos términos y su sustitución por otras palabras equivalentes que se entienden más fácilmente.
Resultados de este módulo:
- Resolución de correferencia de última generación
- Desambiguación de sentido de palabra de última generación
- Estado del arte para el procesamiento de lenguaje no literal
- Herramienta para la resolución de correferencias
- Herramienta para WSD
- Herramienta para el procesamiento de palabras difíciles