Síntesis de información: desarrollo y evaluación de un modelo interactivo

Amigó, Enrique

Síntesis de informacióndesarrollo y evaluación de un modelo interactivo

Amigó, Enrique

Dirigida por:

Anselmo Peñas Padilla Director/a
Julio Gonzalo Arroyo Director/a

Universidad de defensa: UNED. Universidad Nacional de Educación a Distancia

Fecha de defensa: 20 de junio de 2006

Tribunal:

Felisa Vedejo Maillo Presidente/a
Eneko Agirre Bengoa Secretario/a
Raquel Martínez Unannúe Vocal
Horacio Rodríguez Hontoria Vocal
Luis Vicedo José Vocal

Tipo: Tesis

Teseo: 134007 DIALNET

Resumen

En esta tesis se desarrolla un modelo interactivo de acceso a la información orientado a la tarea de "Síntesis de Información", definida como el proceso de extraer, organizar y relacionar entre sí las piezas de información contenidas en un conjunto de documentos relevantes, con el fin de obtener un informe sin informe que satisfaga una necesidad de información compleja, En primer lugar, se realiza en esta tesis una revisión del estado del arte en cuanto a técnicas de resumen automático, tarea que subsume a la Síntesis de Información. Se revisan también los esquemas de interacción entre usuario y máquina en sistemas de acceso a la información, y metodología de evaluación. En segundo lugar, se desarrolla un marco de trabajo compuesto por un corpus de informes generados manualmente, ISCORPUS, y una metodología de evaluación, QARLA, adaptada a nuestro problema. En tercer lugar, se realiza una serie de estudios empíricos sobre el papel de los conceptos clave del asunto tratado en el informe, con vistas al desarrollo y evaluación de un modelo interactivo. Desde el análisis de ISCORPUS, se concluye que la tarea de síntesis de Información, es básicamente extractiva, y presenta diferencias importante dependiendo del tipo de tema tratado. Podemos distinguir entre los asuntos que evolucionan a lo largo del tiempo, (por ejemplo, "el rol del Gobierno España en la guerra de Irak", y los asuntos que tratan diferentes instancias de un mismos tipo de evento por ejemplo, "campañas europeas contra el racismo". QARLA es un marco de evaluación de sistemas de resumen desarrollado en el contexto de este trabajo. La entrada al marco consiste en un con junto de resúmenes de referencia generados manualmente, un conjunto de resúmenes de referencia generados automáticamente, y un conjunto de métrica de similitud. QARLA proporciona una medida para evaluar la calidad de cualquier conjunto de métricas de similitud, una medida para evaluar la calida