Knowledge acquisition in the information agethe interplay between lexicography and natural language processing
- Espinosa Anke, Luis
- Horacio Saggion Director/a
Universidad de defensa: Universitat Pompeu Fabra
Fecha de defensa: 14 de julio de 2017
- Michael Zock Presidente/a
- Núria Bel Rafecas Secretario/a
- Eneko Agirre Bengoa Vocal
Tipo: Tesis
Resumen
El Procesamiento del Lenguaje Natural (PLN) es la rama de la Inteligencia Artificial que se ocupa de la comprensión y la generación de lenguage, tomando como referencia el lenguaje humano. Hoy, el PLN se basa en gran medida en la explotación de grandes cantidades de corpus sin anotar, a partir de los cuales se derivan representaciones de gran calidad para la comprensión automática de texto, tales como representaciones vectoriales o grafos de conocimiento. Además, el PLN también explota información estructurada y parcialmente estructurada como ontologías, bases de conocimiento (BCs), enciclopedias o diccionarios. En esta tesis presentamos varias mejoras del estado del arte en tareas de PLN tales como la extracción de definiciones e hiperónimos, descubrimiento de hiperónimos, inducción de taxonomías o construcción y enriquecimiento de BCs, y en todas ellas incorporamos repositorios de varios tipos, evaluando su contribución en diferentes áreas del PLN. Por otra parte, también usamos técnicas de PLN para crear, mejorar o extender repositorios ya existentes, y los publicamos junto con su código asociado con el fin de que sean de utilidad para la comunidad.