Adquisición automática de conocimiento léxico con wordnet

  1. CASTILLO VALDES, MAURO ALEX
Dirigida por:
  1. Germán Rigau Claramunt Director/a

Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 28 de enero de 2015

Tribunal:
  1. Arantza Díaz de Ilarraza Sánchez Presidente/a
  2. Eneko Agirre Bengoa Secretario/a
  3. Irene Castellón Masalles Vocal
  4. Lluís Padró Cirera Vocal
  5. Horacio Rodríguez Hontoria Vocal
Departamento:
  1. Lenguajes y Sistemas Informáticos

Tipo: Tesis

Teseo: 118402 DIALNET

Resumen

Este trabajo presenta nuevos métodos, herramientas y recursos para la adquisiciónautomática de conocimiento léxico-semántico para ser usado en aplicaciones deProcesamiento de Lenguaje Natural, que requieran grandes cantidades de informaciónsemántica. Además, estando representado a nivel semántico, esperamos también que elnuevo conocimiento semántico adquirido pueda ser de utilidad en otras lenguas.En concreto, nuestro modelo de adquisición de conocimiento ha sido aplicado a dostareas distintas pero relacionadas: a) adquirir nuevas etiquetas de dominio específicas decada sentido de WordNet y b) adquirir nuevas relaciones semánticas entre sentidos deWordNet.Para la adquisición de nuevas etiquetas de dominio, la primera aproximación aplica unsencillo modelo estadístico que se aprende al considerar las definiciones de WordNet.La segunda aproximación aplica un único algoritmo basado en grafos que usa comoúnica fuente de conocimiento el propio WordNet para propagar las etiquetas de dominiopor todo WordNet.Para la adquisición de nuevas relaciones semánticas, la primera aproximación combinaun conjunto de heurísticos que utilizan múltiples fuentes de conocimiento. Estaaproximación es la que ha obtenido los mejores resultados publicados hasta la fecha enla competición internacional SensEval3. La segunda aproximación aplica un únicoalgoritmo basado en grafos que usa como única fuente de conocimiento el propioWordNet para identificar los sentidos de las glosas de WordNet.