Extracción y análisis de información desde la perspectiva de la web semántica

  1. Danger Mercaderes, Roxana María
Supervised by:
  1. Rafael Berlanga Director

Defence university: Universitat Jaume I

Fecha de defensa: 07 February 2007

Committee:
  1. Arantza Illarramendi Echave Chair
  2. María José Aramburu Cabo Secretary
  3. José Francisco Aldana Montes Committee member
  4. María del Mar Marcos López Committee member
  5. Paolo Rosso Committee member

Type: Thesis

Teseo: 138867 DIALNET

Abstract

Vencer algunos de los obstáculos para convertir la Web Semántica en una realidad ha motivado la presente tesis, en la que se abordan tres temas fundamentales, En primer lugar, se introduce una metodología para la extracción de instancias ontológicas complejas desde textos (y documentos web) basada en la información ofrecida por ontologías de dominio. En segundo lugar, se formaliza un modelo multidimensional que permite utilizar instancias ontológicas en procesos de análisis como los propuestos en los modelos de almacenes de datos, y se describe un mecanismo para inferir esquemas multidimensionales interesantes. Por último, se trata el problema de analizar la información contenida en páginas web o en una colección de documentos sobre temas de dominio general o sobre la que es inviable extraer y analizar instancias ontológicas por los métodos anteriormente propuestos. En su lugar, se propone emplear técnicas de minería de textos y recursos léxicos externos para reconstruir espacios conceptuales multidimensionales que permitan realizar análisis de este tipo de colecciones. Todas las soluciones propuestas obtienen resultados satisfactorios.