Euskal hiztegia-ren azterketa eta egituratzea ezagutza lexikalaren eskuratze automatikoari begira. Aditz-adibideen analisia murriztapen-gramatika baliatuz, azpikategorizazioaren bidean

  1. ARRIOLA EGURROLA, JOSE MARIA
Supervised by:
  1. Joseba Abaitua Director
  2. Xabier Artola Zubillaga Director

Defence university: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 15 September 2000

Committee:
  1. Patxi Goenaga Mendizabal Chair
  2. Xabier Arregi Iparragirre Secretary
  3. Fred Karlsson Committee member
  4. Beñat Oyharçabal Committee member
  5. Irene Castellón Masalles Committee member
Department:
  1. Lenguajes y Sistemas Informáticos

Type: Thesis

Teseo: 78008 DIALNET

Abstract

El resultado del trabajo de ivestigación realizado sobre el diccionario Euskal Hiztegia ha sido la obtención de una clasificación automática de los verbos del mismo, tomando como criterio la estructura argumental que ofrecen los ejemplos ilustrativos seleccionados por el lexicógrafo de un un corpus más amplio. Esta clasificación sirve como punto de partida para el estudio de la su categorización verbal en el corpus. Para la obtención de dicha clasificaión básica, se han tendio que desarrollar las siguientes tareas: estudio pormenorizado de la fuente léxica a tratar, etiquetado del diccionario, escribir la gramática que recoge la estructua de las entradas del diccionario, el análisis automático del diccionario y su psoterior adaptación a un modelo estándar. En concreto, hemos seguido los criterios propuestos por TEI (Text Encoding Initiative). El análisis y posterior etiquetado del diccionario siguiendolos criterios propuestos por TEI hacen posible el estudio por medio del ordenador de la maplia información léxica contenida en el mismo. A sí mismo, esta fuente léxica puede ser objeto de estudio para todo investigador que quiera profundizar en el conocimiento del euskara. Una vez llevado a cabo el proceso de preparación del diccionario, nuestro siguiente paso ha sido el desarrolar y aplicar una metodología que permita la obtención de información implícita en los ejemplos de un modo semiatuomático. Como parte indispensable para aplicar la metodología, hemos desarrollado y descrito computacionalmente una parte substancionalmente una parte substancial de la sintaxis vasca. Dicha descripción sintáctica se basa en el formalismo desarrollado en la Universidad de Helsinki: Constraint Grmmar Formalismo, CG (Karlsson, 1995). Basándose en el formalismo sintáctico de las gramáticas de restricciones (CG), hemos desarrollado el campo de la sintaxis paracial o superficail (shallow syntax). Entre las razones más importan