Extracción masiva de información sobre subcategorización verbal vasca a partir de corpus

  1. Goenaga Mendizabal, Patxi
  2. Aldezabal Roteta, Izaskun
  3. Atutxa Salazar, Aitziber
  4. Gojenola Galletebeitia, Koldobika
  5. Sarasola Sánchez-Castillo, Rafael
  6. Aranzabe Urruzola, María Jesús
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2001

Título del ejemplar: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001

Número: 27

Páginas: 29-36

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo presentamos el trabajo realizado en la extracción automática de información sobre la aparición de complementos y adjuntos para un conjunto de 1.400 verbos a partir de un corpus periodístico de un millón y medio de palabras. Los resultados han sido evaluados, obteniéndose una precisión y cobertura satisfactorias. Estos datos se usarán para la adquisición manual y automática de información sobre subcategorización verbal.