Azaleko sintaxiaren tratamendua ikasketa automatikoko tekniken bidezeuskarako kateen eta perpausen identifikazioa eta bere erabilera koma-zuzentzaile baten

  1. Arrieta Cortajarena, Bertol
Dirigida por:
  1. Iñaki Alegría Loinaz Director/a
  2. Arantza Díaz de Ilarraza Sánchez Director/a

Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 27 de julio de 2010

Tribunal:
  1. Pedro Larrañaga Múgica Presidente/a
  2. Nerea Ezeiza Ramos Secretario/a
  3. Ricardo Etxepare Vocal
  4. Andoni Sagarna Izaguirre Vocal
  5. Xavier Carreras Vocal
Departamento:
  1. Arquitectura y Tecnología de Computadores

Tipo: Tesis

Teseo: 297980 DIALNET lock_openTESEO editor

Resumen

Tesi honetan, ikasketa automatikoko teknikak aztertu eta erabili dira euskararen prozesamendua lantzeko. Hala, azaleko sintaxiaren tratamendu automatikoaren baitan, euskarako kate- eta perpaus-identifikatzaileak sortu dira, teknika hau erabiliz, eta aurretik jorratutako hizkuntzaren-ezagutzan oinarritutakoekin uztartuz. Horretaz gain, puntuazioaren erabilera jorratu da hizkuntzalaritza konputazionalaren ikuspegitik. Makinak hizkuntzaren ulermen osoa lor dezan, komak duen garrantzia aztertu da, batez ere. Gainera, erroreen detekzioaren alorrean, euskarako koma-zuzentzaile automatiko bat garatu da ikasketa automatikoko teknikak baliatuz. Horretarako, sortutako kate- eta perpaus-identifikatzaileek ematen duten informazioa erabili da. En esta tesis se han utilizado técnicas de aprendizaje automático para el procesamiento del euskera. Combinando estas técnicas con otras basadas en reglas, se han creado sendos identificadores de sintagmas y cláusulas. Por otra parte, se ha tratado la puntuación desde el punto de vista de la lingüística computacional. Concretamente, se ha analizado el uso de la coma en el euskera y su importancia para la comprensión automática del lenguaje. Además, se ha creado un corrector de comas basado principalmente en técnicas de aprendizaje automático. Para ello, se ha hecho uso de los identificadores de sintagmas y cláusulas creados previamente.