ASKHiAnalisi sintaktiko konputazional hibridoa paradigma desberdinen konbinazioan oinarrituta

  1. GOENAGA AZCARATE, IAKES
Dirigida por:
  1. Nerea Ezeiza Ramos Director/a
  2. Koldobika Gojenola Galletebeitia Director/a

Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 31 de marzo de 2017

Tribunal:
  1. Itziar Aduriz Presidente/a
  2. Arantza Díaz de Ilarraza Sánchez Secretario/a
  3. Igor Leturia Azkarate Vocal
Departamento:
  1. Lenguajes y Sistemas Informáticos

Tipo: Tesis

Teseo: 123414 DIALNET lock_openADDI editor

Resumen

Hizkuntzaren Prozesamenduan sintaxiak berebiziko garrantzia du. Hainbat atazatan erabiltzen da sintaxitik eratorritako informazioa, esaterako itzulpen automatikoan, rol semantikoen etiketatzean eta sentimenduen analisian. Tesi-lan honetan sintaxi konputazionala landu da, zehazki dependentzietanoinarritutako sintaxia jorratu da analizatzaile automatikoen bidez. Dependentzien analisi sintaktiko automatikoa hobetzeko bide desberdinak aztertudira: izaera desberdinetako analizatzaileen hibridazioa, ezaugarrien ingeniaritzako tekniken erabilpena, multzokatze mota desberdinen esperimentazioaeta automatikoki analizatutako zuhaitz-bankuetatik eratorritako ezaugarrien erabilpena.Bide horiek guztiak jorratzearen arrazoi nagusia morfologikoki aberatsak diren hizkuntzen dependentzien analisia hobetzen lagundu dezaketen era des-berdinak aztertzea da. Hori dela eta, egindako esperimentu gehienak bost hizkuntza desberdinetan probatu dira (euskara, frantsesa, alemana, hunga-riera eta suediera), eta hizkuntza horietan guztietan probatu ezin izan diren bideak euskararekin probatu dira, euskararen dependentzien analisia baitabereziki hobetu nahi dena.Tesi-lan honen beste atal garrantzitsua euskararako baliabideak sortzea da, sintaxiari hertsiki lotutako baliabideak hain zuzen ere. Tesiak iraun di-tuen urteetan baliabide desberdinak sortu dira, baina bi dira nabarmentzeko modukoak. Alde batetik, 150 milioi hitzeko zuhaitz-bankua etiketatu dasintaktikoki era automatikoan; beste aldetik, euskarazko jatorrizko zuhaitz-bankua nazioarteko Dependentzia Unibertsalak proiektuan proposatzen denformatura bihurtu da. Lehenengo corpusa tesi-lan honetan erabili da automatikoki analizatutako zuhaitz-bankuetatik eratorritako ezaugarriak sortzeko,eta bigarrena edozeinek erabil dezake, publikoki atzigarri baitago.