ASKHiAnalisi sintaktiko konputazional hibridoa paradigma desberdinen konbinazioan oinarrituta

  1. GOENAGA AZCARATE, IAKES
Dirigée par:
  1. Nerea Ezeiza Ramos Directeur/trice
  2. Koldobika Gojenola Galletebeitia Directeur/trice

Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 31 mars 2017

Jury:
  1. Itziar Aduriz President
  2. Arantza Díaz de Ilarraza Sánchez Secrétaire
  3. Igor Leturia Azkarate Rapporteur
Département:
  1. Lenguajes y Sistemas Informáticos

Type: Thèses

Teseo: 123414 DIALNET lock_openADDI editor

Résumé

Hizkuntzaren Prozesamenduan sintaxiak berebiziko garrantzia du. Hainbat atazatan erabiltzen da sintaxitik eratorritako informazioa, esaterako itzulpen automatikoan, rol semantikoen etiketatzean eta sentimenduen analisian. Tesi-lan honetan sintaxi konputazionala landu da, zehazki dependentzietanoinarritutako sintaxia jorratu da analizatzaile automatikoen bidez. Dependentzien analisi sintaktiko automatikoa hobetzeko bide desberdinak aztertudira: izaera desberdinetako analizatzaileen hibridazioa, ezaugarrien ingeniaritzako tekniken erabilpena, multzokatze mota desberdinen esperimentazioaeta automatikoki analizatutako zuhaitz-bankuetatik eratorritako ezaugarrien erabilpena.Bide horiek guztiak jorratzearen arrazoi nagusia morfologikoki aberatsak diren hizkuntzen dependentzien analisia hobetzen lagundu dezaketen era des-berdinak aztertzea da. Hori dela eta, egindako esperimentu gehienak bost hizkuntza desberdinetan probatu dira (euskara, frantsesa, alemana, hunga-riera eta suediera), eta hizkuntza horietan guztietan probatu ezin izan diren bideak euskararekin probatu dira, euskararen dependentzien analisia baitabereziki hobetu nahi dena.Tesi-lan honen beste atal garrantzitsua euskararako baliabideak sortzea da, sintaxiari hertsiki lotutako baliabideak hain zuzen ere. Tesiak iraun di-tuen urteetan baliabide desberdinak sortu dira, baina bi dira nabarmentzeko modukoak. Alde batetik, 150 milioi hitzeko zuhaitz-bankua etiketatu dasintaktikoki era automatikoan; beste aldetik, euskarazko jatorrizko zuhaitz-bankua nazioarteko Dependentzia Unibertsalak proiektuan proposatzen denformatura bihurtu da. Lehenengo corpusa tesi-lan honetan erabili da automatikoki analizatutako zuhaitz-bankuetatik eratorritako ezaugarriak sortzeko,eta bigarrena edozeinek erabil dezake, publikoki atzigarri baitago.