Aditza+izena unitate fraseologikoak gaztelaniatik euskararaazterketa eta tratamendu konputazionala

  1. IÑURRIETA URMENETA, USOA
unter der Leitung von:
  1. Itziar Aduriz Doktorvater/Doktormutter
  2. Gorka Labaka Intxauspe Doktorvater/Doktormutter
  3. Kepa Sarasola Gabiola Doktorvater/Doktormutter

Universität der Verteidigung: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 29 von November von 2019

Gericht:
  1. Ricardo Etxepare Präsident/in
  2. Miren Karmele Azkarate Villar Sekretär/in
  3. Margarita Alonso-Ramos Vocal
Fachbereiche:
  1. Lenguajes y Sistemas Informáticos

Art: Dissertation

Teseo: 151515 DIALNET lock_openADDI editor

Zusammenfassung

Unitate Fraseologikoak (UFak) hizkuntzek bere-bereak dituzten hitz-konbinazio idiomatikoak dira. Hizkuntzaren Prozesamenduko (HPko) tresnek kalitatezko emaitzak izan ditzaten, beharrezkoa da halakoak ondo tratatzea, baina lan horrek hainbat zailtasun ditu; besteak beste, hitzez hitzeko itzulgarritasun eza. Tesi-lan honetan, aditza+izena motako UFen azterketa linguistiko bat egin dugu, halakoek HPren alorrean sortzen dituzten bi arazo garrantzitsuri aurre egiten laguntzeko: batetik, corpusetan UFak automatikoki identifikatzeari, eta bestetik, UF horiek gaztelaniaren eta euskararen artean automatikoki itzultzeari. Azterketa linguistikotik ateratako informazioa bi atazetarako baliatu dugu, eta oso emaitza onak lortu ditugu bietan.Horrez gain, hizkuntza-baliabideen sorkuntzan ere, bi ekarpen egin ditugu tesi-lan honen baitan. Lehena, landutako UFak, ordainak eta haien inguruko informazio linguistikoa biltzen dituen datu-base bat sortzea eta sarean eskuragarri jartzea: Konbitzul. Eta bigarrena, euskarazko aditz-UFak corpus batean etiketatzea, PARSEME proiektu europarrak sorturiko irizpideei jarraituz; corpus hori ere publiko egin da, irizpide berberei jarraituz landutako beste 19 hizkuntzatako corpusekin batera.