Epec corpusa predikatu-mailan etiketatzeko oinarriakEPEC-RolSem, BVI ETA e-ROLda
- Izaskun Aldezabal Roteta Zuzendaria
Defentsa unibertsitatea: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 2014(e)ko iraila-(a)k 04
- Itziar Laka Mugarza Presidentea
- Arantza Díaz de Ilarraza Sánchez Idazkaria
- Elisabete Pociello Irigoyen Kidea
- Elixabete Pérez Gaztelu Kidea
- Ricardo Etxepare Kidea
Mota: Tesia
Laburpena
Tesi-lan hau Hizkuntzaren Prozesamenduaren alorrean kokatzen da. Azkenaldian hain modan dagoen corpus based eta corpus driven linguistic delakoaren barnean sartzen da, eta, zehatzago, corpusetan oinarritutako lexikografian. Hala, EPEC (Euskararen Prozesamendurako Erreferentzia Corpusa) corpuseko aditzak adiera, balentzia eta rol semantikoekin (zenbaitetan, hautapen-murriztapenekin ere) etiketatu, eta izenburuan aipatzen diren oinarriak sortu dira: corpusa bera etiketatua (EPEC-RolSem), aditzen lexikoia PropBank-VerbNet ereduari jarraituta (Basque Verb Index (BVI)), eta, azkenik, horiek kontsultatzeko e-ROLda tresna (http://ixa2.si.ehu.es/e-rolda/bilatu.php).Corpusa etiketatzearen eta lexikoia osatzearen helburu nagusiak erdiesteko, tarteko bestelako ekarpenak ere aurkeztu ditugu, hala nola, corpusa predikatu-mailan etiketatzeko metodologia egokia eta etiketatze-lana aurrera eramateko irizpide argiak dituen eskuliburua.Aditzen etiketatze-lan honek hizkuntzaren hainbat fenomeno aztertzeko aukera eman digu. Alde batetik, ingeleserako sortutako eredu bat erabiltzeak, hizkuntzen arteko aldeak lantzeko bidea eman digu, eta, bestetik, euskarazko aditzen inguruan hainbat fenomeno aztertzeko aukera ere.