HABE-IXA euskarazko idazmen-proben corpuseko idazlanen mailakatze automatikoa
- Arrieta Franco, Ekain
- Odriozola Sustaeta, Igor
- Arregi Iparragirre, Xabier
- Iruskieta Quintian, Mikel
ISSN: 1136-5714, 2530-3287
Argitalpen urtea: 2023
Urtea: 41
Zenbakia: 101
Mota: Artikulua
Beste argitalpen batzuk: Hizpide: helduen euskalduntzearen aldizkaria
Laburpena
Gero eta euskarazko testu gehiago idazten da ordenagailuz eta hainbat erabileratarako interesgarria litzateke Helduen Euskalduntzearen Oinarrizko Curriculumeko (HEOC) komunikagaitasun-mailetan oinarrituta testuok automatikoki mailakatzea. Artikulu honetan azalduko den lanaren helburua honako hau da: HABE-IXA euskarazko idazmen-proben corpusa aurkeztea eta, Europako Erreferentzia Marko Bateratuko (EEMB) B1, B2, C1 eta C2 mailen arabera sailkatzeko tresna automatikoekin lortutako emaitzak azaltzea. HABE-IXA corpusa HABE erakundeak egiaztatzegintza-prozesuetan jasotako 480 idazlanez eta horien ebaluazioez osaturik dago. Testu-sailkapenean, Ixa taldeak (UPV/EHU) hizkuntza-prozesamendurako sorturiko analisi-tresnak eta ikasketa automatikoko teknikak erabiliz, zenbait sailkapen-ataza garatu dira eta emaitzarik onena (% 97ko zehaztasuna) idazlanei dagokien maila esleitzean lortu da. Etorkizuneko asmoa da corpus handiagoak osatu eta euskararen irakaskuntzarako baliagarriak izan daitezkeen sailkapen-tresnak garatzea. Corpusa eskura dago CC BY-NC 4.0 lizentziapean.