HABE-IXA euskarazko idazmen-proben corpuseko idazlanen mailakatze automatikoa

  1. Arrieta Franco, Ekain
  2. Odriozola Sustaeta, Igor
  3. Arregi Iparragirre, Xabier
  4. Iruskieta Quintian, Mikel
Revista:
Hizpide: helduen euskalduntzearen aldizkaria

ISSN: 1136-5714 2530-3287

Año de publicación: 2023

Año: 41

Número: 101

Tipo: Artículo

DOI: 10.54512/AGRJ9063 DIALNET GOOGLE SCHOLAR lock_openAcceso abierto editor

Otras publicaciones en: Hizpide: helduen euskalduntzearen aldizkaria

Resumen

Gero eta euskarazko testu gehiago idazten da ordenagailuz eta hainbat erabileratarako interesgarria litzateke Helduen Euskalduntzearen Oinarrizko Curriculumeko (HEOC) komunikagaitasun-mailetan oinarrituta testuok automatikoki mailakatzea. Artikulu honetan azalduko den lanaren helburua honako hau da: HABE-IXA euskarazko idazmen-proben corpusa aurkeztea eta, Europako Erreferentzia Marko Bateratuko (EEMB) B1, B2, C1 eta C2 mailen arabera sailkatzeko tresna automatikoekin lortutako emaitzak azaltzea. HABE-IXA corpusa HABE erakundeak egiaztatzegintza-prozesuetan jasotako 480 idazlanez eta horien ebaluazioez osaturik dago. Testu-sailkapenean, Ixa taldeak (UPV/EHU) hizkuntza-prozesamendurako sorturiko analisi-tresnak eta ikasketa automatikoko teknikak erabiliz, zenbait sailkapen-ataza garatu dira eta emaitzarik onena (% 97ko zehaztasuna) idazlanei dagokien maila esleitzean lortu da. Etorkizuneko asmoa da corpus handiagoak osatu eta euskararen irakaskuntzarako baliagarriak izan daitezkeen sailkapen-tresnak garatzea. Corpusa eskura dago CC BY-NC 4.0 lizentziapean.