Testu kopuru handiak prozesatzeko big data teknikak

Z. Beloki; X. Artola; A. Soroa

Testu kopuru handiak prozesatzeko big data teknikak

Z. Beloki ¹
X. Artola ¹
A. Soroa ¹

1 Euskal Herriko Unibertsitatea/Universidad del País Vasco

Libro:

I. IkergazteNazioarteko ikerketa euskaraz. Kongresuko artikulu-bilduma: 2015eko maiatzaren 13, 14 eta 15a. Durango, Euskal Herria

Iñaki Alegría (ed. lit.)
Ainhoa Latatu (ed. lit.)
Miren Josu Ormaetxeberria (ed. lit.)

Editorial: Udako Euskal Unibertsitatea, UEU = Universidad Vasca de Verano

ISBN: 978-84-8438-539-4

Año de publicación: 2015

Páginas: 589-598

Congreso: Ikergazte. Nazioarteko Ikerketa Euskaraz (1. 2015. Durango)

Tipo: Aportación congreso

DIALNET GOOGLE SCHOLAR

Resumen

Eskura dauzkagun datu kopuru erraldoiak prozesatzeko, zaharkituta gelditu dira XXI. mendearenhasieran erabiltzen ziren prozesaketa-teknikak eta algoritmoak. Gaur egun sistema banatuak erabiltzendira, prozesaketa makina batean baino gehiagotan eginez. Gauza berbera gertatzen da hizkuntzarenprozesamenduan ere. Corpusak edo testu-bilduma handiak prozesatzeko, makina bat baino gehiagokoinguruneak beharrezkoak bihurtu dira dagoeneko. Lan honetan, testu-dokumentu kopuru handiak ingurune banatuetan prozesatzeko teknikak aztertuko ditugu. Horretarako, makina birtualetan oinarritutakosistema bat eraiki dugu, Storm konputazio banatuko frameworka erabiliz. Esperimentu batzuk ereaurkeztu ditugu, eta hainbat ezarpenekin lortutako errendimenduaren hobekuntzak.

Fuente de los datos: Dialnet