Uso de información morfológica en el alineamiento español-euskera

Agirre Bengoa, Eneko; Díaz de Ilarraza Sánchez, Arantza; Labaka Intxauspe, Gorka; Sarasola Gabiola, Kepa

Uso de información morfológica en el alineamiento español-euskera

Aldizkaria:

Procesamiento del lenguaje natural

ISSN: 1135-5948

Argitalpen urtea: 2006

Zenbakia: 37

Orrialdeak: 257-266

Mota: Artikulua

DIALNET GOOGLE SCHOLAR RUA editor

Beste argitalpen batzuk: Procesamiento del lenguaje natural

Laburpena

En este artículo presentamos un primer estudio para el alineamiento de un corpus español-euskera mediante un alineador token-a-token en el que se consideran diferentes opciones de preprocesamiento morfológico. Usando GIZA++ conseguimos una reducción del error (Alignment Error Rate) de un 12.48% respecto el baseline (carente de preproceso alguno), llegando al 23.76%. Este resultado es comparable al obtenido para otros idiomas aglutinantes como el euskera.

Datuen iturria: Dialnet