Uso de información morfológica en el alineamiento español-euskera
- Agirre Bengoa, Eneko
- Díaz de Ilarraza Sánchez, Arantza
- Labaka Intxauspe, Gorka
- Sarasola Gabiola, Kepa
ISSN: 1135-5948
Datum der Publikation: 2006
Nummer: 37
Seiten: 257-266
Art: Artikel
Andere Publikationen in: Procesamiento del lenguaje natural
Zusammenfassung
En este artículo presentamos un primer estudio para el alineamiento de un corpus español-euskera mediante un alineador token-a-token en el que se consideran diferentes opciones de preprocesamiento morfológico. Usando GIZA++ conseguimos una reducción del error (Alignment Error Rate) de un 12.48% respecto el baseline (carente de preproceso alguno), llegando al 23.76%. Este resultado es comparable al obtenido para otros idiomas aglutinantes como el euskera.