Handling Reduplication in BasqueA Problem for Spell Checking
- , Dorota Krajewska
- , Tamara Hernández Godoy
ISSN: 1135-5948
Año de publicación: 2011
Número: 47
Páginas: 277-281
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
La reduplicación (la repetición de uno o de parte de un lexema) se trata como repetición y es ignorada o marcada como errónea en los correctores ortográficos existentes. Para la mayoría de las lenguas, ´esta es una estrategia valida, sin embargo, el euskera es diferente en este sentido como muestran variados ejemplos de repeticiones lícitas de secuencias parciales o completas. Parece que este tema ha sido ignorado en las aplicaciones computacionales existentes. En este artículo, ofrecemos una descripción del fenómeno y presentamos un prototipo para incorporarlo en un corrector ortográfico que sería capaz de manejar la reduplicación mejor que los sistemas existentes.
Referencias bibliográficas
- Agirre, E., I. Alegria, X. Arregi, X. Artola, A. D de Ilarraza, M. Maritxalar, K. Sarasola, and M. Urkia. 1992. XUXEN: a spelling checker/corrector for Basque based on Two-Level morphology. In Proceedings of the third conference on Applied natural language processing, pages 119–125.
- Euskaltzaindia. 1995. Hitz elkartuen osaera eta idazkera. http://www.euskaltzaindia.net/dok/arauak/Araua 0025.pdf.
- Hualde, J. I. 2003. Compounds. In J. I Hualde and J. O de Urbina, editors, A Grammar of Basque. Walter de Gruyter, Berlin-New York, pages 351–362.
- Wiltshire, C. and A. Marantz. 2000. Reduplication. In G. Booij, C. Lehman, and J. Mugdan, editors, Morphology: An international handbook on inflection and word-formation. Walter de Gruyter, Berlin-New York, pages 557–567.