Handling Reduplication in BasqueA Problem for Spell Checking

  1. , Dorota Krajewska
  2. , Tamara Hernández Godoy
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2011

Número: 47

Páginas: 277-281

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

La reduplicación (la repetición de uno o de parte de un lexema) se trata como repetición y es ignorada o marcada como errónea en los correctores ortográficos existentes. Para la mayoría de las lenguas, ´esta es una estrategia valida, sin embargo, el euskera es diferente en este sentido como muestran variados ejemplos de repeticiones lícitas de secuencias parciales o completas. Parece que este tema ha sido ignorado en las aplicaciones computacionales existentes. En este artículo, ofrecemos una descripción del fenómeno y presentamos un prototipo para incorporarlo en un corrector ortográfico que sería capaz de manejar la reduplicación mejor que los sistemas existentes.

Referencias bibliográficas

  • Agirre, E., I. Alegria, X. Arregi, X. Artola, A. D de Ilarraza, M. Maritxalar, K. Sarasola, and M. Urkia. 1992. XUXEN: a spelling checker/corrector for Basque based on Two-Level morphology. In Proceedings of the third conference on Applied natural language processing, pages 119–125.
  • Euskaltzaindia. 1995. Hitz elkartuen osaera eta idazkera. http://www.euskaltzaindia.net/dok/arauak/Araua 0025.pdf.
  • Hualde, J. I. 2003. Compounds. In J. I Hualde and J. O de Urbina, editors, A Grammar of Basque. Walter de Gruyter, Berlin-New York, pages 351–362.
  • Wiltshire, C. and A. Marantz. 2000. Reduplication. In G. Booij, C. Lehman, and J. Mugdan, editors, Morphology: An international handbook on inflection and word-formation. Walter de Gruyter, Berlin-New York, pages 557–567.