Handling Reduplication in Basque

  1. Krajewska, Dorota
  2. Hernández Godoy, Tamara
Revue:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Année de publication: 2011

Número: 47

Pages: 277-281

Type: Article

D'autres publications dans: Procesamiento del lenguaje natural

Résumé

La reduplicación (la repetición de uno o de parte de un lexema) se trata como repetición y es ignorada o marcada como errónea en los correctores ortográficos existentes. Para la mayoría de las lenguas, ésta es una estrategia válida, sin embargo, el euskera es diferente en este sentido como muestran variados ejemplos de repeticiones lícitas de secuencias parciales o completas. Parece que este tema ha sido ignorado en las aplicaciones computacionales existentes. En este artículo, ofrecemos una descripción del fenómeno y presentamos un prototipo para incorporarlo en un corrector ortográfico que será capaz de manejar la reduplicación mejor que los sistemas existentes.

Références bibliographiques

  • Agirre, E., I. Alegria, X. Arregi, X. Artola, A. D de Ilarraza, M. Maritxalar, K. Sarasola, and M. Urkia. 1992. XUXEN: a spelling checker/corrector for Basque based on Two-Level morphology. In Proceedings of the third conference on Applied natural language processing, pages 119–125.
  • Hualde, J. I. 2003. Compounds. In J. I Hualde and J. O de Urbina, editors, A Grammar of Basque. Walter de Gruyter, Berlin-New York, pages 351–362.
  • Wiltshire, C. and A. Marantz. 2000. Reduplication. In G. Booij, C. Lehman, and J. Mugdan, editors, Morphology: An international handbook on inflection and word-formation. Walter de Gruyter, Berlin-New York, pages 557–567.