Lessons from the development of a named entity recognizer for Basque
- Alegría Loinaz, Iñaki
- Arregi Uriarte, Olatz
- Ezeiza Ramos, Nerea
- Fernández, Ignacio
ISSN: 1135-5948
Año de publicación: 2006
Número: 36
Páginas: 25-38
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
En este trabajo se presenta el diseño de un sistema de Reoconocimiento de Entidades para textos escritos en vasco. Para el desarrollo de dicho sistema se han probado diferentes técnicas, algunas de ellas basadas en información linguística y otras en cambio aplicando diversos métodos de aprendizaje automático. Además de presentar cada técnica por separado y sus correspondientes experiementos con diferentes fuentes de información, proponemos también una serie de combinaciones con diferentes metodos para obtener así un sistema más completo y robusto. Para concluir, presentamos las conclusiones y reflexiones concluidas de todos estos experimentos, especialmente válidas para aquellos sistemas que traten el reconocimiento de entidades en textos escritos en otros idiomas que no sea el inglés.