Matxin. Erregeletan oinarritutako itzulpen automatikoko sistema baten eraikuntza estaldura handiko baliabide linguistikoak berrerabiliz (matxin. Construcción de un sistema de traducción automática basado en reglas reutilizando recursos lingüísticos de amplia cobertura)
- Kepa Sarasola Gabiola Director/a
- Arantza Díaz de Ilarraza Sánchez Codirector/a
Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 27 de noviembre de 2007
- Mikel L. Forcada Zubizarreta Presidente/a
- Iñaki Alegría Loinaz Secretario/a
- Lluís Márquez Villodre Vocal
- Inmaculada Hernáez Rioja Vocal
- Joseba Abaitua Vocal
Tipo: Tesis
Resumen
Matxin erregeletan oinarritutako espainiera-euskara itzulpen automatikoko (IA) sitema aurkezten dugu. Sistema erabilera orokorrekoa da, itzulpen prozesu osoa automatikoki burutzen du eta edozein hizkuntzatatik euskarara itzuli ahal izateko diseinatu da. Corpusetan oinarritutako hurbilpenek muga handiak dituzte euskarara itzulzeko orduan: alde batetik euskara hizkuntza eranskaria delako eta bestetik euskararako dauden corpusen tamaina mugatua delako. Gure sistemaren eraikuntzarekin erregeletan oinarritutako estretegiaren egokitasuna frogatzen dugu euskara bezalako hizkuntza batera itzulzeko. Hainbat trenza eta baliabide linguistiko berrerabili ahal izateko formatuen estandarizazioan lan sakona egin dugu. Horrela datuen eta moduluen arteko elkarreragingarritasuna bermatu dugu eta guk sortutako muduluen berrerabilgarritasuna ziurtatu. Egindako lana aitzindaria da, bai euskararekin lan egiten duen lehenengo IAko sistema erabilgarria delako eta bai software librean eraikitako lehenengo IAko sistematako bat delako. Euskal ikerlarientzar oinarrizko erreferentzia izan daitekeen IAren inguruko ezagutzaren aurkezpena ere ematen dugu: historia, estrategia, desberdinak, egungo egoera eta etorkizuneko erronkak. En esta tesis presentamos el sistema de traducción automática (TA) basad en reglas Matxin. El sistema está diseñado para traducir textos de cualquier lengua al euskera y ha sido implementado para el par español-euskara. Los sistemas basados en hábeas se encuentran con dos grandes limitaciones; por un lado la poca disponibilidad de hábeas en euskara, y por otro que la euskara es una lengua aglutinativa. Con la construcción de nuestro sistema demostramos la idoneidad de las estrategias basadas en reglas para traducir a lenguas de las características del euskara. La reutilización de herramientas y recursos lingüísticos ha hecho necesaria la estandarización de los formatos. Así se garantiza la interoperabilidad entre datos y módulos, además de posibilitar la reutilización de os módulos construidos. El sistema que presentamos es pionero, tanto por ser el primer sistema de TA de uso publico que trabaja con el euskara, como por ser uno de los primeros sistemas de TA implementado en código libre. En esta tesis se presenta, por primera vez en euskara, un panorama general de la TA: historia, descripción de las diferentes estrategias, situación actual y retos futuros.