Matxin-Informatikaversión del traductor Matxin adaptada al dominio de la informática
- Alegría Loinaz, Iñaki
- Cabezón, Unai
- Labaka Intxauspe, Gorka
- Mayor Martinez, Aingeru
- Sarasola Gabiola, Kepa
ISSN: 1135-5948
Año de publicación: 2011
Número: 47
Páginas: 322-324
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Presentamos Matxin-Informatika, una versión del traductor automático Matxin (de castellano a euskera) adaptada al dominio de la informática a partir de corpus bilingüe y recursos diccionariales. Esta versión va a ser utilizada para una tarea de postedición manual en un entorno colaborativo, a partir de la cual se obtendrá un corpus que servirá para obtener una nueva mejora del traductor mediante postedición estadística.
Referencias bibliográficas
- Alegria L, Arregi X., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K. 2008. Strategies for sustainable MT for Basque: incremental design, reusability, standardization and open-source. Proceedings of the IJCNLP-08, pp: 235-243. Hydefabad, India.
- Labaka, G. 2010. EUSMT: Incorporating Linguistic Information into SMT for a Morphologically Rich Language. Its use in SMT-RBMT-EBMT — hybridation. PhD Thesis. (UPV-EHU). Donostia.
- Mayor, A. 2007. Matxin: Erregeletan oinarritutako itzulpen automatikoko sistema baten eraikuntza estaldura handiko baliabide linguistikoak — berrerabiliz. PhD Thesis. (UPV-EHU). Donostia.
- Simard, M., Ueffing, N., Isabelle, P., and Kuhn, R. 2007. Rule-based translation with statistical phrase-based post-editing Proceedings of the Second Workshop on Statistical Machine Translation. pp:203-206. Prague, Czech Republic.
- Franz Josef Och, Hermann Ney. 2003. A Systematic Comparison of Various Statistical Alignment Models. Computational Linguistics, volume 29, number 1, pp. 19-51