Matxin-Informatikaversión del traductor Matxin adaptada al dominio de la informática

  1. Alegría Loinaz, Iñaki
  2. Cabezón, Unai
  3. Labaka Intxauspe, Gorka
  4. Mayor Martinez, Aingeru
  5. Sarasola Gabiola, Kepa
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2011

Número: 47

Páginas: 322-324

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Presentamos Matxin-Informatika, una versión del traductor automático Matxin (de castellano a euskera) adaptada al dominio de la informática a partir de corpus bilingüe y recursos diccionariales. Esta versión va a ser utilizada para una tarea de postedición manual en un entorno colaborativo, a partir de la cual se obtendrá un corpus que servirá para obtener una nueva mejora del traductor mediante postedición estadística.

Referencias bibliográficas

  • Alegria L, Arregi X., Díaz de Ilarraza A., Labaka G., Lersundi M., Mayor A., Sarasola K. 2008. Strategies for sustainable MT for Basque: incremental design, reusability, standardization and open-source. Proceedings of the IJCNLP-08, pp: 235-243. Hydefabad, India.
  • Labaka, G. 2010. EUSMT: Incorporating Linguistic Information into SMT for a Morphologically Rich Language. Its use in SMT-RBMT-EBMT — hybridation. PhD Thesis. (UPV-EHU). Donostia.
  • Mayor, A. 2007. Matxin: Erregeletan oinarritutako itzulpen automatikoko sistema baten eraikuntza estaldura handiko baliabide linguistikoak — berrerabiliz. PhD Thesis. (UPV-EHU). Donostia.
  • Simard, M., Ueffing, N., Isabelle, P., and Kuhn, R. 2007. Rule-based translation with statistical phrase-based post-editing Proceedings of the Second Workshop on Statistical Machine Translation. pp:203-206. Prague, Czech Republic.
  • Franz Josef Och, Hermann Ney. 2003. A Systematic Comparison of Various Statistical Alignment Models. Computational Linguistics, volume 29, number 1, pp. 19-51