TUNERMultifaceted Domain Adaptation for Advanced Textual Semantic Processing. First Results Available
- Rigau Claramunt, German
- Saggion, Horacio
- Agerri Gascón, Rodrigo
- Bel Rafecas, Núria
ISSN: 1135-5948
Argitalpen urtea: 2018
Zenbakia: 61
Orrialdeak: 163-166
Mota: Artikulua
Beste argitalpen batzuk: Procesamiento del lenguaje natural
Laburpena
El proyecto coordinado TUNER (2016-2018) se ha centrado en el desarrollo de tecnologías de adaptación a dominio que permitan reducir el coste de la creación de recursos lingüísticos para desarrollar sistemas en diferentes lenguas y para diferentes dominios y géneros. En este artículo presentamos los demostradores, prototipos y recursos que son resultados del proyecto ya disponibles.
Erreferentzia bibliografikoak
- Agerri, R., J. Bermudez, and G. Rigau (2014). IXA pipeline: Efficient and Ready to Use Multilingual NLP tools. In Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC 2014), pp. 3823-3828.
- Agerri, R.; X. Gómez Guinovart; G. Rigau; M. A. Solla Portela (2018). Developing New Linguistic Resources and Tools for the Galician Language. Proceedings of the 11th Language Resources and Evaluation Conference (LREC'18).
- Agirre, E. and A. Soroa. (2009). Personalizing PageRank for Word Sense Disambiguation. In Proceedings of the 12th Conference of the European Chapter of the ACL, pp. 33-41.
- Bengoetxea, K.; A. Atutxa; M. Iruskieta (2017). Un detector de la unidad central de un texto basado en técnicas de aprendizaje automático en textos científicos para el euskera. Procesamiento del Lenguaje Natural, 58, 37-44.
- Bengoetxea, K.; M. Iruskieta (2018). A Supervised Central Unit Detector for Spanish. Procesamiento del Lenguaje Natural, 60, 29-36.
- Ferrès, D.; Saggion, H.; Rozano, F.; Bravo, À. (2018). PDFdigest: an Adaptable Layout-Aware PDF-to-XML Textual Content Extractor for Scientific Articles. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018).
- Gómez Guinovart, X.; M. A. Solla Portela (2018). Building the Galician wordnet: methods and applications. Language Resources and Evaluation, 52:1, 317-339.
- Marimon, M., J. Vivaldi, and N. Bel. (2017). Annotation of negation in the IULA Spanish clinical record corpus. In Proceedings of the Workshop SemBEaR 2017. ACL. p. 43-52.
- Montoya, I. (2017). Análisis, normalización, enriquecimiento y codificación de historia clínica electrónica (HCE). Tesis del Máster Universitario Konputazio Ingeniaritza eta Sistema Adimentsuak, (UPV/EHU).
- Otegi, A.; O. Imaz; A. Díaz de Ilarraza; M. Iruskieta; L. Uria (2017). ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research. Procesamiento del Lenguaje Natural 58: 77-84.
- Perez, N., M. Cuadros y G. Rigau (2018). Biomedical term normalization of EHRs with UMLS. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018).
- Saggion, H.; F. Ronzano; P. Accuosto; D. Ferrés (2017). MultiScien: a Bi-Lingual Natural Language Processing System for Mining and Enrichment of Scientific Collections. BIRNDL@SIGIR (1) 2017: 26-40
- Solla Portela, M. A. and X. Gómez Guinovart (2017). Diseño y elaboración del corpus SemCor del gallego anotado semánticamente con WordNet 3.0. Procesamiento del Lenguaje Natural, 59, 137-140 (ISSN 1135-5948