“CorpusLem” una herramienta para la conversión de corpus textuales en datos
-
1
Universidad del País Vasco/Euskal Herriko Unibertsitatea
info
Universidad del País Vasco/Euskal Herriko Unibertsitatea
Lejona, España
- María Luisa Carrió Pastor (ed. lit.)
- Miguel Ángel Candel Mora (ed. lit.)
Editorial: Universidad Politécnica de Valencia = Universitat Politècnica de València
ISBN: 978-84-694-6225-6
Año de publicación: 2011
Páginas: 611-618
Congreso: Congreso Internacional de Lingüistica de Corpus (3. 2011. Valencia)
Tipo: Aportación congreso
Resumen
La herramienta “CorpusLem” es una herramienta online que convierte información textual en datos organizados en una base de datos. Con una interfaz diseñada en distintas lenguas (inglés, español, francés, vasco y catalán), convierte documentos de texto (.doc, .odt o .txt) en datos estructurados en formato MySQL. A su vez, proporciona un índice alfabético de todas las palabras y propone un lema para cada variante juntamente con el contexto. Las correcciones oportunas de los índices se pueden llevar a cabo, tanto en la misma herramienta como en su propio ordenador, con la opción de descargar, y, una vez corregido, implementarlo de nuevo. La herramienta está diseñada para albergar diferentes proyectos y soporta más de un usuario por cada proyecto, pudiendo acceder cada uno de ellos a más de un proyecto. El programa puede actuar con textos en variedad estándar o variedades dialectales, en grafía actualizada o grafía original de los textos.