“CorpusLem” una herramienta para la conversión de corpus textuales en datos

  1. Gotzon Aurrekoetxea 1
  1. 1 Universidad del País Vasco/Euskal Herriko Unibertsitatea
    info

    Universidad del País Vasco/Euskal Herriko Unibertsitatea

    Lejona, España

    ROR https://ror.org/000xsnr85

Libro:
Las tecnologías de la información y las comunicaciones: presente y futuro en el análisis de corpus: Actas del III Congreso Internacional de Lingüistica de Corpus
  1. María Luisa Carrió Pastor (ed. lit.)
  2. Miguel Ángel Candel Mora (ed. lit.)

Editorial: Universidad Politécnica de Valencia = Universitat Politècnica de València

ISBN: 978-84-694-6225-6

Año de publicación: 2011

Páginas: 611-618

Congreso: Congreso Internacional de Lingüistica de Corpus (3. 2011. Valencia)

Tipo: Aportación congreso

Resumen

La herramienta “CorpusLem” es una herramienta online que convierte información textual en datos organizados en una base de datos. Con una interfaz diseñada en distintas lenguas (inglés, español, francés, vasco y catalán), convierte documentos de texto (.doc, .odt o .txt) en datos estructurados en formato MySQL. A su vez, proporciona un índice alfabético de todas las palabras y propone un lema para cada variante juntamente con el contexto. Las correcciones oportunas de los índices se pueden llevar a cabo, tanto en la misma herramienta como en su propio ordenador, con la opción de descargar, y, una vez corregido, implementarlo de nuevo. La herramienta está diseñada para albergar diferentes proyectos y soporta más de un usuario por cada proyecto, pudiendo acceder cada uno de ellos a más de un proyecto. El programa puede actuar con textos en variedad estándar o variedades dialectales, en grafía actualizada o grafía original de los textos.