Una cascada de transductores simples para normalizar tweets
-
1
Universidad del País Vasco/Euskal Herriko Unibertsitatea
info
Universidad del País Vasco/Euskal Herriko Unibertsitatea
Lejona, España
- Alberto Díaz Esteban (coord.)
- Iñaki Alegria Loinaz (coord.)
- Julio Villena Román (coord.)
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
ISBN: 978-84-695-8349-4
Year of publication: 2013
Pages: 52-56
Congress: Sociedad Española para el Procesamiento del Lenguaje Natural. Congreso (29. 2013. Madrid)
Type: Conference paper
Abstract
A system where several transducer or FST are combined in cascade is presented. Each transducer manages a simple step: learned examples, named-entities, basic misspellings, collapsed words, onomatopoeia words, more complex changes, lowercase/uppercase letters.