Category-based language models in a Spanish spoken dialogue system

  1. Justo Blanco, Raquel
  2. Torres, Inés
  3. Benedí, Miguel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2006

Número: 37

Páginas: 19-24

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

El objetivo principal de este trabajo es comprobar si un modelo de lenguaje basado en categorías puede mejorar el rendimiento de un sistema de diálogo, de la misma forma que lo hace para aplicaciones que utilizan bases de datos no espontáneas y de mayores dimensiones en inglés. En primer lugar, se obtienen diversos conjuntos de categorías generados en base a diferentes criterios de clasificación. Para cada grupo de categorías se generan dos modelos: Un modelo de lenguaje basado en k-gramas de categorías y un modelo híbrido que es una interpolación de un modelo de lenguaje basado en palabras y uno basado en categorías. Finalmente, se presentan los experimentos realizados sobre un corpus de diálogo espontáneo en castellano para los que se han obtenido resultados de Perplejidad y Word Error Rate.