Modelos K-explorables en sentido estricto integrados en un sistema de reconocimiento automático del habla

Varona Fernández, Amparo

Modelos K-explorables en sentido estricto integrados en un sistema de reconocimiento automático del habla

Varona Fernández, Amparo

Zuzendaria:

María Inés Torres Barañano Zuzendaria

Defentsa unibertsitatea: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 2000(e)ko apirila-(a)k 12

Epaimahaia:

Francisco Casacuberta Nolla Presidentea
Germán Bordel García Idazkaria
Enrique Vidal Ruiz Kidea
José Bernardo Mariño Acebal Kidea
Antonio José Rubio Ayuso Kidea

Saila:

Elektrizitatea eta Elektronika

Mota: Tesia

Teseo: 78102 DIALNET

Laburpena

Una de las etapas fundamentales en un sistema de RAH es la incorporación de conocimiento sintáctico y/o semántico mediante un Modelo de Lenguaje (ML), Uno de los principales objetivos de este trabajo ha sido aplicar una aproximación grmatical al modelado de lenguaje, basada en la utilización de una subclase de las gramáticas regualares, conocidas como gramáticas k-Eplorables en Sentido Estricto (k-EE). Además, la construcción y evaluación de los ML se ha realizado en base a resultados de reconocimiento. Con la integración directa de las probabilidades acústicas y de ML no se logran los resultados de decodificación óptimos. En este trabajo se ha estudiado y evaluado los heurísticos que se utilizan tradicionalmente (ponderación lineal y exponencial sobre las probabilidades del acústicas y de ML) para mejorar el comportamiento del sistema, junto con nuevas propuestas (aplicación de una funciónescalón, combinación de hurísticos, etc.). El uso de las gramáticas k-EE permite integrar en un sólo modelo K autómatas k-EE deterministas (k=1.K) y la técnica de suavizado por back-off. La fomralización de este modelo ha sido también objetivo del trabajo. Además el suaviado de los ML es fundamental para evitar las probabilidades igual a cero de las combinaciones de palabras que no aparecen en las muestras de entrenamiento. En este trabajo se han evaluado, dentro del sistema de RAH, varios descuentos usando la técnica de back-off sintáctico: propuestas clásicas (Witten-Bell, Absoluto y Lineal) y nuevas propuestas (Sencillo y Acotado). Para reducir el tamaño de los modelos se ha evaluado también el efecto que tiene en decodificación la poda de los modelos k-EE suavizados con los distintos descuentos evaluados previamente. Se compara el diferente comportamiento de los modelos podados frente a los no podados.