On unsupervised learning of Bayesian networks and conditional Gaussian networks

Peña Palomar, José Manuel

On unsupervised learning of Bayesian networks and conditional Gaussian networks

Peña Palomar, José Manuel

Dirigée par:

Pedro Larrañaga Múgica Directeur/trice
José Antonio Lozano Alonso Directeur/trice

Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 11 décembre 2001

Jury:

Francisco Javier Torrealdea Folgado President
Basilio Sierra Araujo Secrétaire
Serafín Moral Callejón Rapporteur
Enrique Castillo Ron Rapporteur
Pedro Isasi Viñuela Rapporteur

Département:

Ciencia de la Computación e Inteligencia Artificial

Type: Thèses

Teseo: 89985 DIALNET

Résumé

Uno de los problemas que está presente en una gran variedad de campos, incluyendo reconocimiento de patrones, aprendizaje automático, y estadística, es el problema de la clasificación no supervisada o aprendizaje no supervisado, Dada una base de datos consistente en un conjunto de instancias con una estructura de grupo subyacente, la clasificación no supervisada puede definirse como la descripción de la estructura de grupo subyacente cuando no se desconoce el grupo de pertenencia de cada instancia. La tesis se centra en el estudio de la clasificación no supervisada desde la perspectiva probabilística y, por tanto, no pretende obtener como solución una participación de la base de datos dada sino un modelo del mecanismo generador de los datos, esto es, una distribución de probabilidad conjunta sobre las variables aleatorias del dominio. Un ejemplo clásico de aproximación probabilística al problema de la clasificación no supervisada son los modelos finitos mixtos. Los cuales, aun reconociendo sus sólidas bases estadísticas, conllevan una serie de dificultades que, en muchos casos, merman su practicidad y atractivo. Dichas dificultades tienen un origen comón: Las manipulaciones y operaciones en espacios altamente multidimensionales que los modelos finitos mixtos conllevan. La tesis aprovecha las ventajas de los modelos gráficos probabilísticos (principalmente manejabilidad, interpretabilidad, y modularidad), como paradigma que permite codificar distribuciones de probabilidad conjunta a la vez que evita los inconvenientes de los modelos finitos mixtos, con el fin de resolver el problema de la clasificación no supervisada en dominios tanto discretos como continuos. En concreto, la tesis demuestra la utilidad de las redes Bayesianas para clasificación no supervisada en dominios discretos y de las redes condicionales Gaussianas para clasificación no supervisada en dominios continuos, como clases particulares de modelos grá