Árboles consolidadosconstrucción de un árbol de clasificación basado en múltiples submuestras sin renunciar a la explicación
- Javier Muguerza Rivero Director/a
Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 12 de mayo de 2006
- Clemente Rodríguez Lafuente Presidente/a
- Basilio Sierra Araujo Secretario/a
- Lluís Márquez Villodre Vocal
- Ramón Beinide Palacio Vocal
- Pedro Larrañaga Múgica Vocal
Tipo: Tesis
Resumen
En este trabajo se presenta un nuevo paradigma de aprendizaje automático: el algoritmo de construcción de árboles consolidados, Este algoritmo ha sido ideado para resolver problemas de clasificación donde se requiera cambiar la distribución original de las clases, y, además, se desee obtener una explicación del porqué de la clasificación realizada. Para ello, el algoritmo se basa en un conjunto de muestras extraídas de la base de datos original con la técnica de muestreo adecuada y construye un único árbol de clasificación, que hemos denominado árbol consolidado, como consenso del conocimiento inducido de todas ellas. Varios experimentos han sido realizados para analizar el comportamiento de los árboles consolidados en distintos contextos de aplicación y desde distintos puntos de vista. Los resultados que, en general, los árboles consolidados se adaptan bien a problemas donde se modifica la distribución de las clases, pero, también, cuando son usados como un paradigma de clasificación con capacidades explicativas más, reduciendo la tasa de error de clasificación y obteniendo una mayor estabilidad estructural, es decir, una mayor estabilidad en la explicación de la clasificación. Finalmente, se ha desarrollado una implementación paralela del algoritmo para poder afrontar problemas con grandes volúmenes de datos de una manera eficiente.