Árboles consolidadosconstrucción de un árbol de clasificación basado en múltiples submuestras sin renunciar a la explicación
- Javier Muguerza Rivero Zuzendaria
Defentsa unibertsitatea: Universidad del País Vasco - Euskal Herriko Unibertsitatea
Fecha de defensa: 2006(e)ko maiatza-(a)k 12
- Clemente Rodríguez Lafuente Presidentea
- Basilio Sierra Araujo Idazkaria
- Lluís Márquez Villodre Kidea
- Ramón Beinide Palacio Kidea
- Pedro Larrañaga Múgica Kidea
Mota: Tesia
Laburpena
En este trabajo se presenta un nuevo paradigma de aprendizaje automático: el algoritmo de construcción de árboles consolidados, Este algoritmo ha sido ideado para resolver problemas de clasificación donde se requiera cambiar la distribución original de las clases, y, además, se desee obtener una explicación del porqué de la clasificación realizada. Para ello, el algoritmo se basa en un conjunto de muestras extraídas de la base de datos original con la técnica de muestreo adecuada y construye un único árbol de clasificación, que hemos denominado árbol consolidado, como consenso del conocimiento inducido de todas ellas. Varios experimentos han sido realizados para analizar el comportamiento de los árboles consolidados en distintos contextos de aplicación y desde distintos puntos de vista. Los resultados que, en general, los árboles consolidados se adaptan bien a problemas donde se modifica la distribución de las clases, pero, también, cuando son usados como un paradigma de clasificación con capacidades explicativas más, reduciendo la tasa de error de clasificación y obteniendo una mayor estabilidad estructural, es decir, una mayor estabilidad en la explicación de la clasificación. Finalmente, se ha desarrollado una implementación paralela del algoritmo para poder afrontar problemas con grandes volúmenes de datos de una manera eficiente.