Árboles consolidadosconstrucción de un árbol de clasificación basado en múltiples submuestras sin renunciar a la explicación

  1. Pérez de la Fuente, Jesús María
Supervised by:
  1. Javier Muguerza Rivero Director

Defence university: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 12 May 2006

Committee:
  1. Clemente Rodríguez Lafuente Chair
  2. Basilio Sierra Araujo Secretary
  3. Lluís Márquez Villodre Committee member
  4. Ramón Beinide Palacio Committee member
  5. Pedro Larrañaga Múgica Committee member
Department:
  1. Arquitectura y Tecnología de Computadores

Type: Thesis

Teseo: 132521 DIALNET

Abstract

En este trabajo se presenta un nuevo paradigma de aprendizaje automático: el algoritmo de construcción de árboles consolidados, Este algoritmo ha sido ideado para resolver problemas de clasificación donde se requiera cambiar la distribución original de las clases, y, además, se desee obtener una explicación del porqué de la clasificación realizada. Para ello, el algoritmo se basa en un conjunto de muestras extraídas de la base de datos original con la técnica de muestreo adecuada y construye un único árbol de clasificación, que hemos denominado árbol consolidado, como consenso del conocimiento inducido de todas ellas. Varios experimentos han sido realizados para analizar el comportamiento de los árboles consolidados en distintos contextos de aplicación y desde distintos puntos de vista. Los resultados que, en general, los árboles consolidados se adaptan bien a problemas donde se modifica la distribución de las clases, pero, también, cuando son usados como un paradigma de clasificación con capacidades explicativas más, reduciendo la tasa de error de clasificación y obteniendo una mayor estabilidad estructural, es decir, una mayor estabilidad en la explicación de la clasificación. Finalmente, se ha desarrollado una implementación paralela del algoritmo para poder afrontar problemas con grandes volúmenes de datos de una manera eficiente.