Pittsburgh genetic-based machine learning in the data mining era: representations, generalization, and run-time

Bacardit Peñarroya, Jaume

Pittsburgh genetic-based machine learning in the data mining erarepresentations, generalization, and run-time

Bacardit Peñarroya, Jaume

Dirigida por:

Josep Maria Garrell Guiu Director/a

Universidad de defensa: Universitat Ramon Llull

Fecha de defensa: 20 de diciembre de 2004

Tribunal:

Francisco Herrera Triguero Presidente/a
Elisabet Golobardes Ribé Secretario/a
Vicenç Torra Vocal
Jesús Aguilar Vocal
Pedro Larrañaga Múgica Vocal

Tipo: Tesis

Teseo: 128845 DIALNET

Resumen

El enfoque de Pittsburgh (DeJong, Spears, & Gordon, 1993) del aprendizaje evolutivo es, entre otras alternativas (Wilson, 1955; Venturini, 1993), la aplicación de las técnicas de computación evolutiva (Holland, 1975; Godberg, 1989ª) a las tareas de aprendizaje artificial, Los sistemas que aplican este enfoque se caracterizan por hacer evolucionar individuos que consisten en un conjunto de reglas, habitualmente de tamaño variable. Por lo tanto, la solución propuesta al problema a resolver por este tipo de sistemas es el mejor individuo de la población. Cuando se usa este enfoque es necesario soluciona correctamente algunos asuntos como el control del tamaño de los individuos de la población, aplicar el grado correcto de presión de generalización sobre un conjunto amplio de problemas, reducción del coste computacional del sistema, tratar problemas con tipos de atributo diversos, etc. Todos estos problemas son todavía más serios cuando se pretende solucionar problemas modernos de minería de datos. El objetivo general de esta tesis es adaptar el enfoque de Pittsburgh para solucionar con éxito este tipo de problemas. Este objetivo general se divide en tres partes: (1) mejorar la capacidad de generalización, (2) reducir el coste computacional y (3) representaciones para atributos reales. Estos tres objetivos se han logrado mediante la combinación de cuatro tipos de contribuciones. Algunas de estas propuestas sólo solucionan uno de los objetivos. Otras pueden solucionar más de un objetivo al mismo tiempo. Todas estas propuestas están integradas en el sistema llamado GAssist (Genetic clASSIfier sySTem), La experimentación realizada incluye un amplio espectro de problemas de minería de datos. Esta experimentación está dividida en dos partes. En la primera parte se ha experimentado con diversas alternativas por separado para cada uno de los cuatro tipo de contribuciones realizadas en esta tesis. El objetivo de est