Consensus policies to solve bioinformatic problems through Bayesian network classifiers and estimation of distribution algorithms

  1. Armañanzas Arnedillo, Ruben
Dirigée par:
  1. Iñaki Inza Cano Directeur/trice
  2. Pedro Larrañaga Múgica Directeur/trice

Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 15 juin 2009

Jury:
  1. José Antonio Lozano Alonso President
  2. Ana María Zubiaga Elordieta Secrétaire
  3. Antonio Bahamonde Rionda Rapporteur
  4. Jose Maria Peña Sanchez Rapporteur
  5. Yvan Saeys Rapporteur
Département:
  1. Ciencia de la Computación e Inteligencia Artificial

Type: Thèses

Teseo: 278139 DIALNET

Résumé

Los campos de la bioinformática y biología computacional son nuevas disciplinas de investigación nacidas del desarrollo que han sufrido las plataformas de análisis biológico, Hoy en día, estas plataformas generan una cantidad tan ingente de datos que tan solo mediante técnicas de aprendizaje automático y optimización dichos datos pueden ser explotados. Dentro de estas áreas de conocimiento, se propone el uso de políticas consensuadas aplicadas a clasificadores Bayesianos y algoritmos de estimación de distribuciones. Mediante dichas nuevas propuestas se busca que los resultados obtenidos del análisis de datos bioinformáticos sean aún más robustos y fiables. Como aportaciones metodológicas, el trabajo incluye la presentación de una métrica de relevancia univariada consensuada, así como un método multivariado de selección de genes en experimentos de microarrays de ADN. Se ha desarrollado un algoritmo basado en remuestro estratíficado con reemplazo, selección de variables y clasificadores Bayesianos para la creación de redes de interacción con pesado de relevancia en sus arcos. Como cuarta aportación, se presenta un consensuado poblacional dentro de búsquedas mediante algoritmos de estimación de distribuciones que permite crear una jerarquía en la selección de variables mediante algoritmos de envoltura. Todos los métodos propuestos en el trabajo han sido aplicados al análisis de diferentes tipos biológicos de datos, tales como microarrays de ADN, micro RNAs y espectrometría de masas. Además de verificar los métodos propuestos en bancos de pruebas amparadas por la comunidad científica, el análisis ha deparado resultados satisfactorios en patologías autoinmunes, cáncer colorrectal y esclerosis múltiple. El trabajo incluye así mismo la presentación de diferentes gráficas y representaciones visuales de resultados de gran utilidad para la propuesta de nuevas hipótesis de trabajo o validación en problemas del campo de la biología computacional.