métodos basados en distancias estadísticas en comparación y clasificación de poblaciones

  1. Irigoien Garbizu, Itziar
Dirigée par:
  1. Concepción Arenas Solá Directeur/trice

Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 18 décembre 2008

Jury:
  1. Francisco Javier Torrealdea Folgado President
  2. Basilio Sierra Araujo Secrétaire
  3. Ricard Albalat Rodríguez Rapporteur
  4. Claudi Alsina Català Rapporteur
  5. Sergi Civit Vives Rapporteur

Type: Thèses

Teseo: 193962 DIALNET lock_openTESEO editor

Résumé

En este trabajo se desarrollan en primer lugar cuatro métodos de cluster basados en el concepto de variabilidad geométrica, Estos métodos son aplicables a cualquier tipo de datos, siendo dos de ellos de nuevo desarrollo, mientras que los otros dos son una generalización de métodos clásicos que eran únicamente aptos para datos continuos. Así se ha conseguido que sean útiles para variables mixtas. En segundo lugar, se ha desarrollado una nueva metodología para determinar tanto el número (real) de clusters, como para detectar observaciones atípicas, sin importar el número de grupos o el tipo de variables. También se ha elaborado un nuevo método de cluster divisivo sin ningún tipo de restricción sobre el número de objetos o tipo de datos, considerando el caso general de tener experimentos replicados. Finalmente se ha resuelto el tratamiento de las réplicas en los denominados time course experiments realizados a lo largo de un periodo de tiempo corto y en los que interesa agrupar genes que se expresan de forma análoga. Todos estos resultados se han podido aplicar a ejemplos reales de las ciencias biomédicas. Paralelamente se ha desarrollado el correspondiente software para la ejecución de la nueva metodología, creando para ello un paquete, que hemos denominado DBmethods, dentro del software de libre distribución R.