Data analysis and machine learning approaches for time series pre- and post- processing pipelines

  1. Gil Lerchundi, Amaia
Supervised by:
  1. Basilio Sierra Araujo Director
  2. Marco Francesco Quartulli Director

Defence university: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 20 May 2022

Committee:
  1. Concepción Arenas Solá Chair
  2. Itziar Irigoien Garbizu Secretary
  3. Igor García Olaizola Committee member
Department:
  1. Ciencia de la Computación e Inteligencia Artificial

Type: Thesis

Teseo: 157923 DIALNET lock_openADDI editor

Abstract

En el ámbito industrial, las series temporales suelen generarse de forma continua mediante sensores quecaptan y supervisan constantemente el funcionamiento de las máquinas en tiempo real. Por ello, esimportante que los algoritmos de limpieza admitan un funcionamiento casi en tiempo real. Además, amedida que los datos evolución, la estrategia de limpieza debe cambiar de forma adaptativa eincremental, para evitar tener que empezar el proceso de limpieza desde cero cada vez.El objetivo de esta tesis es comprobar la posibilidad de aplicar flujos de aprendizaje automática a lasetapas de preprocesamiento de datos. Para ello, este trabajo propone métodos capaces de seleccionarestrategias óptimas de preprocesamiento que se entrenan utilizando los datos históricos disponibles,minimizando las funciones de perdida empíricas.En concreto, esta tesis estudia los procesos de compresión de series temporales, unión de variables,imputación de observaciones y generación de modelos subrogados. En cada uno de ellos se persigue laselección y combinación óptima de múltiples estrategias. Este enfoque se define en función de lascaracterísticas de los datos y de las propiedades y limitaciones del sistema definidas por el usuario.