Estrategias de visión por computador para la estimación de pose en el contexto de aplicaciones robóticas industrialesavances en el uso de modelos tanto clásicos como de deep learning en imágenes 2D

  1. MERINO BERMEJO, IBON
Dirigida por:
  1. Basilio Sierra Araujo Director/a
  2. Anthony Jacky Remazeilles Director/a

Universidad de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 20 de octubre de 2023

Departamento:
  1. Ciencia de la Computación e Inteligencia Artificial

Tipo: Tesis

Teseo: 825266 DIALNET lock_openADDI editor

Resumen

La visión por computador es una tecnogía habilitadora que permite a los robots y sistemas autónomospercibir su entorno. Dentro del contexto de la industria 4.0 y 5.0, la visión por ordenador es esencial parala automatización de procesos industriales. Entre las técnicas de visión por computador, la detección deobjetos y la estimación de la pose 6D son dos de las más importantes para la automatización de procesosindustriales. Para dar respuesta a estos retos, existen dos enfoques principales: los métodos clásicos y losmétodos de aprendizaje profundo. Los métodos clásicos son robustos y precisos, pero requieren de unagran cantidad de conocimiento experto para su desarrollo. Por otro lado, los métodos de aprendizajeprofundo son fáciles de desarrollar, pero requieren de una gran cantidad de datos para su entrenamiento.En la presente memoria de tesis se presenta una revisión de la literatura sobre técnicas de visión porcomputador para la detección de objetos y la estimación de la pose 6D. Además se ha dado respuesta alos siguientes retos: (1) estimación de pose mediante técnicas de visión clásicas, (2) transferencia deaprendizaje de modelos 2D a 3D, (3) la utilización de datos sintéticos para entrenar modelos deaprendizaje profundo y (4) la combinación de técnicas clásicas y de aprendizaje profundo. Para ello, sehan realizado contribuciones en revistas de alto impacto que dan respuesta a los anteriores retos.