Extreme multi-label deep neural classification of Spanish health records according to the International Classification of Diseases

  1. BLANCO GARCES, ALBERTO
unter der Leitung von:
  1. Arantza Casillas Rubio Doktorvater/Doktormutter
  2. Alicia Pérez Ramírez Doktorvater/Doktormutter

Universität der Verteidigung: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 20 von September von 2022

Fachbereiche:
  1. Electricidad y Electrónica

Art: Dissertation

Teseo: 777218 DIALNET lock_openADDI editor

Zusammenfassung

Este trabajo trata sobre la minería de textos clínicos, un campo del Procesamiento del Lenguaje Naturalaplicado al dominio biomédico. El objetivo es automatizar la tarea de codificación médica. Los registroselectrónicos de salud (EHR) son documentos que contienen información clínica sobre la salud de unpaciente. Los diagnósticos y procedimientos médicos plasmados en la Historia Clínica Electrónica estáncodificados con respecto a la Clasificación Internacional de Enfermedades (CIE). De hecho, la CIE es labase para identificar estadísticas de salud internacionales y el estándar para informar enfermedades ycondiciones de salud. Desde la perspectiva del aprendizaje automático, el objetivo es resolver unproblema extremo de clasificación de texto de múltiples etiquetas, ya que a cada registro de salud se leasignan múltiples códigos ICD de un conjunto de más de 70 000 términos de diagnóstico. Una cantidadimportante de recursos se dedican a la codificación médica, una laboriosa tarea que actualmente se realizade forma manual. Los EHR son narraciones extensas, y los codificadores médicos revisan los registrosescritos por los médicos y asignan los códigos ICD correspondientes. Los textos son técnicos ya que losmédicos emplean una jerga médica especializada, aunque rica en abreviaturas, acrónimos y erroresortográficos, ya que los médicos documentan los registros mientras realizan la práctica clínica real. Paraabordar la clasificación automática de registros de salud, investigamos y desarrollamos un conjunto detécnicas de clasificación de texto de aprendizaje profundo.