Uso de patrones secuenciales multivariantes para clasificación y extracción de conocimiento temporalestudio de supervivencia de pacientes en la Unidad de Quemados Críticos

  1. Casanova López, Isidoro Jesús
Dirigida por:
  1. Manuel Campos Martínez Director/a
  2. Jose M. Juarez Director/a
  3. José Ángel Lorente Balanza Director

Universidad de defensa: Universidad de Murcia

Fecha de defensa: 05 de mayo de 2023

Tipo: Tesis

Resumen

Esta tesis centra su investigación en los datos provenientes de pacientes con grandes quemados que han ingresado en la UCI y cuya evolución ha sido registrada diariamente. Algunos parámetros clínicos disponibles desde la llegada del paciente, como la edad o la extensión del quemado, permiten realizar una primera valoración de la severidad y ayudan a pronosticar la supervivencia estimada en la admisión. Sin embargo, el estudio de la evolución de otros parámetros clínicos registrados durante los primeros 5 días de estancia en la UCI (pH, diuresis, exceso de base, …) puede ayudar a definir objetivos y a valorar la evolución y respuesta al tratamiento. En esta tesis se plantea la generación de potencial conocimiento observando la evolución en el tiempo de estas variables, de forma que se podría llegar a pronosticar la supervivencia de un paciente o sugerir nuevas ideas a los médicos acerca del comportamiento de estas variables. METODOLOGÍA. Se define inicialmente un proceso de descubrimiento de conocimiento con los siguientes 4 pasos: 1) discretización de los atributos temporales, 2) minería de patrones secuenciales multivariantes, 3) posprocesamiento, filtrando como patrones interesantes aquellos que sean discriminatorios, y aplicando posteriormente una representación comprimida de estos patrones, 4) clasificación de la supervivencia de los pacientes con modelos interpretables. Posteriormente compararemos como diferentes discretizaciones afectan a la clasificación e intentaremos reducir el número de patrones secuenciales usados como predictores en los clasificadores, realizando una evaluación de su consistencia. Además, proponemos el uso de un indicador estadístico ampliamente utilizado en estudios epidemiológicos, la Razón de Probabilidades Diagnóstica (DOR), como medida alternativa de interés respecto a la frecuencia, para realizar la selección de los patrones interesantes. Por último, presentamos un original método para obtener un subconjunto reducido de patrones secuenciales novedosos que representan la evolución temporal sorpresiva del estado clínico del paciente, a los que llamaremos como Jumping Diagnostic Odds Ratio Sequential Patterns (JDORSP). Utilizaremos el DOR para seleccionar aquellos patrones secuenciales que representen un cambio drástico en la evolución del paciente, es decir, patrones que se convierten en un factor de protección cuando extendemos un patrón que era un factor de riesgo, o viceversa. RESULTADOS. Los resultados de las pruebas de clasificación muestran que nuestro enfoque supera a las puntuaciones de gravedad de quemaduras utilizadas actualmente por los médicos siguiendo la puntuación de Brier, y hasta donde sabemos, este sería el primer trabajo donde patrones secuenciales multivariantes se utilizan como predictores de mortalidad en la UCI. Respecto a la utilización de diferentes discretizaciones, que conozcamos, ningún estudio previo ha realizado esta comparación utilizando patrones secuenciales específicamente. El mejor rendimiento con la clasificación se ha obtenido con la discretización automática UCPD. También obtenemos un resultado aceptable con la discretización experta, superando a muchos algoritmos de discretización automática. Mediante la evaluación de la consistencia, hemos reducido aún más el número de patrones secuenciales, encontrado patrones uniformemente distribuidos por toda la base de datos de pacientes. Respecto a la utilización de una métrica estadística, el DOR, como medida de interés para reducir el número de patrones secuenciales y seleccionar sólo los más discriminatorios, con la discretización experta, la mayor especificidad se alcanza utilizando directamente el valor del DOR para seleccionar los patrones. Esta es, hasta donde sabemos, la primera vez que algunos de estos enfoques han sido propuestos y comparados en la literatura científica. Por último, respecto a los novedosos patrones JDORSP propuestos, que conozcamos, esta es la primera vez en la que el DOR y los patrones secuenciales se utilizan de esta manera. Destacamos la drástica reducción de patrones secuenciales con respecto al estado actual de la técnica, permitiendo realizar una revisión manual por expertos médicos de la sorpresividad y relevancia de los patrones descubiertos. Así, el hecho más interesante encontrado es la alta sorpresividad en los patrones secuenciales que inicialmente tienen un factor de riesgo, y sus extensiones se convierten en un factor de protección, es decir, pacientes que se recuperan a los pocos días de estar en alto riesgo de morir.