Investigadores que se desempeñan en instituciones en la órbita de la Universidad de Michigan, de EEUU utilizaron modelos de aprendizaje automático interpretables para la predicción de la elegibilidad de terapias avanzadas utilizando datos de registros médicos electrónicos (EHR por sus siglas en inglés de electronic health records) en relación a procurar mejoras de las decisiones de tratamiento de la insuficiencia cardíaca y publicaros sus resultados y conclusiones en la edición del 14 de febrero de 2024 del BMC Medical Informatic and Decision Making*.
Inician su desarrollo señalando que la insuficiencia cardíaca (IC), una enfermedad con una prevalencia de hasta el 2% en los países desarrollados, afecta a un número cada vez mayor de personas cada año y se prevé que afectará a 8 millones en todo el mundo para 2030.
Los pacientes con insuficiencia cardíaca terminal se caracterizan por cambios estructurales significativos en el corazón y síntomas destacados de insuficiencia cardíaca.
Las estadísticas muestran que la tasa de mortalidad anual para esta población podría llegar al 50%, lo que la convierte en un importante problema de salud pública.
Debido al sombrío pronóstico de la insuficiencia cardíaca terminal, se han desarrollado varios enfoques quirúrgicos que han demostrado mejorar la calidad de vida y la supervivencia en comparación con los tratamientos médicos tradicionales.
Existen dos terapias avanzadas principales: el trasplante de corazón (TH por sus siglas en inglés) y el soporte circulatorio mecánico (MCS por sus siglas en inglés).
Sin embargo, ambos enfoques tienen riesgos y limitaciones potenciales, como la escasez de donantes de órganos para la TH y el riesgo de complicaciones, incluidas infecciones y trombosis con dispositivos MCS, lo que crea un desafío para los cardiólogos, quienes deben evaluar cuidadosamente la situación de cada paciente y decidir si y cuándo derivarlos para una intervención quirúrgica.
Se requiere un alto nivel de conocimientos y experiencia para tomar decisiones informadas y elegir la opción de tratamiento más adecuada para cada paciente.
Se han desarrollado varios modelos basados en puntuaciones para la derivación de pacientes con insuficiencia cardíaca, incluido el Heart Failure Survival Score (HFSS) y el Seattle Heart Failure Model (SHFM).
Ambos modelos son modelos multivariados de supervivencia con riesgo proporcional que no requieren datos recopilados de forma rutinaria.
Además, estos modelos tienen una capacidad predictiva limitada para pacientes individuales.
Otra clase de métodos populares que se han introducido en este campo se basan en el aprendizaje automático y el aprendizaje profundo.
Estos modelos se han utilizado ampliamente en la atención sanitaria general y en las enfermedades cardiovasculares y han generado un buen rendimiento del modelo.
Sin embargo, los modelos de aprendizaje profundo tienen el problema inherente de la opacidad y la falta de justificación para la toma de decisiones, lo que ha dificultado sus aplicaciones en medicina, donde la interpretabilidad del modelo permite a los médicos comprender la lógica detrás de las predicciones del modelo, facilitando así la identificación de nuevos factores de riesgo.
Aprendizaje profundo es un conjunto de algoritmos de aprendizaje automático que intenta modelar abstracciones de alto nivel en datos usando arquitecturas computacionales que admiten transformaciones no lineales múltiples e iterativas de datos expresados en forma matricial o tensorial. (Wikipedia)
Además, los métodos de aprendizaje profundo suelen utilizar una gran cantidad de parámetros, que pueden sobreajustarse fácilmente si la muestra de entrenamiento no es lo suficientemente grande, otro desafío común en medicina, ya que es posible que no haya grandes muestras de entrenamiento anotadas disponibles para enfermedades raras.
Además, los métodos de aprendizaje automático antes mencionados sólo utilizan valores numéricos, ignorando la rica información disponible a través de códigos médicos.
Los códigos médicos codifican información sobre diagnóstico, medicamentos y comorbilidades, que también son informativas para la toma de decisiones.
Dadas las limitaciones de los métodos antes mencionados, existe la necesidad de modelos interpretables que puedan utilizar de manera efectiva la información contenida en los códigos médicos para predecir los pacientes que justifican la derivación cronológica a un cardiólogo de insuficiencia cardíaca y trasplantes.
Para superar estas limitaciones de los métodos existentes, los autores propusieron dos modelos basados en regresión logística (LR por sus siglas en inglés) que podrían aprovechar la información estructural inherente a los datos para predecir candidatos potenciales para terapias avanzadas.
La elección de LR como modelo base se debe a su estructura simple, interpretabilidad natural y poder predictivo.
Para aplicar LR a datos de códigos médicos, emplearon técnicas de incrustación de palabras del procesamiento del lenguaje natural (NLP por sus siglas en inglés) para representar los códigos médicos individuales como vectores numéricos, que podrían apilarse en matrices de representación y usarse como características de entrada para LR.
En lugar de LR estándar, utilizaron regresión tensorial logística (LTR por sus siglas en inglés) para utilizar la información estructural multilineal subyacente, lo que podría mejorar tanto el rendimiento como la flexibilidad del modelo.
Además, adaptaron la técnica de codificación posicional (PE) comúnmente utilizada en NLP, como en el modelo transformador, para abordar la información temporal irregular inherente al conjunto de datos.
Originalmente desarrollada para modelar la posición relativa de las palabras en oraciones, la técnica PE también se ha utilizado en varios estudios para capturar los intervalos de tiempo irregulares entre mediciones adyacentes.
Ambos modelos LTR propuestos pueden producir ponderaciones para códigos médicos que miden su importancia relativa.
En el primer modelo LTR, los pesos se definen globalmente, mientras que en el segundo modelo LTR, los pesos pueden variar a nivel del paciente.
Además, al igual que LR, los modelos propuestos son interpretables y permiten evaluar la importancia de las características utilizando las ponderaciones.
También pudieron confirmar que los códigos médicos más importantes seleccionados por los modelos son consistentes con la experiencia clínica.
En general, propusieron dos nuevos modelos interpretables que pueden integrar información temporal y estructural irregular para predecir de manera efectiva a los pacientes que justifican una evaluación para terapias avanzadas de insuficiencia cardíaca, proporcionando un enfoque más transparente, integral y preciso.
La derivación oportuna y precisa de pacientes con insuficiencia cardíaca terminal a terapias avanzadas, incluidos trasplantes de corazón y soporte circulatorio mecánico, desempeña un papel importante para mejorar los resultados de los pacientes y ahorrar costos.
Sin embargo, el proceso de toma de decisiones es complejo, matizado y requiere mucho tiempo, y requiere cardiólogos con experiencia y capacitación especializada en insuficiencia cardíaca y trasplantes.
En este estudio, los autores propusieron dos modelos basados en regresión tensorial logística para predecir pacientes con insuficiencia cardíaca que justifican una evaluación para terapias avanzadas de insuficiencia cardíaca utilizando registros médicos electrónicos secuenciales espaciados irregularmente a nivel poblacional e individual.
Las características clínicas se recogieron en la visita anterior y las predicciones se hicieron al comienzo de la visita siguiente.
Se realizaron experimentos de validación cruzada diez veces por paciente.
El LTR estándar logró una puntuación F1 promedio de 0,708, un AUC de 0,903 y un AUPRC de 0,836.
El LTR personalizado obtuvo una puntuación F1 de 0,670, un AUC de 0,869 y un AUPRC de 0,839.
Los dos modelos no solo superaron a todos los demás modelos de aprendizaje automático con los que se compararon, sino que también mejoraron el rendimiento y la solidez de los otros modelos mediante la transferencia de peso.
Las puntuaciones AUPRC de máquina de vectores de soporte, bosque aleatorio y Naive Bayes mejoraron en un 8,87%, 7,24% y 11,38%, respectivamente.
Los dos modelos pueden evaluar la importancia de las características clínicas asociadas con la derivación a terapia avanzada.
Los cinco códigos médicos más importantes, que incluyen enfermedad renal crónica, hipotensión, enfermedad pulmonar, insuficiencia mitral y enfermedad cardíaca aterosclerótica, fueron revisados y validados con literatura y por cardiólogos de insuficiencia cardíaca.
Estos modelos propuestos utilizan eficazmente los EHR para la posible necesidad de terapias avanzadas en pacientes con insuficiencia cardíaca y, al mismo tiempo, explican la importancia de las comorbilidades y otros eventos clínicos.
La información obtenida del entrenamiento con modelos entrenados podría ofrecer más información sobre los factores de riesgo que contribuyen a la progresión de la insuficiencia cardíaca tanto a nivel poblacional como individual.
Sintetizando, en este estudio, se propusieron dos modelos LTR que tuvieron como objetivo predecir la elegibilidad potencial de terapias avanzadas para pacientes con insuficiencia cardíaca y evaluar la importancia de los eventos médicos tanto a nivel poblacional como individual.
Estos modelos fueron entrenados y validados utilizando datos recopilados de un centro médico académico.
Para comparar estos modelos, se compararon con otros métodos de aprendizaje automático.
El algoritmo LTR estándar informó una puntuación F1 de 0,667, un AUC de 0,904 y un AUPRC de 0,873, mientras que el LTR personalizado propuesto logró una puntuación F1 de 0,670, un AUC de 0,869 y un AUPRC de 0,839, superando a todos los métodos de referencia.
Además, los pesos aprendidos de estos dos modelos LTR se pueden transferir a otros modelos de aprendizaje automático, mejorando el rendimiento de estos modelos.
Además, la magnitud de los pesos se puede interpretar como su importancia relativa, mientras que el signo impone direccionalidad a los pesos.
Hasta donde se sabe, este es el primer modelo que emplea códigos médicos para la predicción de elegibilidad de terapias avanzadas para la IC.
Tener en cuenta la información estructural no sólo mejora el rendimiento del modelo sino que también aumenta su robustez.
Ambos modelos LTR consideran la importancia de los códigos médicos y emplean ponderaciones de códigos para construir la representación de las visitas.
En comparación con el LR estándar basado en vectores, que promedia todas las incrustaciones de códigos médicos como representación de la visita, estos modelos basados en tensores propuestos utilizan de manera efectiva la estructura multilineal para lograr un rendimiento que supera significativamente el de los métodos de conjunto y otras técnicas tradicionales de aprendizaje automático.
Aunque los pesos se aprenden bajo el marco LTR, también se pueden transferir a otros modelos para mejorar el rendimiento.
Ya sea que los pesos provengan de LTR estándar o LTR personalizado, facilitan el entrenamiento del modelo y mejoran significativamente el rendimiento, lo que respalda la afirmación de que modelar la información estructural interna de los códigos médicos es beneficioso.
Los modelos de aprendizaje automático con pesos transferidos desde LTR personalizado generalmente obtuvieron mejores resultados que aquellos con pesos de LTR estándar, posiblemente porque el LTR personalizado evalúa los eventos médicos individualmente, lo que permite una mayor flexibilidad.
Estos dos modelos se complementan en cuanto a interpretabilidad.
Standard LTR proporciona información sobre la importancia de los códigos médicos a nivel poblacional.
Puede identificar síntomas y enfermedades asociados que pueden afectar a la población con insuficiencia cardíaca, lo que sirve como inspiración para encontrar posibles factores de riesgo.
Esto puede ayudar a los cardiólogos a reconocer la gravedad de su enfermedad y potencialmente iniciar una evaluación de terapias avanzadas para la insuficiencia cardíaca, según corresponda.
Desde una perspectiva a nivel del paciente, la interpretación personalizada crea un perfil individualizado de insuficiencia cardíaca, proporcionando la base para encontrar factores de riesgo específicos del paciente.
En general, los modelos propuestos exhiben un rendimiento superior y una interpretabilidad mejorada en comparación con los métodos tradicionales de aprendizaje automático, lo que representa una vía prometedora para identificar pacientes que necesitan terapias avanzadas para la insuficiencia cardíaca.
Es importante reconocer que este estudio tuvo varias limitaciones.
En primer lugar, el conjunto de datos fue relativamente pequeño en comparación con la gran cantidad de códigos médicos, lo que resultó en desviaciones estándar altas entre los modelos.
A pesar de que este modelo tiene una estructura más simple y mantiene información estructural, las desviaciones estándar siguen siendo relativamente altas.
Además, los modelos dependían en gran medida de la calidad de los códigos médicos, que pueden registrarse de manera inexacta o no ser detectados.
Los errores en los códigos médicos pueden afectar los resultados ya que las diferencias entre los pacientes que están demasiado bien para HT/MCS y aquellos que requieren tratamiento urgente son sutiles.
Por lo tanto, sería importante en el futuro investigar cómo incorporar más mediciones clínicas junto con códigos médicos para mejorar el rendimiento y la validez del modelo.
Además, los datos se recopilaron de una sola institución, lo que puede disminuir la generalización de los hallazgos y se necesitan estudios futuros que utilicen datos de múltiples instituciones.
Aparte de los posibles problemas relacionados con los datos, estos modelos todavía tienen el potencial de mejorar al tener en cuenta más información estructural dentro de los datos.
Actualmente, solo se utilizaron dos visitas para modelar: las características se extrajeron de una única hospitalización y se utilizaron para predecir la necesidad de terapias avanzadas en una hospitalización posterior.
Dado que la insuficiencia cardíaca es una enfermedad crónica, la incorporación de datos longitudinales adicionales sería clínicamente ventajosa.
Además, las relaciones entre códigos de diferentes categorías también son importantes, pero no se han estudiado en este trabajo.
Ha habido varios trabajos que utilizan modelos gráficos para tener en cuenta la interacción entre diferentes códigos médicos.
Por lo tanto, se podrían aplicar otros métodos más potentes que incorporen estas estructuras adicionales a la población con insuficiencia cardíaca avanzada.
En conclusión, este estudio propuso dos modelos LTR: versiones estándar y personalizada para predecir la elegibilidad potencial para terapias avanzadas para pacientes con insuficiencia cardíaca en función de las características clínicas previas y la información temporal irregular.
Estos modelos incorporaron información tanto estructural como temporal presente en los códigos médicos de la HCE, manteniendo al mismo tiempo una estructura de aprendizaje simple para evaluar la importancia de los eventos clínicos tanto a nivel global como individual.
Los resultados demostraron que los métodos empleados superaron a los modelos existentes, lo que indica que la inclusión de información estructural puede mejorar el rendimiento predictivo y proporcionar información útil adicional para mejorar la interpretabilidad.
Además, la importancia del peso aprendida por estos modelos se alinea bien con la práctica clínica y la literatura, destacando su valor potencial para futuras investigaciones en el campo de la insuficiencia cardíaca.
En el futuro, se explorarán más a fondo la aplicación de este modelo en otras áreas de la atención sanitaria, no limitadas a la insuficiencia cardíaca.
Además, dado que determinar quién debe ser remitido a terapias avanzadas es un desafío, la confianza de los médicos en sus etiquetas posiblemente debería incorporarse al modelo como información privilegiada para un mejor diagnóstico clínico.
* Zhang Y, Golbus JR, Wittrup E, Aaronson KD, Najarian K. Enhancing heart failure treatment decisions: interpretable machine learning models for advanced therapy eligibility prediction using EHR data. BMC Med Inform Decis Mak. 2024 Feb 14;24(1):53. doi: 10.1186/s12911-024-02453-y. PMID: 38355512; PMCID: PMC10868035.