En la edición de febrero de 2025 de The Lancet Digital Health, investigadores de Suiza, Noruega, Austria, Reino Unido, Países Bajos Y EEUU, publicaron los resultados de un ensayo de superioridad multicéntrico, de múltiples períodos, doble ciego, aleatorizado por grupos y cruzado, que analizó las eventuales ventajas de incluir un sistema informático que ayudara a la toma de decisiones diagnósticas frente al diagnóstico convencional en pacientes asistidos en servicios de emergencia*
Este tema sea hoy comentado en la NOTICIA DEL DÍA.
Los autores señalaron de inicio que los errores de diagnóstico son un problema de salud importante que afecta entre el 5% y el 15% de las personas que buscan atención médica, y pueden causar daños sustanciales.
Estos errores incluyen diagnósticos incorrectos, tardíos o no realizados, están asociados con tasas de mortalidad más altas que otros tipos de errores médicos, y dan lugar a las demandas por mala praxis más comunes y costosas a nivel mundial.
Los sistemas informáticos de apoyo a la toma de decisiones diagnósticas (CDDSS por sus siglas en inglés de Computerised diagnostic decision support systems) sugieren posibles diagnósticos en función de los signos y síntomas del paciente y podrían mejorar la precisión diagnóstica.
Aunque estos sistemas han tenido un buen desempeño en estudios de viñetas, los resultados no parecen trasladarse a la práctica clínica.
Un estudio de viñeta es, en esencia, una encuesta diseñada ad hoc consistente en evaluar escenarios ficticios por parte de las personas encuestadas, de tal manera que de dicha evaluación se puedan inferir opiniones o actitudes que en encuestas tradicionales no suelen salir a la luz.
Los estudios de viñetas tienen graves defectos metodológicos, y la mayoría de las evaluaciones clínicas disponibles de los CDDSS son estudios retrospectivos o tienen diseños de antes y después.
Dos ensayos controlados aleatorizados de sistemas de apoyo a la toma de decisiones han evaluado la calidad diagnóstica como un resultado secundario.
Un ensayo aleatorizado por grupos en 10 663 pacientes ambulatorios que se presentaron a 280 médicos de atención primaria (médicos generales) en Bélgica evaluó un programa de software que sugería pruebas de laboratorio para una amplia gama de condiciones.
El error de diagnóstico se evaluó como un resultado secundario y no se encontraron diferencias entre la intervención y el control (atención habitual).
El otro ensayo asignó aleatoriamente a 936 pacientes ambulatorios a un proceso de apoyo de diagnóstico y tratamiento con una herramienta de apoyo a la toma de decisiones de propósito general (Problem-Knowledge Couplers) y a 966 pacientes a un enfoque sin apoyo, y encontró que la calidad de la atención, incluido el proceso de diagnóstico, no difirió significativamente entre los grupos.
Sin embargo, una revisión general de revisiones sistemáticas estimó que los sistemas de apoyo a la toma de decisiones clínicas, con mayor frecuencia dirigidos a enfermedades individuales, mejoraron los diagnósticos en un 9,9% (IC del 95%: 4,1–19,3).
No está claro si el uso de sistemas informáticos de apoyo a la toma de decisiones diagnósticas (CDDSS) en la práctica clínica mejora los diagnósticos y los resultados de los pacientes.
En una revisión sistemática de 2016 de estudios que investigaban los efectos de los generadores de diagnóstico diferencial, los CDDSS mostraron una buena precisión de los diagnósticos propuestos en comparación con el estándar de oro, pero la heterogeneidad fue alta y la mayoría de los estudios fueron retrospectivos.
En un subconjunto de seis estudios que evaluaron la calidad diagnóstica de los diagnósticos de los médicos antes y después de la consulta con CDDSS, se observaron pequeñas mejoras, pero la importancia clínica de estos beneficios menores es incierta.
Un ensayo clínico prospectivo no encontró mejoras significativas en la calidad de la atención de los pacientes ambulatorios para los que se utilizó una herramienta de tecnología de la información de apoyo a la toma de decisiones en comparación con los pacientes que recibieron la atención habitual.
Con estos antecedentes, los autores realizaron una búsqueda en PubMed entre el 1 de enero de 2015 y el 3 de enero de 2022, con los términos de búsqueda (diagnosis OR diagnoses) AND (“decision support” OR “decision assistance” OR “decision aid”) AND (“computer” OR “system” OR “electronic”) de ensayos controlados aleatorizados, publicados en cualquier idioma, que evaluaran herramientas de diagnóstico diferencial de propósito general.
Así, identificaron el ensayo ELMO, un ensayo aleatorizado por grupos que involucró a 280 médicos de atención primaria (médicos generales) en Bélgica que incluyeron a 10 663 pacientes ambulatorios.
El ensayo evaluó un software que sugería pruebas de laboratorio para una amplia gama de afecciones.
El error de diagnóstico se evaluó como un resultado secundario, sin encontrar diferencias entre la intervención y el control.
El software no sugirió diagnósticos diferenciales directamente.
Aunque los CDDSS muestran una buena precisión en los diagnósticos diferenciales, su efecto sobre los resultados relevantes para el paciente es incierto y los datos de ensayos clínicos de alta calidad son escasos.
Hasta donde saben los autores, DDX-BRO fue el primer ensayo controlado aleatorizado que evaluó el efecto de un CDDSS sobre el error de diagnóstico en servicios de medicina de urgencias.
Este ensayo no mostró superioridad de los diagnósticos realizados con un CDDSS frente a los realizados sin él.
A pesar del uso de criterios estrictos de inclusión y exclusión para reclutar una población que probablemente se beneficiaría del CDDSS, las estimaciones puntuales no sugirieron una reducción del riesgo de calidad del diagnóstico.
Los estudios clínicos retrospectivos y prospectivos no parecieron mostrar una mejora en la calidad de los diagnósticos realizados en cuidados intensivos con el apoyo informático para la toma de decisiones diagnósticas.
Los efectos de estas herramientas fueron, en el mejor de los casos, pequeños y pudieron no traducirse en resultados relevantes para el paciente en una población no seleccionada.
Por tal motivo, se justifica una evaluación cuidadosa de los beneficios reales de los CDDSS antes de su implementación en la práctica clínica.
Se requiere una mayor investigación clínica sobre los beneficios para el paciente en poblaciones seleccionadas de nuevos tipos de apoyo para la toma de decisiones diagnósticas.
Aunque los CDDSS han demostrado algún beneficio en estudios de viñetas o antes-después y para condiciones específicas, las evaluaciones clínicas de sistemas de apoyo a la toma de decisiones más generales no lo han hecho.
En consecuencia, sigue habiendo incertidumbre en cuanto a si los CDDSS mejoran los diagnósticos o los resultados relevantes para el paciente, y se necesitan evidencias de ensayos aleatorizados.
Muchos diagnósticos se realizan primero en los departamentos de urgencias, un entorno particularmente propenso a errores de diagnóstico debido a la heterogeneidad de los síntomas que se presentan, el gran número de pacientes, la presión del tiempo resultante y otros factores que complican la situación.
Por lo tanto, cualquier beneficio potencial de los CDDSS en la calidad del diagnóstico debería ser claramente visible en este entorno.
Por lo tanto, los autores realizaron el ensayo de ampliación del diagnóstico diferencial (DDX-BRO) para determinar si los CDDSS mejoraban los diagnósticos y los resultados clínicos en los pacientes que se presentan al departamento de urgencias.
Utilizaron para ello un diseño aleatorizado por grupos porque la introducción de un CDDSS requiere una configuración técnica y una capacitación, que se dirigen a un sitio y a sus profesionales de la salud en lugar de a un paciente individual.
El objetivo del estudio fue evaluar el efecto del uso de CDDSS en el departamento de emergencias sobre la calidad del diagnóstico, el flujo de trabajo del diagnóstico, el consumo de recursos y los resultados de los pacientes.
Sintetizando lo expresado, el error diagnóstico es un problema frecuente y clínicamente relevante en el ámbito de la salud.
Existe controversia sobre si los sistemas informáticos de apoyo a la toma de decisiones diagnósticas (CDDSS) mejoran los diagnósticos y son escasos los ensayos prospectivos aleatorizados que investigan su eficacia en la práctica clínica habitual.
Plantearon la hipótesis de que los diagnósticos realizados con un CDDSS en el ámbito de los servicios de urgencias serían superiores a los diagnósticos no respaldados.
Este ensayo de superioridad multicéntrico, de múltiples períodos, doble ciego, aleatorizado por grupos y cruzado se realizó en cuatro departamentos de urgencias de Suiza.
Los pacientes elegibles fueron adultos (de 18 años o más) que presentaban dolor abdominal, fiebre de origen desconocido, síncope o síntomas no específicos.
Los departamentos de urgencias se asignaron aleatoriamente (1:1) a una de dos secuencias predefinidas de seis períodos alternos de intervención o control.
Los pacientes que se presentaron durante un período de intervención fueron diagnosticados con la ayuda de un CDDSS, mientras que los pacientes que se presentaron durante un período de control fueron diagnosticados sin un CDDSS (atención habitual).
Los pacientes y el personal que evaluaron los resultados no fueron identificados para la asignación de grupos; los médicos tratantes tampoco.
El resultado binario primario (falso o verdadero) fue una puntuación compuesta que indicaba un riesgo de reducción de la calidad del diagnóstico, que se consideró presente si se producía cualquiera de los siguientes eventos dentro de los 14 días:
atención médica no programada,
un cambio en el diagnóstico,
un ingreso inesperado en la unidad de cuidados intensivos dentro de las 24 h si el paciente fue ingresado inicialmente en el hospital o
muerte.
Evaluaron la superioridad de los diagnósticos respaldados frente a los no respaldados en todos los pacientes que dieron su consentimiento mediante un modelo de efectos mixtos lineal generalizado.
Todos los participantes que recibieron cualquier tratamiento del estudio (incluido el de control) y completaron el estudio se incluyeron en el análisis de seguridad.
Este ensayo está registrado en ClinicalTrials.gov ( NCT05346523 ) y está cerrado para la inscripción.
Entre el 9 de junio de 2022 y el 23 de junio de 2023, se examinaron 15 845 pacientes y se incluyeron 1204 (591 [49,1 %] mujeres y 613 [50,9 %] hombres) en el análisis de eficacia principal.
La mediana de edad de los participantes fue de 53 años (RIC 34-69).
Se observó riesgo de calidad diagnóstica en 100 (18 %) de 559 pacientes con diagnósticos respaldados por el CDDSS y en 119 (18 %) de 645 con diagnósticos no respaldados (odds ratio ajustado 0,96 [IC del 95 % 0,71-1,3]). 94 (7,8 %) pacientes sufrieron un evento adverso grave, ninguno relacionado con el estudio.
Estas observaciones dieron lugar a la siguiente interpretación:
El uso de un CDDSS no redujo la incidencia de riesgo de calidad diagnóstica en comparación con el proceso de diagnóstico habitual en adultos que acudieron a los servicios de urgencias.
Las investigaciones futuras deberían apuntar a identificar contextos específicos en los que los CDDSS fueran eficaces y cómo se pueden adaptar los existentes para mejorar los resultados de los pacientes
Poniendo en discusión las observaciones consignadas, los autores plantearon que este estudio comparó diagnósticos respaldados por un CDDSS frente a diagnósticos convencionales en pacientes tratados en el servicio de urgencias.
Aunque en los estudios se han utilizado diferentes estrategias para medir los riesgos de la calidad diagnóstica, este estudio respaldó informes previos de riesgos relacionados con errores de diagnóstico en esta población de pacientes y destacó la necesidad de estudiar el efecto de las intervenciones propuestas para mejorar la precisión diagnóstica.
El ensayo DDX-BRO fue diseñado de varias maneras para demostrar un beneficio potencial del uso de CDDSS.
Primero, utilizaron criterios estrictos de inclusión y exclusión con el objetivo de estudiar una población con alto riesgo de error de diagnóstico y, por lo tanto, con más probabilidades de beneficiarse del uso de CDDSS.
Aunque las vías de diagnóstico estuvieron bien definidas para abordar síntomas clave como dolor torácico o disnea, las vías para evaluar a pacientes con síntomas de presentación menos específicos (p. ej., fiebre de origen desconocido) estuvieron menos bien establecidas y existieron muchos diagnósticos alternativos.
Debido a que estos síntomas son más difíciles de diagnosticar, se esperaba un efecto más observable del uso de CDDSS en la precisión en esta población desafiante desde el punto de vista de la evaluación.
Aunque ningún estudio previo ha utilizado el mismo resultado primario, un estudio observacional previo informó una tasa de discrepancia del 12,8% entre el diagnóstico en el ingreso al departamento de emergencias y el diagnóstico en el alta hospitalaria en pacientes que presentaban una amplia variedad de síntomas.
Esta tasa de discrepancia diagnóstica fue del 13% (58 de 442 pacientes hospitalizados) en este ensayo, lo que sugirió que la cohorte incluyó pacientes con un perfil de diagnóstico desafiante similar .
En segundo lugar, una gran cantidad de investigaciones sobre la psicología cognitiva de la toma de decisiones diagnósticas sugirió que los médicos generan hipótesis diagnósticas en las primeras fases del encuentro con el paciente, y que la posterior recopilación de datos, la interpretación de los mismos y los diagnósticos finales se ven fuertemente afectados por estas hipótesis tempranas.
Por lo tanto, las intervenciones dirigidas a ampliar la lista inicial de diagnósticos diferenciales se deben utilizar en las primeras fases del proceso.
Esta afirmación estuvo respaldada por un estudio de viñetas de 190 estudiantes, médicos residentes y médicos en ejercicio en urgencias y medicina interna a los que se les pidió que diagnosticaran 16 casos de viñetas.
El estudio encontró listas de diagnósticos diferenciales significativamente mejores cuando se utilizó un CDDSS en las fases tempranas del proceso de diagnóstico que cuando se utilizó en las fases tardías del mismo.
Por lo tanto, los efectos sobre la precisión diagnóstica deberían ser más fuertes cuando los CDDSS se utilizan en las fases tempranas del proceso de diagnóstico, como en DDX-BRO.
Sin embargo, sigue siendo una pregunta abierta si la consulta de un CDDSS inmediatamente después de tomar la historia clínica del paciente y realizar un examen físico es suficientemente temprana o si una consulta incluso más temprana sería óptima.
En tercer lugar, las investigaciones previas han demostrado repetidamente que los médicos adoptan poco los CDDSS.
Los autores evitaron este problema implementando una obligación de usar los CDDSS, pero esto podría haber llevado a un uso pro forma en su lugar.
Sin embargo, los datos de los cuestionarios para médicos y el monitoreo del uso de los CDDSS sugirieron que los CDDSS casi siempre se usaron como estaba previsto, y el análisis por protocolo, que tuvo en cuenta la falta de uso, respaldó el análisis principal.
A pesar de estas medidas, no encontraron un beneficio del uso de los CDDSS en ninguno de los resultados evaluados.
El hallazgo de que no hubo beneficio de un CDDSS frente a la atención habitual estuvo en línea con estudios clínicos prospectivos previos que evaluaron el efecto del apoyo electrónico general a la toma de decisiones sobre los diagnósticos como resultados secundarios, pero contradijo los beneficios pequeños a medianos encontrados en varios estudios retrospectivos y de viñetas.
En estos estudios retrospectivos y de viñetas, los errores de razonamiento fueron los únicos errores posibles que los diagnosticadores podían cometer, y los hallazgos sugirieron que estos eran parcialmente corregibles mediante el uso de un CDDSS.
Sin embargo, en la clínica, existieron muchas otras causas de error de diagnóstico que es poco probable que se pudieran remediar con un CDDSS.
Estos errores incluyeron la falta de detección y recopilación de toda la información relevante.
Toda la información relevante estuvo disponible en conjunto en los diseños retrospectivos o de una sola vez en viñetas, mientras que en la realidad clínica, la información se recopila secuencialmente.
Además, en los estudios retrospectivos y de viñetas, se diagnostica un caso a la vez sin interrupciones, mientras que en la práctica clínica, los médicos residentes a menudo atienden a varios pacientes simultáneamente y son interrumpidos con frecuencia.
En un análisis estratificado por sexo y con planificación previa para generar hipótesis, encontraron un beneficio importante e inesperado del CDDSS solo en mujeres.
Este hallazgo podría ser resultado de la presentación más frecuente de síntomas no específicos, notoriamente difíciles de diagnosticar, en las mujeres que en los hombres; sin embargo, esta posibilidad requiere más investigación.
Los investigadores admitieron que este estudio tuvo algunas limitaciones.
En primer lugar, el resultado primario fue una puntuación de riesgo de calidad diagnóstica.
La puntuación de riesgo indicó la presencia de un resultado adverso relacionado con una oportunidad diagnóstica perdida en el departamento de urgencias, pero no equivalió a un error diagnóstico o daño diagnóstico, que fueron menos frecuentes.
En consecuencia, la intervención podría haber afectado al error o daño, que el estudio no fue diseñado para detectar.
La puntuación se creó sobre la base de una revisión de los resultados utilizados en estudios previos, así como la consulta a expertos durante el desarrollo del protocolo, y se validó con éxito en un subconjunto de pacientes seleccionados al azar utilizando una herramienta establecida para la evaluación del proceso diagnóstico.
La revisión de registros y la puntuación de riesgo de calidad diagnóstica solo estuvieron de acuerdo de manera justa.
Sin embargo, su acuerdo fue alto en comparación con el observado en otros estudios, ya que la concordancia entre los diferentes evaluadores y los diferentes enfoques para evaluar el error diagnóstico es notoriamente baja en la literatura.
Además, parece poco probable que cualquier inconsistencia entre la revisión de registros y el riesgo de calidad diagnóstica favorezca al grupo de intervención o al grupo de control.
En segundo lugar, no reclutaron una población no seleccionada de pacientes que se presentaron al departamento de emergencias, sino que incluyeron pacientes con mayor riesgo de error de diagnóstico para maximizar las posibilidades de observar un beneficio del uso de CDDSS.
Esta selección pudo limitar la generalización de los hallazgos a otros síntomas de presentación.
Las tasas publicadas de error de diagnóstico en medicina de emergencia varían del 6% al 15% o más.
Este ensayo identificó un riesgo de calidad de diagnóstico en el 18% de los pacientes, lo que sugirió que la población del ensayo fue ligeramente más difícil de diagnosticar que una población no seleccionada.
En tercer lugar, evaluaron el proceso de diagnóstico o las vías de los pacientes en un subconjunto de pacientes seleccionados al azar, y no evaluaron las experiencias de los pacientes, solo los riesgos relacionados con los resultados.
Los médicos y los pacientes podrían haberse beneficiado del uso de un CDDSS en términos de solicitud de pruebas o hacer derivaciones apropiadas.
En cuarto lugar, todos los pacientes fueron discutidos entre los médicos residentes que diagnosticaron y los consultores del departamento de emergencias, como es una práctica común en todos los sitios de ensayo participantes.
Debido a que la precisión de los diagnósticos es mayor cuando se realizan en equipos de dos que cuando se realizan individualmente, el beneficio potencial del CDDSS podría haberse reducido en comparación con un entorno en el que solo un solo médico participa en la toma de decisiones.
Por último, aunque utilizaron el sistema disponible más ampliamente y mejor evaluado, valoraron solo un único CDDSS.
Por lo tanto, los resultados podrían no generalizarse a todos los CDDSS.
En particular, los enfoques novedosos para el apoyo a la toma de decisiones diagnósticas, como proporcionar explicaciones junto con sugerencias o establecer una conversación estructurada para promover la reflexión, podrían dar lugar a diferentes efectos.
La evidencia de estudios retrospectivos y estudios clínicos prospectivos, incluido este estudio, no respalda el uso sistemático de apoyo informático para la toma de decisiones diagnósticas para mejorar la calidad de los diagnósticos realizados en la atención aguda.
Los efectos de los CDDSS son pequeños en el mejor de los casos y apenas se traducen en resultados relevantes para el paciente en poblaciones de pacientes no seleccionadas en medicina de emergencia.
Se deben realizar más investigaciones para evaluar la efectividad y eficiencia de los CDDSS en entornos con menor colaboración diagnóstica, como los centros de atención médica locales, e investigar el momento óptimo de la consulta con CDDSS.
También se necesitan con urgencia nuevas medidas de resultados para la evaluación de la calidad diagnóstica.
* Hautz WE, Marcin T, Hautz SC, Schauber SK, Krummrey G, Müller M, Sauter TC, Lambrigger C, Schwappach D, Nendaz M, Lindner G, Bosbach S, Griesshammer I, Schönberg P, Plüss E, Romann V, Ravioli S, Werthmüller N, Kölbener F, Exadaktylos AK, Singh H, Zwaan L. Diagnoses supported by a computerised diagnostic decision support system versus conventional diagnoses in emergency patients (DDX-BRO): a multicentre, multiple-period, double-blind, cluster-randomised, crossover superiority trial. Lancet Digit Health. 2025 Feb;7(2):e136-e144. doi: 10.1016/S2589-7500(24)00250-4. PMID: 39890244.