Calidad en Salud

Calidad en Salud No vengo a enseñar medicina, que para eso están las universidades, los libros y los papers. Debatamos juntos.

Vengo a contarte historias, que suceden cuando comienzas a recorrer los pasillos de un hospital.

𝗖𝘂𝗮𝗻𝗱𝗼 𝗹𝗮 𝗜𝗔 𝘁𝗲 𝗮𝘆𝘂𝗱𝗮 𝘁𝗮𝗻𝘁𝗼 𝗾𝘂𝗲 𝗱𝗲𝗷𝗮 𝗱𝗲 𝗮𝘆𝘂𝗱𝗮𝗿𝘁𝗲Hay un estudio que me quedó dando vueltas esta semana.Diecinueve endosco...
27/05/2026

𝗖𝘂𝗮𝗻𝗱𝗼 𝗹𝗮 𝗜𝗔 𝘁𝗲 𝗮𝘆𝘂𝗱𝗮 𝘁𝗮𝗻𝘁𝗼 𝗾𝘂𝗲 𝗱𝗲𝗷𝗮 𝗱𝗲 𝗮𝘆𝘂𝗱𝗮𝗿𝘁𝗲

Hay un estudio que me quedó dando vueltas esta semana.

Diecinueve endoscopistas polacos usaron un sistema de IA para detectar pólipos de colon durante tres meses. Luego lo apagaron. Y su rendimiento no solo bajó: cayó por debajo de lo que eran antes de usar la herramienta.

No porque el sistema fallara. Porque ellos se habían acostumbrado a él.

Eso tiene nombre técnico: deskilling. La erosión de una habilidad que ya existía porque una herramienta empezó a ejercerla por ti.

Pero hay algo más preocupante que perder lo que tenías.

Es no desarrollar lo que necesitabas.

𝗟𝗮 𝘁𝗮𝘅𝗼𝗻𝗼𝗺𝗶́𝗮 𝗱𝗲𝗹 𝗿𝗶𝗲𝘀𝗴𝗼

Dos publicaciones recientes —una en The Lancet, otra en Nature Medicine— describen tres fenómenos distintos que la IA puede generar en el médico:

🔹 Deskilling: El médico experimentado que pierde destreza por delegar en IA lo que antes hacía solo.

🔹 Mis-skilling: El médico que aprende mal porque la IA comete errores y él los acepta sin cuestionar. No aprende lo incorrecto de un libro. Lo aprende de un algoritmo que falló, y lo internaliza como verdad clínica.

🔹 Never-skilling: El más silencioso de los tres. El residente que nunca desarrolla razonamiento clínico independiente porque desde el primer día del hospital tiene una herramienta que piensa por él. No pierde una habilidad. Nunca la construye.

Este último es el que más me preocupa como formador y como auditor.

Porque el problema no aparece durante la residencia. Aparece años después, cuando el médico tiene que tomar una decisión difícil en un lugar donde la IA no llega, la red falla, o el caso simplemente no entra en ningún algoritmo conocido.

𝗟𝗼 𝗾𝘂𝗲 𝗹𝗮 𝗲𝘃𝗶𝗱𝗲𝗻𝗰𝗶𝗮 𝗱𝗶𝗰𝗲 —𝘆 𝗹𝗼 𝗾𝘂𝗲 𝗻𝗼 𝗱𝗶𝗰𝗲—

Seré honesto: la evidencia directa en educación médica todavía es limitada. Los autores de Nature Medicine lo reconocen. El fundamento es sólido en teoría del aprendizaje y tiene señales empíricas de contextos no médicos, pero aún no tenemos estudios controlados en residencias.

Eso no significa que el riesgo no exista. Significa que estamos corriendo más rápido que nuestra capacidad de medirlo.

Y eso, en medicina, no es una virtud.

¿𝗤𝘂𝗲́ 𝗽𝗿𝗼𝗽𝗼𝗻𝗲 𝗹𝗮 𝗰𝗶𝗲𝗻𝗰𝗶𝗮?

Un marco de tres fases que tiene mucho sentido:
Primero, competencia independiente. El médico —especialmente el que se forma— debe poder razonar solo antes de apoyarse en IA.

Luego, calibración crítica: aprender a evaluar cuándo la herramienta acierta y cuándo se equivoca.

Finalmente, integración supervisada de IA en la práctica formativa.

No es antiIA. Es lo contrario: es tomarse la IA lo suficientemente en serio como para no introducirla de cualquier manera.

𝗟𝗼 𝗾𝘂𝗲 𝗺𝗲 𝗽𝗿𝗲𝗼𝗰𝘂𝗽𝗮 𝗮𝗾𝘂𝗶́

En Ecuador —y en buena parte de Latinoamérica— adoptamos tecnología en salud sin los marcos pedagógicos que la sostengan. Lo hacemos con entusiasmo, con buenas intenciones y, con frecuencia, sin preguntarnos qué estamos cambiando en el proceso de formación cuando lo hacemos.

No es un problema de la IA. Es un problema de cómo la integramos.

Una herramienta extraordinaria, introducida en el momento equivocado del aprendizaje, puede construir un médico que funciona bien cuando el sistema funciona bien.

El problema es que los sistemas de salud, por definición, no siempre funcionan bien!

Y ese día, lo que necesitas no es un algoritmo.

Necesitas un médico que sepa pensar.

La evidencia no sirve para tener razón. Sirve para cuidar mejor.

📚 Fuentes:
— Berzin TM, Topol EJ. Preserving clinical skills in the age of AI assistance. The Lancet, Vol 406, octubre 2025.
— Ke Y et al. AI-induced never-skilling in medical education. Nature Medicine, publicado en línea mayo 2026. DOI: 10.1038/s41591-026-04438-y

¿𝗟𝗮 𝗜𝗔 𝘃𝗮 𝗮 𝗴𝗲𝘀𝘁𝗶𝗼𝗻𝗮𝗿 𝗻𝘂𝗲𝘀𝘁𝗿𝗼𝘀 𝗵𝗼𝘀𝗽𝗶𝘁𝗮𝗹𝗲𝘀? 𝗔𝗻𝘁𝗲𝘀 𝗱𝗲 𝗿𝗲𝘀𝗽𝗼𝗻𝗱𝗲𝗿, 𝗹𝗲𝗮𝗺𝗼𝘀 𝗹𝗼 𝗾𝘂𝗲 𝗱𝗶𝗰𝗲 𝗹𝗮 𝗲𝘃𝗶𝗱𝗲𝗻𝗰𝗶𝗮.Hay una narrativa que cir...
16/05/2026

¿𝗟𝗮 𝗜𝗔 𝘃𝗮 𝗮 𝗴𝗲𝘀𝘁𝗶𝗼𝗻𝗮𝗿 𝗻𝘂𝗲𝘀𝘁𝗿𝗼𝘀 𝗵𝗼𝘀𝗽𝗶𝘁𝗮𝗹𝗲𝘀? 𝗔𝗻𝘁𝗲𝘀 𝗱𝗲 𝗿𝗲𝘀𝗽𝗼𝗻𝗱𝗲𝗿, 𝗹𝗲𝗮𝗺𝗼𝘀 𝗹𝗼 𝗾𝘂𝗲 𝗱𝗶𝗰𝗲 𝗹𝗮 𝗲𝘃𝗶𝗱𝗲𝗻𝗰𝗶𝗮.

Hay una narrativa que circula con fuerza en foros de salud digital, congresos médicos y reuniones de gestión hospitalaria: los modelos de inteligencia artificial —particularmente los grandes modelos de lenguaje (LLMs, por sus siglas en inglés)— van a transformar la administración clínica. Cero analistas de datos, cero esperas para un reporte, cero intermediarios entre la pregunta y la respuesta.

Suena bien. El problema es que la evidencia más reciente dice otra cosa.

𝗟𝗼 𝗾𝘂𝗲 𝗵𝗶𝗰𝗶𝗲𝗿𝗼𝗻 𝗹𝗼𝘀 𝗶𝗻𝘃𝗲𝘀𝘁𝗶𝗴𝗮𝗱𝗼𝗿𝗲𝘀

Un equipo del Mount Sinai Health System y Mayo Clinic acaba de publicar en PLOS Digital Health (mayo 2026) un estudio que evaluó nueve LLMs —entre ellos GPT-4o, Llama-3.3-70B, DeepSeek y los modelos Qwen de Alibaba— en tareas administrativas sobre historias clínicas electrónicas reales. No texto libre, no notas de evolución, no resúmenes narrativos. Datos tabulares estructurados: las mismas tablas que usamos en nuestros sistemas para censos, reportes de ocupación, seguimiento de indicadores.

Las tareas fueron simples, en papel: contar cuántos pacientes cumplían una condición, o filtrar pacientes que cumplieran múltiples criterios con criterios de exclusión. Nada que un analista con SQL no resuelva en tres minutos.

Se probaron tres estrategias: respuesta directa, razonamiento paso a paso (chain-of-thought), y una estrategia híbrida donde el modelo genera código Python que luego se ejecuta para obtener el resultado.

El dataset: 50.000 visitas a urgencias, con 32.950 consultas totales a los modelos.

𝗟𝗼 𝗾𝘂𝗲 𝗲𝗻𝗰𝗼𝗻𝘁𝗿𝗮𝗿𝗼𝗻

Los números no son amables con el entusiasmo acrítico:

El prompting directo produjo precisiones bajas en todos los modelos, para ambas tareas. En filtrado lógico complejo, GPT-4o —el mejor modelo evaluado— llegó apenas al 49,4% con instrucción directa. Menos que una moneda al aire en un contexto donde el error tiene consecuencias.

El razonamiento paso a paso mejoró los resultados de forma moderada. GPT-4o subió al 77,4% en filtrado con esta estrategia. Pero hay una trampa: la precisión se deteriora de manera significativa conforme crece la tabla. Con 5 filas, casi perfecta. Con 25 filas, por debajo del 60%. En un hospital real, nuestras tablas tienen miles de registros.

Los modelos de razonamiento destilado (DeepSeek-R1), diseñados para razonar internamente sin que se les pida, no superaron a los modelos guiados explícitamente. El razonamiento implícito no garantiza rendimiento.
El único enfoque que funcionó de manera consistente: el modelo genera código ejecutable, ese código corre, y el resultado del código es la respuesta. Con esta estrategia, GPT-4o y Qwen-2.5-72B alcanzaron precisión casi perfecta.

𝗟𝗼 𝗾𝘂𝗲 𝗲𝘀𝘁𝗼 𝘀𝗶𝗴𝗻𝗶𝗳𝗶𝗰𝗮 𝗽𝗮𝗿𝗮 𝗾𝘂𝗶𝗲𝗻𝗲𝘀 𝗴𝗲𝘀𝘁𝗶𝗼𝗻𝗮𝗺𝗼𝘀 𝘀𝗮𝗹𝘂𝗱

Trabajo en auditoría médica hospitalaria. Todos los días interactúo con datos estructurados: indicadores de calidad, tiempos de espera, tasas de complicaciones, registros de auditoría concurrente. Y conozco bien la tentación institucional y profesional de adoptar herramientas de IA como solución a problemas que, en muchos casos, tienen soluciones más simples y comprobadas.

Este estudio no dice que la IA no sirve. La evidencia existente muestra que los LLMs son genuinamente útiles en texto clínico libre —notas de evolución, informes de imagen, resúmenes de alta, comunicación con pacientes. Ahí hay valor real.

Lo que dice este estudio es algo más preciso y más útil: los LLMs solos, sin integración con herramientas computacionales explícitas (código, SQL, agentes estructurados), no son confiables para tareas administrativas sobre datos tabulares.

Y que presentarlos como solución autónoma para gestión hospitalaria es, en el mejor caso, ignorancia; en el peor, marketing.

En Ecuador, donde los sistemas de información hospitalaria son heterogéneos, la infraestructura de datos es frágil y los presupuestos para tecnología son escasos, este matiz es fundamental. No podemos darnos el lujo de adoptar herramientas que funcionan en el papel de una presentación pero fallan en la operación real.

𝗟𝗮 𝗰𝗼𝗻𝗰𝗹𝘂𝘀𝗶𝗼́𝗻 𝗾𝘂𝗲 𝗱𝗲𝗯𝗲𝗿𝗶́𝗮𝗺𝗼𝘀 𝗹𝗹𝗲𝘃𝗮𝗿𝗻𝗼𝘀

Los enfoques híbridos —LLM como interfaz de lenguaje natural + ejecución computacional estructurada (como el Model Context Protocol que mencionan los autores)— son el camino técnicamente válido. No el LLM solo. No el entusiasmo sin validación.

La diferencia entre una herramienta útil y una herramienta peligrosa en salud no está en su capacidad de impresionar en una demo. Está en lo que hace cuando los datos son reales, las tablas son grandes y el margen de error es clínico.

Antes de implementar, hay que evaluar. Antes de escalar, hay que evidenciar.

La ciencia no reemplaza la humanidad. La ordena. Y a veces, también ordena nuestras decisiones de compra.

Fuente: Klang E, Sorin V, Korfiatis P, et al. Large language models are poor clinical administrators: An evaluation of structured queries in real-world electronic health records. PLOS Digital Health. 2026;5(5):e0001326.

Los pacientes con cáncer no siempre llegan tarde porque el sistema no tiene dónde atenderlos. A veces llegan tarde porqu...
15/05/2026

Los pacientes con cáncer no siempre llegan tarde porque el sistema no tiene dónde atenderlos. A veces llegan tarde porque nadie leyó la señal que ya estaba en su historia clínica.

Las guías actuales de tamizaje oncológico funcionan así: si tienes más de 50 años, si fumaste por suficientes años, si tienes antecedente familiar de cierto cáncer — entonces entras al protocolo de detección. Si no cumples esos criterios, no entras. Así de binario.

El problema es que el riesgo real de una persona no cabe en esa lógica. La trayectoria clínica de un paciente — sus consultas previas, sus diagnósticos acumulados, sus laboratorios a lo largo del tiempo, los síntomas que registró y que nadie conectó entre sí — contiene información que los criterios tradicionales no capturan.

Lo que demostró el estudio
Investigadores de Columbia University y Cedars-Sinai analizaron más de 865.000 historias clínicas electrónicas integradas del programa All of Us del NIH. Construyeron modelos predictivos usando únicamente lo que ya estaba documentado en esos registros.

El resultado: identificaron individuos de alto riesgo oncológico con 3 a 6 veces mayor eficacia que los criterios tradicionales de tamizaje, en 8 tipos de cáncer — mama, pulmón, colorrectal, próstata, ovario, hígado, páncreas y estómago. El modelo más avanzado, entrenado sobre trayectorias clínicas completas, extendió ese rendimiento a 26 tipos.

No inventaron nada. Leyeron mejor lo que ya existía.

Entonces el problema no es la tecnología. Es el registro.

Para que un modelo así funcione necesita datos longitudinales, completos, estructurados e integrados entre niveles de atención. Necesita que el médico de primer nivel registre con precisión.

Que el especialista pueda ver la trayectoria previa del paciente. Que los sistemas hablen entre sí.
En muchos servicios de salud pública en Ecuador y América Latina, eso todavía no ocurre. No por falta de voluntad — sino porque la historia clínica electrónica sigue siendo tratada como un trámite, no como un instrumento clínico.

Cada campo que se deja vacío es una señal que desaparece. Cada historia copiada del día anterior es ruido que reemplaza información real. Cada sistema que no se integra con el siguiente nivel es un corte en la trayectoria del paciente.

La evidencia ya demostró que la señal prediagnóstica existe en los registros clínicos. El desafío ahora es generarla bien — desde la primera consulta, en cada nivel, con la disciplina de quien sabe que ese dato puede marcar la diferencia dos años después.

Menos ruido. Más evidencia. Mejor registro.

Fuente: Park J, Pang C, Lee TY, et al. Toward scalable early cancer detection: evaluating EHR-based predictive models against traditional screening criteria. npj Precision Oncology. 2026. DOI: 10.1038/s41698-026-01483-1

𝗨𝘁𝗮𝗵 𝗮𝗰𝗮𝗯𝗮 𝗱𝗲 𝗮𝘂𝘁𝗼𝗿𝗶𝘇𝗮𝗿 𝘂𝗻𝗮 𝗜𝗔 𝗽𝗮𝗿𝗮 𝗽𝗿𝗲𝘀𝗰𝗿𝗶𝗯𝗶𝗿 𝗺𝗲𝗱𝗶𝗰𝗮𝗺𝗲𝗻𝘁𝗼𝘀 𝘀𝗶𝗻 𝗺𝗲́𝗱𝗶𝗰𝗼. 𝗘𝘀𝘁𝗼 𝗲𝘀 𝗹𝗼 𝗾𝘂𝗲 𝗲𝘀𝗼 𝘀𝗶𝗴𝗻𝗶𝗳𝗶𝗰𝗮 𝗽𝗮𝗿𝗮 𝗻𝗼𝘀𝗼𝘁𝗿𝗼𝘀.Esta...
14/05/2026

𝗨𝘁𝗮𝗵 𝗮𝗰𝗮𝗯𝗮 𝗱𝗲 𝗮𝘂𝘁𝗼𝗿𝗶𝘇𝗮𝗿 𝘂𝗻𝗮 𝗜𝗔 𝗽𝗮𝗿𝗮 𝗽𝗿𝗲𝘀𝗰𝗿𝗶𝗯𝗶𝗿 𝗺𝗲𝗱𝗶𝗰𝗮𝗺𝗲𝗻𝘁𝗼𝘀 𝘀𝗶𝗻 𝗺𝗲́𝗱𝗶𝗰𝗼. 𝗘𝘀𝘁𝗼 𝗲𝘀 𝗹𝗼 𝗾𝘂𝗲 𝗲𝘀𝗼 𝘀𝗶𝗴𝗻𝗶𝗳𝗶𝗰𝗮 𝗽𝗮𝗿𝗮 𝗻𝗼𝘀𝗼𝘁𝗿𝗼𝘀.

Esta semana, JAMA publicó un Viewpoint que resume algo que ocurrió en enero de 2026 y que todavía no ha recibido la atención que merece.

El estado de Utah, en Estados Unidos, firmó un acuerdo con una empresa llamada Doctronic para que su sistema de inteligencia artificial prescriba medicamentos directamente a los pacientes. Sin médico de por medio. Incluyendo antidepresivos, anticoagulantes, corticoides y hormonas.

Sin aprobación de la FDA. Sin un ensayo clínico publicado en revista con revisión de pares. Con datos de seguridad producidos por la propia empresa —que además no fueron evaluados de forma ciega.

Los autores del artículo —un médico jurista y un profesor de derecho en salud pública de las universidades de Utah y Boston— lo dicen sin rodeos: esto es evasión de las garantías legales que han protegido a los pacientes durante décadas.

¿Sirve o no sirve la IA en medicina?

Esa es la pregunta que nos hemos estado haciendo. Y la evidencia acumulada entre 2024 y 2026 —más de dos docenas de estudios en revistas como Nature Medicine, JAMA Network Open y JMIR— ya tenía una respuesta articulada:
Sí sirve. Para cosas específicas. Con condiciones no negociables.

Sirve para reducir la carga documental del médico. Sirve para asistir el razonamiento diagnóstico cuando hay un profesional que valida. Sirve para automatizar codificación diagnóstica con resultados comparables a la revisión humana. Sirve para mejorar la legibilidad de materiales para pacientes.

No sirve todavía para triaje autónomo en emergencias —los modelos mandan a demasiados pacientes a urgencias y generan colapso. No sirve para diagnóstico diferencial sin supervisión —es el punto más débil en todos los modelos evaluados. Y no sirve, bajo ninguna evidencia disponible, para prescribir medicamentos sin un médico que sea legalmente responsable de esa decisión.

Utah acaba de hacer exactamente eso último.
El Dilema de Collingridge y por qué nos importa
Los autores del Viewpoint citan un concepto de filosofía de la tecnología que merece explicarse.
El Dilema de Collingridge dice esto: cuando una tecnología es nueva, es fácil regularla, pero sus consecuencias dañinas son difíciles de predecir. Cuando sus daños se vuelven visibles, la tecnología ya está tan integrada en la economía y en los sistemas que controlarla se vuelve políticamente inviable.

Lo vimos con el tabaco. La FDA tardó décadas en actuar sobre los ci*******os electrónicos con sabores, y para cuando intentó regular, el mercado era tan grande y los intereses tan poderosos que la regulación se volvió casi simbólica. Una epidemia de consumo juvenil fue el resultado.
Con la IA en prescripción médica, el riesgo es el mismo. Si Doctronic se convierte en estándar antes de que existan marcos de seguridad validados, regularlo después puede ser políticamente imposible. Otras empresas ya están observando lo que Utah hizo —y tomando nota de que se puede eludir la FDA invocando excepciones regulatorias estatales.

¿Qué significa esto para Ecuador y Latinoamérica?

Nosotros no tenemos Utah. Tampoco tenemos la FDA, ni el sistema legal que —aunque imperfecto— permite demandas por responsabilidad civil cuando una tecnología médica daña a un paciente.

Lo que sí tenemos es la tendencia documentada de importar tecnología sin el marco regulatorio que la acompaña. De adoptar innovaciones diseñadas para otros sistemas, en otros contextos, con otra infraestructura —y aplicarlas sobre realidades que no fueron consideradas en su diseño.

Si en Estados Unidos, con toda su capacidad regulatoria, ya están saltándose las garantías básicas, la pregunta para nosotros es más urgente, no menos.

¿Qué criterio institucional tenemos para evaluar una herramienta de IA antes de integrarla en la práctica clínica? ¿Quién valida que lo que se implementa tiene evidencia real detrás? ¿Quién responde cuando falla?

En Ecuador, esas preguntas todavía no tienen respuesta institucional clara. Y ese vacío no es neutro. Es un riesgo.

Conclusión

La IA en salud tiene aplicaciones reales con evidencia real. Eso no cambia.

Lo que Utah demostró es que la velocidad del entusiasmo tecnológico puede superar la velocidad de la prudencia institucional. Y que cuando eso ocurre en medicina, los que pagan el costo no son las empresas. Son los pacientes.
La herramienta no es el problema. El problema es implementarla sin criterio, sin regulación y sin responsabilidad.

Eso no es innovación. Es un experimento sin consentimiento.

Fuente: Aaron DG, Robertson C. The First AI Drug Prescriber. JAMA. 2026;335(18):1567–1568. doi:10.1001/jama.2026.3533 · Síntesis de evidencia clínica sobre LLMs en medicina 2024–2026, publicada en JAMA Network Open, Nature Medicine, JMIR, BMC Medical Informatics y Scientific Reports.

14/05/2026

𝗜𝗔 𝗲𝗻 𝗺𝗲𝗱𝗶𝗰𝗶𝗻𝗮: ¿𝘀𝗶𝗿𝘃𝗲 𝗼 𝗻𝗼 𝘀𝗶𝗿𝘃𝗲? 𝗟𝗮 𝗿𝗲𝘀𝗽𝘂𝗲𝘀𝘁𝗮 𝗵𝗼𝗻𝗲𝘀𝘁𝗮 𝗾𝘂𝗲 𝗰𝗿𝗲𝗼 𝗾𝘂𝗲 𝗻𝗲𝗰𝗲𝘀𝗶𝘁𝗮𝗺𝗼𝘀.

Creo que ya hay suficiente contenido que rodea la pregunta sin contestarla.

Después de revisar más de dos docenas de estudios publicados entre 2024 y 2026 en revistas como JAMA, Nature Medicine y JMIR, mi criterio como médico auditor es este:

La IA en salud sirve. Para aplicaciones específicas. Con condiciones concretas. Y no sirve —todavía— para otras.

Esto es lo que la evidencia dice, traducido a lo que nos importa en Ecuador y Latinoamérica.
DONDE SÍ SIRVE — con evidencia

1. 𝗥𝗲𝗱𝘂𝗰𝗶𝗿 𝗹𝗮 𝗰𝗮𝗿𝗴𝗮 𝗱𝗲 𝗱𝗼𝗰𝘂𝗺𝗲𝗻𝘁𝗮𝗰𝗶𝗼́𝗻 𝗰𝗹𝗶́𝗻𝗶𝗰𝗮

Un médico de hospital público en Ecuador puede pasar entre una y dos horas de su turno escribiendo notas, epicrisis, informes de alta. Ese tiempo no está con el paciente. No está tomando decisiones. Está frente a una pantalla llenando campos.

La evidencia muestra que las herramientas de IA reducen esa carga de forma moderada pero real. En un estudio con 384 altas hospitalarias, los puntajes de burnout de los médicos bajaron significativamente cuando usaron IA para generar resúmenes —que luego revisaban y aprobaban ellos mismos.

Condición crítica: el médico revisa siempre. La IA redacta un borrador. El criterio clínico sigue siendo humano.

Aplicabilidad en Ecuador: media. Requiere que el establecimiento tenga historia clínica electrónica funcional. Donde todavía se trabaja en papel, esta aplicación no es posible todavía.

2. 𝗔𝘂𝗱𝗶𝘁𝗼𝗿𝗶́𝗮 𝗱𝗲 𝗿𝗲𝗴𝗶𝘀𝘁𝗿𝗼𝘀 𝘆 𝗰𝗼𝗱𝗶𝗳𝗶𝗰𝗮𝗰𝗶𝗼́𝗻 𝗱𝗶𝗮𝗴𝗻𝗼́𝘀𝘁𝗶𝗰𝗮

Este es el punto que más me interesa como auditor.

Un sistema basado en GPT-4o alcanzó 93,6% de precisión en la validación de más de 13.000 códigos ICD-10 —comparable a la revisión médica directa. Para equipos de auditoría que manejan volúmenes altos de registros, eso tiene valor operativo inmediato.

En nuestro contexto, donde los errores de codificación generan problemas de facturación, auditoría y estadística epidemiológica, una herramienta que asista en la validación de códigos puede mejorar procesos reales.

Condición crítica: no es implementación autónoma. Es asistencia validada por auditor.
Aplicabilidad en Ecuador: alta, si los registros están digitalizados.

3. 𝗔𝗽𝗼𝘆𝗼 𝗮𝗹 𝗿𝗮𝘇𝗼𝗻𝗮𝗺𝗶𝗲𝗻𝘁𝗼 𝗱𝗶𝗮𝗴𝗻𝗼́𝘀𝘁𝗶𝗰𝗼

Cuando un médico usa la IA como herramienta de consulta —no como oráculo— su precisión diagnóstica mejora. Un sistema probado en entornos controlados llevó la precisión del diagnóstico diferencial asistido de 36% a 52%.
Eso importa especialmente en contextos donde el médico trabaja solo, sin especialista disponible, en una unidad de primer o segundo nivel. Una herramienta que amplíe el razonamiento clínico disponible tiene sentido.

Condición crítica: el médico evalúa, decide y es responsable. Siempre.

4. 𝗖𝗼𝗺𝘂𝗻𝗶𝗰𝗮𝗰𝗶𝗼́𝗻 𝗰𝗼𝗻 𝗽𝗮𝗰𝗶𝗲𝗻𝘁𝗲𝘀 𝘆 𝗺𝗮𝘁𝗲𝗿𝗶𝗮𝗹𝗲𝘀 𝗲𝗱𝘂𝗰𝗮𝘁𝗶𝘃𝗼𝘀

La IA mejora la legibilidad de materiales de salud. Los adapta al nivel de comprensión del paciente. En contextos de salud con baja alfabetización en salud —que describe buena parte de nuestra población— eso tiene valor real.

Lo que no tiene evidencia todavía: que eso cambie comportamientos o desenlaces clínicos a largo plazo.

DONDE NO SIRVE — todavía

Triaje autónomo en emergencias
Los modelos mandan a demasiados pacientes a urgencias por precaución —alta sensibilidad, baja especificidad. En un sistema de emergencias ya saturado, eso no ayuda. Agrava.

Diagnóstico diferencial sin supervisión

Es el punto más débil en todos los modelos evaluados. Los LLMs conocen mucho. Razonan diferente a un clínico con experiencia. Y cuando se equivocan, lo hacen con confianza —lo que es más peligroso que equivocarse con duda.

Cualquier decisión clínica crítica sin validación humana

Toda la evidencia disponible, sin excepción, concluye lo mismo: el despliegue autónomo no está justificado. La supervisión humana no es opcional. Es parte del modelo.

𝗘𝗟 𝗣𝗥𝗢𝗕𝗟𝗘𝗠𝗔 𝗘𝗦𝗣𝗘𝗖𝗜́𝗙𝗜𝗖𝗢 𝗗𝗘 𝗘𝗖𝗨𝗔𝗗𝗢𝗥

Las aplicaciones donde la IA sí funciona requieren algo que en muchos de nuestros establecimientos todavía estamos construyendo: datos estructurados, registros digitalizados, conectividad estable, capacidad técnica instalada.

No es que la IA no sirva para nosotros. Es que sirve en la medida en que tengamos los fundamentos para sostenerla.

El primer paso no es el algoritmo. Es el dato limpio, el proceso documentado y el criterio institucional para saber qué automatizar y qué no.
Eso es exactamente lo que hace un buen equipo de auditoría. Y eso, la IA no lo reemplaza todavía.

Fuente: Síntesis de evidencia clínica sobre LLMs en medicina (2024–2026). JAMA Network Open · Nature Medicine · JMIR · BMC Medical Informatics · Scientific Reports.

¿𝗖𝘂𝗮́𝗻𝘁𝗮𝘀 𝗵𝗼𝗿𝗮𝘀 𝗹𝗹𝗲𝘃𝗮𝘀 𝗰𝗼𝗺𝗽𝗹𝗲𝘁𝗮𝗻𝗱𝗼 𝗺𝗼́𝗱𝘂𝗹𝗼𝘀 𝗱𝗲 𝗰𝗮𝗽𝗮𝗰𝗶𝘁𝗮𝗰𝗶𝗼́𝗻 𝗾𝘂𝗲 𝗻𝗼 𝗰𝗮𝗺𝗯𝗶𝗮𝗻 𝗻𝗮𝗱𝗮?Voy a contarte algo que probablemente y...
14/05/2026

¿𝗖𝘂𝗮́𝗻𝘁𝗮𝘀 𝗵𝗼𝗿𝗮𝘀 𝗹𝗹𝗲𝘃𝗮𝘀 𝗰𝗼𝗺𝗽𝗹𝗲𝘁𝗮𝗻𝗱𝗼 𝗺𝗼́𝗱𝘂𝗹𝗼𝘀 𝗱𝗲 𝗰𝗮𝗽𝗮𝗰𝗶𝘁𝗮𝗰𝗶𝗼́𝗻 𝗾𝘂𝗲 𝗻𝗼 𝗰𝗮𝗺𝗯𝗶𝗮𝗻 𝗻𝗮𝗱𝗮?

Voy a contarte algo que probablemente ya sabes si trabajas en salud, pero que casi nadie dice en voz alta con datos en la mano.

Cada año, en hospitales de todo el mundo, los profesionales de salud completan módulos de capacitación obligatoria. Privacidad de datos. Ciberseguridad. Conducta laboral. Prevención de infecciones. Seguridad del paciente. El listado varía según la institución, pero el formato es prácticamente universal: diapositivas. Grabaciones. Cuestionario al final. Clic en "completado".

Y al año siguiente, lo mismo. Las mismas diapositivas. El mismo cuestionario. El mismo clic.
En mayo de 2026, la revista JAMA —una de las publicaciones médicas más influyentes del mundo— publicó un Viewpoint del Dr. Michael Gottlieb que hace una pregunta incómoda y necesaria:
¿Estamos aprendiendo algo con todo esto, o simplemente estamos documentando que lo hicimos?

𝗤𝘂𝗲́ 𝗱𝗶𝗰𝗲 𝗝𝗔𝗠𝗔

El Dr. Gottlieb, médico de emergencias de Rush University Medical Center en Chicago, no cuestiona la importancia de los temas. Privacidad, seguridad, conducta: nadie va a argumentar que no importan.

Lo que cuestiona es el método.

Señala que la mayoría de estos módulos:
— Están diseñados en formato pasivo (leer, escuchar, responder selección múltiple).
— No se actualizan por años.
— No están adaptados a la especialidad o contexto del profesional.
— No miden cambio de conducta, solo finalización.
— No siguen los principios básicos del aprendizaje en adultos.

Y cita algo fundamental que vale la pena repetir: completar una actividad de cumplimiento no demuestra conocimiento, no demuestra competencia, y no garantiza cambio de comportamiento.

Hay una revisión sistemática publicada en Medical Teacher en 2025 (Ashley et al., BEME Guide No. 87) que analizó la evidencia sobre capacitación obligatoria en salud y llegó a una conclusión parecida: se cumple el objetivo de documentar, pero hay evidencia limitada de que eso se traduzca en mejores prácticas o mejores resultados.

𝗘𝗹 𝗰𝗼𝘀𝘁𝗼 𝗾𝘂𝗲 𝗻𝗮𝗱𝗶𝗲 𝗲𝘀𝘁𝗮́ 𝗰𝗮𝗹𝗰𝘂𝗹𝗮𝗻𝗱𝗼

El artículo hace una estimación conservadora. En Estados Unidos, si cada médico dedica unas 4 horas al año a módulos obligatorios, y hay más de un millón de médicos activos, eso suma 4 millones de horas médico/año.

Traducido a dinero, con un estimado de $200 por hora de trabajo médico: aproximadamente $800 millones anuales en tiempo productivo que pudo haber sido consulta, cirugía, docencia, investigación o mejora de procesos.

Cuatro millones de horas que no fueron consultas atendidas. Que no fueron procedimientos realizados. Que no fueron pacientes vistos.
Y eso sin contar lo que el propio artículo llama "fragmentación cognitiva": el costo de interrumpir la atención clínica para hacer clic en diapositivas a mitad de turno.

¿𝗣𝗼𝗿 𝗾𝘂𝗲́ 𝘀𝗲𝗴𝘂𝗶𝗺𝗼𝘀 𝗵𝗮𝗰𝗶𝗲́𝗻𝗱𝗼𝗹𝗼 𝗲𝗻𝘁𝗼𝗻𝗰𝗲𝘀?

Gottlieb lo dice con claridad: porque la institución necesita documentar cumplimiento ante organismos acreditadores y asesores legales. El objetivo no es que aprendas. El objetivo es que quede registrado que pasaste por el proceso.
Eso tiene un nombre técnico: confundir el indicador de proceso con el indicador de resultado.

Es como medir la calidad hospitalaria por el número de reuniones de comité realizadas, no por la mortalidad ajustada por riesgo. El registro existe. El impacto, no necesariamente.

Lo que yo le añadiría a este argumento
El artículo es norteamericano y el contexto ecuatoriano tiene sus propias particularidades. Pero el problema de fondo es el mismo.

Yo lo he dicho durante años, y este artículo en JAMA ahora lo respalda con argumentos que van más allá de la intuición clínica:
Las capacitaciones, por sí solas, raramente cambian lo que pasa en un servicio.
Lo que cambia un servicio es la 𝗿𝗲𝗶𝗻𝗴𝗲𝗻𝗶𝗲𝗿𝗶́𝗮 𝗱𝗲 𝘀𝘂𝘀 𝗽𝗿𝗼𝗰𝗲𝘀𝗼𝘀.

Puedo capacitar a un equipo de enfermería durante veinte horas en higiene de manos. Si el dispensador de alcohol gel está vacío, si está mal ubicado, si el flujo de atención es tan rápido que nadie tiene tiempo de detenerse, si la cultura del servicio ha normalizado saltárselo: el indicador de IAAS no va a moverse.

Lo que mueve el indicador es rediseñar el proceso. Poner el dispensador donde tiene que estar. Construir el flujo para que lavarse las manos sea lo más fácil, no lo más heroico.

Las organizaciones que aprenden de verdad no son las que más módulos lanzan cada año. Son las que identifican dónde está fallando el sistema, rediseñan ese punto, y luego —si hace falta— capacitan para sostener el cambio.

El orden importa. Primero el proceso. Después la formación.

¿𝗤𝘂𝗲́ 𝗽𝗿𝗼𝗽𝗼𝗻𝗲 𝗲𝗹 𝗮𝗿𝘁𝗶́𝗰𝘂𝗹𝗼?

Gottlieb no dice "eliminen todo". Propone algo razonable:

— Diferenciar qué temas realmente necesitan refuerzo anual y cuáles no.
— Adaptar el contenido por especialidad y rol.
— Permitir que quien ya domina el tema demuestre competencia y avance.
— Donde sí se capacite, usar casos clínicos, simulación, contenido breve y de alto rendimiento.
— Medir resultados reales, no solo finalización.
— Y, sobre todo, calcular el costo de oportunidad de cada hora que se exige a un profesional clínico.

Eso se llama diseño instruccional basado en evidencia. Y es lo que debería aplicarse en cualquier programa de formación institucional serio.

𝗨𝗻𝗮 𝘂́𝗹𝘁𝗶𝗺𝗮 𝗿𝗲𝗳𝗹𝗲𝘅𝗶𝗼́𝗻

Hay algo que este artículo no dice, pero que creo importante agregar para nuestro contexto:
En sistemas de salud con recursos limitados, el costo del tiempo profesional es aún más crítico. Cada hora de un médico o enfermero que se destina a hacer clic en diapositivas es una hora que no fue al paciente, no fue al proceso, no fue al equipo.

No estamos en posición de darnos el lujo de confundir el cumplimiento con la mejora.

La calidad no empieza en el módulo completado. Empieza en los procesos que hacen difícil cometer errores.

📄 Gottlieb M. Mandatory Training Modules in Health Care — Time to Reassess. JAMA. 2026;335(18):1569–1570. doi:10.1001/jama.2026.3969

Revisión sistemática citada: Ashley H, et al. BEME Guide No. 87. Med Teach. 2025;47(2):195-204.

El SOP ya no se llama SOP. Y hay una razón muy importante detrás de ese cambio.Si tú o alguien que conoces ha recibido e...
13/05/2026

El SOP ya no se llama SOP. Y hay una razón muy importante detrás de ese cambio.

Si tú o alguien que conoces ha recibido el diagnóstico de síndrome de ovario poliquístico, esto te interesa. No porque cambie tu tratamiento de hoy para mañana — sino porque cambia algo más profundo: el nombre con el que el sistema de salud te ve. 📋

🔬 ¿Qué pasó?

The Lancet — una de las revistas médicas más importantes del mundo — publicó hoy el resultado de un proceso histórico. Después de décadas de debate, más de 14.000 encuestados de todo el mundo (pacientes y profesionales de salud), y talleres de consenso con metodología científica rigurosa, se decidió cambiar oficialmente el nombre de la condición.

Antes: Síndrome de Ovario Poliquístico (SOP / PCOS)

Ahora: Síndrome Metabólico Ovario Poliendocrino (PMOS, Polyendocrine Metabolic Ovarian Syndrome)

❓ ¿Por qué cambiar el nombre?

Porque el nombre anterior era, técnicamente, incorrecto. Y esa inexactitud tenía consecuencias reales en la vida de las mujeres.

El nombre "ovario poliquístico" sugería que el problema principal eran quistes en los ovarios. Pero eso no es lo que pasa realmente en la mayoría de las mujeres con esta condición. Los folículos que se ven en el ultrasonido no son quistes patológicos — son el resultado de una alteración hormonal mucho más compleja.

El problema de fondo es multisistémico:

— 🧬 Alteraciones hormonales múltiples (hormonas masculinas elevadas, señales cerebrales desreguladas, hormona antimülleriana elevada)
— 🍬 Resistencia a la insulina, presente en el 85% de las afectadas — incluso en mujeres delgadas
— ❤️ Mayor riesgo de diabetes tipo 2, hipertensión, hígado graso y enfermedad cardiovascular
— 🧠 Mayor riesgo de depresión, ansiedad y trastornos de la alimentación
— 🌸 Alteraciones en la ovulación, el ciclo menstrual y la fertilidad

Nada de eso estaba en el nombre. Y lo que no está en el nombre, con frecuencia no está en la consulta, ni en los exámenes pedidos, ni en la atención que se brinda.

El daño silencioso de un nombre equivocado
Estudios previos mostraron que hasta el 70% de las mujeres con esta condición permanecen sin diagnóstico. Muchas tardaron años en saber lo que tenían. Muchas más recibieron el diagnóstico pero nunca les explicaron el riesgo cardiovascular o metabólico que acompañaba su condición — porque el nombre llevaba a concentrarse solo en los ovarios.

En culturas donde la fertilidad es parte del valor social de una mujer — y Ecuador no es la excepción — el nombre "síndrome de ovario poliquístico" cargaba un estigma particular. Una mujer recibía un diagnóstico que sonaba a problema reproductivo, cuando en realidad tenía una condición hormonal y metabólica compleja que necesitaba un enfoque integral.

Eso generó frustración, diagnósticos tardíos, atención fragmentada y, en muchos casos, daño real a la salud.

✅ ¿Qué cambia con el nuevo nombre?

El nuevo nombre — PMOS — captura la realidad de la condición:

🔹 Poli-endocrino: porque involucra múltiples hormonas y sistemas (no solo el ovario)
🔹 Metabólico: porque la resistencia a la insulina y el riesgo cardiovascular son parte central, no secundaria
🔹 Ovárico: porque el ovario sí está involucrado — pero como parte de un sistema, no como el origen único del problema

⚠️ ¿Qué NO cambia?

Los criterios diagnósticos siguen siendo los mismos por ahora. Si tienes el diagnóstico de SOP, tu condición no desapareció — simplemente tiene un nombre más preciso. El tratamiento que funciona hoy seguirá funcionando. Los médicos que te conocen y entienden tu caso no van a cambiar tu manejo de un día para otro.

Lo que cambia es la conversación — y eso, a largo plazo, cambia mucho.

🌎 ¿Y aquí en Ecuador?

El PMOS (SOP) es una de las condiciones más frecuentes en la consulta ginecológica y endocrinológica en el país. Una de cada ocho mujeres lo tiene. La mayoría llega a la consulta por ciclos irregulares o dificultad para embarazarse — y muchas nunca reciben una evaluación completa del componente metabólico.

Este cambio de nombre es también un recordatorio para el sistema: esta condición necesita atención integrada — ginecología, endocrinología, nutrición, salud mental — no solo una receta y una cita de seguimiento en seis meses.

Un nombre no cura. Pero un nombre preciso orienta el diagnóstico, la atención y las políticas. Y a veces, eso marca la diferencia entre detectar una complicación a tiempo o descubrirla demasiado tarde.

La ciencia no siempre llega con un medicamento nuevo. A veces llega corrigiendo lo que siempre estuvimos nombrando mal.

Fuente: Teede HJ et al. Polyendocrine metabolic ovarian syndrome, the new name for polycystic o***y syndrome: a multistep global consensus process. The Lancet, 2026. DOI: 10.1016/S0140-6736(26)00717-8

Dirección

Quito

Página web

Notificaciones

Sé el primero en enterarse y déjanos enviarle un correo electrónico cuando Calidad en Salud publique noticias y promociones. Su dirección de correo electrónico no se utilizará para ningún otro fin, y puede darse de baja en cualquier momento.

Contacto La Empresa

Enviar un mensaje a Calidad en Salud:

Compartir