Dos IAs en la consulta, parte 2

Inteligencia artificial generativa en medicina ambulatoria: retos y oportunidades

Liberar al médico de lo que no debería estar haciendo es la condición para que vuelva a hacer lo que solo él puede hacer.

Camilo Naranjo, miembro de AIpocrates, CEO Saludtools
Andrés Rico, CEO de AIpocrates, médico de atención primaria

La primera parte de este texto recorrió el diagnóstico: los sesgos estructurales del norte global, los riesgos de las alucinaciones, la inviabilidad del método socrático en veinte minutos de consulta, y la necesidad de regular los agentes autónomos por su nivel de autonomía real.

Esta segunda parte recorre la oportunidad: qué puede hacer la IA hoy, con evidencia publicada, sin esperar a que el sistema cambie.

Sobre el uso de la inteligencia artificial generativa en salud se han señalado riesgos, especialmente los sesgos del preentrenamiento y las alucinaciones. Frente a ello, la propuesta más madura hoy son los sistemas híbridos: arquitecturas mixtas que combinan sistemas basados en reglas con inteligencia artificial generativa, capturando lo mejor de ambos paradigmas.

Esta propuesta complementa y se diferencia de lo descubierto en columnas previas sobre el potencial de la IA en las IPS (¿Por qué construir IA en hospitales puede ser una trampa estratégica?): allí el foco es estratégico; aquí el foco es operativo, clínico y de consulta.

1. Medir lo correcto

Hay una ironía profunda en la discusión actual sobre IA en medicina. La medicina moderna está fundada en el concepto de medicina basada en evidencia. Sin embargo, las métricas actuales en atención ambulatoria son, en su mayoría, métricas de volumen: cuántos pacientes se vieron, cuántas consultas se completaron, cuántos tickets administrativos se cerraron.

Estas no miden la calidad de la medicina; miden la eficiencia del sistema industrial. Si implementamos IA para optimizar estas métricas, lo que haremos es profundizar el problema inicial.

Las dos clases de IA deben medirse con métricas distintas. La IA clínica debe medirse, en última instancia, por outcomes clínicos: morbilidad evitada, calidad de vida ganada, errores prevenidos. Por eso los ensayos rigurosos que hoy escasean son indispensables antes de cualquier despliegue serio.

La IA ambiental, en cambio, puede medirse hoy con métricas más directas y más honestas: minutos administrativos por consulta, score de burnout del clínico, tiempo de mirada al paciente versus tiempo de mirada a la pantalla, calidad del registro clínico contra estándares de auditoría, y —esta es la métrica más importante y la que más se ignora— tiempo cognitivo libre que el médico decide cómo emplear. Idealmente no en ver más pacientes.

Muchos estudios sobre IA en clínica comparan el desempeño de un modelo en casos clínicos escritos contra el desempeño de médicos. Se presentan cien casos a GPT y a cincuenta médicos. El modelo obtiene 89%, el promedio de médicos 82%. Conclusión publicada: la IA es tan buena como los médicos.

Este tipo de estudio comete un error fundamental: confunde responder una pregunta clínica con practicar medicina. Un médico en una consulta real no está respondiendo un examen escrito. Está navegando incertidumbre, comunicando riesgos, negociando preferencias, gestionando recursos limitados y haciendo juicios en contextos de información incompleta.

Una propuesta más ambiciosa es organizar el valor alrededor de lo que podemos llamar medicina basada en calidez: una medicina que priorice la relación humana terapéutica, la consideración holística del paciente, la mejora en calidad de vida percibida.

Las métricas de calidez no son fáciles de cuantificar —¿cómo medir presencia?, ¿confianza?— pero hay métodos: análisis de narrativas de pacientes, medidas de satisfacción ajustadas por riesgo, indicadores de continuidad en la relación médico-paciente, adherencia entre consultas.

Si adoptamos un marco de medicina basada en calidez, la IA generativa juega un rol claro: no es una herramienta para ver más pacientes en menos tiempo, sino una herramienta para liberar tiempo cognitivo del médico, reduciendo carga administrativa, para que pueda dedicarse a lo que solo un humano puede hacer. Estar presente, escuchar, dialogar, tranquilizar.

2. La consulta posible: lo que la IA ambiental ya permite

Desde 2005, existen redes neuronales de transcripción de voz a texto con vocabulario especializado en salud. Con el tiempo, esa capacidad evolucionó hasta lo que hoy se denomina IA ambiental, diferente de lo que se conoce como IA conversacional.

La diferencia no es técnica: es de propósito. El escriba ambiental no conversa; escucha, transcribe y estructura, liberando al médico de la pantalla.

Una exploración anterior de cómo podría verse este asistente desde la perspectiva del clínico aparece en ¿Y si tu consulta tuviera un asistente virtual creado por ti?. Este texto avanza desde esa visión hacia la evidencia publicada y el producto disponible hoy.

Imaginemos la consulta de un paciente con hipertensión recién diagnosticada en cinco años, con la tecnología que ya existe y la regulación que está en camino.

Perspectivas de las interacciones

El paciente	El médico
El paciente llega al consultorio. Mientras está en la sala de espera, su agente personal —idealmente integrado a su historia clínica y a su wearable— ha enviado al consultorio una síntesis de signos vitales recientes, motivo de consulta expresado por el propio paciente y antecedentes relevantes actualizados en la app de salud. La autorización del seguro para la consulta, un ECG si fuera necesario, y los laboratorios básicos ya están preaprobados en segundo plano. Esto no es ciencia ficción: las APIs de aseguradoras en LatAm están avanzando y ya hay plataformas locales que coordinan estos flujos.	El médico, antes de iniciar la jornada, recibe la agenda confirmada y organizada según las necesidades de cada paciente. Al iniciar la consulta abre el brief en su sistema: recibe lo enviado por el agente del paciente, una síntesis ejecutiva de cinco puntos con la tendencia de tensión arterial y frecuencia cardíaca de las últimas tres semanas, y un formato de resultados de laboratorios fácil de leer. No va a necesitar los primeros cinco minutos para descubrir al paciente. Ya lo conoce. El primer minuto de la consulta es contacto visual, no teclas.

El paciente

El médico

El paciente llega al consultorio. Mientras está en la sala de espera, su agente personal —idealmente integrado a su historia clínica y a su wearable— ha enviado al consultorio una síntesis de signos vitales recientes, motivo de consulta expresado por el propio paciente y antecedentes relevantes actualizados en la app de salud. La autorización del seguro para la consulta, un ECG si fuera necesario, y los laboratorios básicos ya están preaprobados en segundo plano. Esto no es ciencia ficción: las APIs de aseguradoras en LatAm están avanzando y ya hay plataformas locales que coordinan estos flujos.

El médico, antes de iniciar la jornada, recibe la agenda confirmada y organizada según las necesidades de cada paciente. Al iniciar la consulta abre el brief en su sistema: recibe lo enviado por el agente del paciente, una síntesis ejecutiva de cinco puntos con la tendencia de tensión arterial y frecuencia cardíaca de las últimas tres semanas, y un formato de resultados de laboratorios fácil de leer. No va a necesitar los primeros cinco minutos para descubrir al paciente. Ya lo conoce. El primer minuto de la consulta es contacto visual, no teclas.

Rompiendo los grilletes

Los pacientes hoy se quejan: “el médico no me escucha, está más preocupado por el computador, ni me miró a la cara”. ¿A qué se debe?

La consulta empieza con el médico mirando la pantalla, lucha contra los clics que paralizan el cursor, transcribe los laboratorios en la plataforma, habla en monosílabos. Esta realidad fue documentada desde los primeros años de aipocrates.blog en ¡De la histeria clínica a la historia clínica inteligente! (2021): el sistema caído, las órdenes que no imprimen, el médico atrasado treinta minutos por fallas de la plataforma.

Cinco años después, el problema no ha desaparecido —ha empeorado. Un examen físico enfocado en la queja del paciente, porque el examen de semiología clásica tardaría más de una hora, como se analizó en La interoperabilidad humano-máquina.

El escriba ambiental basado en IA escucha y genera en tiempo real el borrador del registro clínico, identifica términos diagnósticos, verifica que los campos obligatorios del RIPS estén diligenciados. Cuando el médico dice un diagnóstico, la herramienta sugiere el código CIE-10; el médico confirma. Cuando prescribe, dicta el nombre de denominación común internacional, se muestran las presentaciones disponibles, se verifica interacciones. Todo en segundos. Sin sobrecarga de alarmas. La pantalla no se interpone.

Al terminar la consulta el médico tiene una cola de cierre ordenada por prioridad: revisar y firmar la nota clínica, confirmar la prescripción, aprobar el envío del resumen al paciente. La factura electrónica se genera y se envía sola. El RIPS sale a la aseguradora sin intervención manual. Lo que en 2025 tomaba quince a veinte minutos de trabajo administrativo después de cada consulta toma ahora dos minutos de revisión y firma.

Un ensayo aleatorizado de UCLA publicado en NEJM AI en noviembre de 2025 evaluó dos escribas ambientales —DAX y Nabla— en 238 médicos ambulatorios de catorce especialidades, y encontró mejoras estadísticamente significativas en burnout, carga cognitiva y agotamiento laboral.

UW Health, tras un ensayo aleatorizado entre agosto de 2024 y marzo de 2025, reportó una reducción clínicamente significativa en burnout y una disminución de treinta minutos diarios en tiempo de documentación por proveedor, y desplegó el sistema a aproximadamente ochocientos clínicos en Wisconsin e Illinois.

The Permanente Medical Group reportó que la mayoría de sus diez mil médicos con escribas ambientales ahorran cerca de una hora por día.

Estos números importan por dos razones. Una hora al día es alrededor del doce por ciento de una jornada clínica. Si esa hora se devuelve a la consulta del paciente —y no se usa para meter dos pacientes más—, es la diferencia entre veinte y treinta minutos por consulta. Es la diferencia estructural entre la medicina ambulatoria que la sección anterior critica y una versión de ella que empieza a parecerse a lo que la profesión recuerda como aceptable.

La segunda razón es regulatoria: un escriba ambiental que produce un borrador para revisión humana no toma decisiones clínicas. Documenta lo que el médico hizo. El médico firma. El régimen de responsabilidad es claro y compatible con cualquier marco vigente en la región.

En el momento actual, hay diferentes necesidades en la consulta, en el encuentro médico-paciente. La opción de liberar tiempo mejora la calidad de los encuentros; la opción de disminuir el error médico y optimizar recursos es un espacio que se está comenzando a desarrollar.

En NEJM se menciona el uso de los “cerebros periféricos” como método de asistencia cognitiva. Ahora tenemos una opción que implica razonamiento crítico para diferenciar sesgos, alucinaciones y fuentes creíbles. Pero para que ese razonamiento sea posible, el médico necesita primero tener espacio para pensar. Ese espacio lo crea la IA ambiental.

Cinco provocaciones operativas

Este texto no rechaza la IA generativa en medicina. Tampoco la celebra sin condiciones. Busca iluminar las condiciones bajo las cuales puede o no ser útil, y proponer una distinción que el debate público sigue ignorando.

Las siguientes provocaciones están dirigidas a clínicos, gestores y formuladores de política.

Separar IA clínica de IA ambiental. Son dos tecnologías con perfiles de riesgo, evidencia y regulación distintos —como establecen tanto Bitterman et al. (Lancet, 2020) como la FDA Guidance (2026). Discutirlas como si fueran una sola es lo que produce, a la vez, el sobreentusiasmo y la parálisis que hoy caracterizan el debate. La política institucional, la decisión de compra y la conversación pública deben empezar por esta distinción.
Dejar de buscar el Sócrates artificial. El ideal del pensamiento crítico mediado por IA en escenarios de presión temporal extrema es estructuralmente inviable en la consulta externa. La forma honesta de usar IA en ese contexto es la que reduce carga administrativa para liberar tiempo cognitivo, no la que pretende mejorar el razonamiento clínico en veinte minutos. El método socrático con IA tiene su lugar: en la educación, en la formación continuada, en el semillero. No en el consultorio.
Tratar los sesgos del norte global como riesgo clínico documentado. En contextos de LatAm, con epidemiologías, economías y sistemas de salud distintos a los del norte global, la implementación de modelos generales sin adaptación local es inaceptable. La exigencia debe ser RAG con datos localizados, validación clínica en contexto y transparencia sobre la fuente de cada recomendación.
Trazar la línea de los agentes autónomos en la firma. Cualquier acción con consecuencia clínica directa sobre el paciente debe pasar por el juicio de un médico responsable. Cualquier acción puramente administrativa puede correr automatizada. La regla es simple, defendible y aplicable hoy.
Cambiar las métricas. Pasar de métricas de volumen a métricas de calidez no significa abandonar el rigor científico. Significa expandir el alcance de lo que medimos. Solo en este marco la IA generativa puede ser una herramienta ética: liberando tiempo para lo que importa, que es la humanidad irrevocable de la medicina.

Epílogo

¿Quién habría pensado hace treinta años que la mecanografía sería una habilidad valorada en la medicina, que la necesidad de síntesis y redacción reñiría con el pensamiento fisiopatológico?

Ahora la pregunta que abre el debate público sobre IA en medicina ambulatoria es si debemos liberar la carga administrativa o la carga cognitiva.

La respuesta honesta al segundo objetivo es no. No bajo las condiciones estructurales actuales. Pero no porque la IA no sea capaz: porque el sistema no lo permite.

La pregunta correcta es cómo devolverle al médico el tiempo para que la consulta misma vuelva a ser socrática, sin necesidad de prompt. Cómo asegurar que la inteligencia artificial sirva para que el médico mire al paciente y no a la pantalla, para que escuche en vez de teclear, para que decida en vez de tramitar.

La buena noticia es que esa segunda pregunta tiene respuestas concretas, evidencia publicada y producto disponible hoy. La primera, en cambio, seguirá esperando. Pero ya no nos detiene. Podemos empezar a reparar el sistema mientras pensamos cómo reparar la medicina.

Referencias y recursos

Referencia académica central

Bitterman DS, Aerts HJWL, Mak RH. Approaching autonomy in medical artificial intelligence. Lancet Digit Health. 2020 Sep;2(9):e447-e449. DOI: 10.1016/S2589-7500(20)30187-4. Acceso abierto (CC BY 4.0).

Regulación

FDA. Clinical Decision Support Software — Guidance for Industry and FDA Staff. Enero 29, 2026.

Columnas relacionadas en aipocrates.blog

El arte socrático de cuestionar a la IA, explotando la exponencialidad (2026)
Por qué meterle IA a un hospital desordenado es un tiro en el pie (2026)
¿Por qué construir IA en hospitales puede ser una trampa estratégica? (2025)
IA en salud: ¿potenciadora o supresora del pensamiento crítico? (2025)
El futuro científico de las IPS en Colombia en la era de la IA (2025)
La interoperabilidad humano-máquina (2025)
¿Y si tu consulta tuviera un asistente virtual creado por ti? (2025)
¡Oye, no hagas eso! ¿Estás seguro que sabes usar GPT? (2025)
¡De la histeria clínica a la historia clínica inteligente! (2021)
La semiología en los tiempos de la IA: de Surós a Surox (2022)