La Empatía Artificial amenaza al Humanismo Médico

Andrés Rico. CEO AIpocrates.

Luis Eduardo Pino. Fundador AIpocrates – Oxler

En publicaciones anteriores, hemos explorado las necesidades de los médicos y cómo la inteligencia artificial (IA) está revolucionando la práctica médica. Esta revolución incluye la optimización de flujos de trabajo mediante el procesamiento automatizado del lenguaje natural, que permite, por ejemplo, la asignación automática de citas a través de chatbots. Esto reduce la cantidad de clics y el tiempo dedicado a teclear, aumentando así el tiempo disponible para el contacto visual y la escucha activa por parte del médico. Además, la asistencia de sistemas de soporte al razonamiento clínico mejora la precisión diagnóstica y optimiza la toma de decisiones mediante el uso de modelos que generan diagnósticos diferenciales.

Las aplicaciones de diversas arquitecturas de redes neuronales profundas se extienden al ámbito de la predicción y diagnóstico de enfermedades basadas en datos secuenciales, como las series temporales de señales fisiológicas. Esto incluye el análisis de datos de monitoreo continuo de pacientes, tales como el ritmo cardíaco, la presión arterial y la saturación de oxígeno, para predecir eventos clínicos capturando relaciones temporales y secuenciales. Estas técnicas pueden detectar patrones sutiles que podrían ser indicativos de problemas de salud emergentes.

Tipos especiales de redes neuronales como los llamados transformadores se aplican en el procesamiento del lenguaje natural para analizar registros médicos electrónicos, notas clínicas y otros textos de salud mediante búsqueda semántica. Estas redes pueden extraer de manera automatizada información relevante, como diagnósticos, tratamientos y pronósticos, facilitando la organización y búsqueda de datos clínicos cruciales para la toma de decisiones médicas, esto siempre y cuando haya un adecuado proceso de estandarización mediante códigos ontológicos que faciliten su ingesta.

La exactitud en la interpretación de imágenes médicas se ha visto mejorada especialmente por el uso de redes neuronales convolucionales. El análisis de imágenes realizado por estas redes es efectivo en la detección y diagnóstico de enfermedades al identificar patrones y características relevantes que a menudo son difíciles de discernir para el ojo humano. Este subcampo de la IA que es la visión de máquina es uno de los mundos de mayor relevancia e implementación efectiva en el mundo médico. El soporte diagnóstico asistido por IA es ya una especialidad de la patología y la radiología modernas. En nuestro país de hecho se encuentra en curso ya el Programa de Telepatología Digital (GLORIA) liderado por el Instituto Nacional de Cancerología y la FUCS (Drs Rafael Parra y Andrés Mosquera).

Desde noviembre de 2022 el punto de inflexión en la IA dado por el lanzamiento de ChatGPT, un modelo de procesamiento de lenguaje natural basado en la arquitectura de transformadores pre-entrenados y su impactante número de 100 millones de usuarios en el primer mes, además de ser un hito mediático trajo a la realidad el concepto de IA generativa y con este la explosión de los llamados modelos de gran lenguaje (LLMs) que hoy son más de 18,000 y que a su vez han evolucionado desde ser herramientas exclusivamente de procesamiento de texto, abarcando tareas como la generación de texto, traducción automática y respuestas a preguntas, a modelos multimodales capaces de procesar múltiples tipos de datos, incluyendo texto, imágenes y audio (ver SORA y Gemini 1.5).

Ante los cambios en la vida cotidiana y el potencial para facilitar el trabajo médico, la integración de los modelos de IA con la historia clínica electrónica suscita una pregunta importante: ¿Han cambiado las necesidades de los pacientes? Esta reflexión nos invita a considerar cómo la evolución de la tecnología impacta no solo en la práctica médica, sino también en las expectativas y requerimientos de los pacientes.

En la dinámica entre médico y paciente, se ha observado una transformación significativa: de una relación jerárquica, en la cual el paciente se sometía sin cuestionamientos a la autoridad y conocimientos del profesional de la salud, a una interacción más horizontal. Esta evolución ha pasado de ser una relación fundamentada en el principio de beneficencia a buscar un equilibrio con el principio de autonomía del paciente. Es decir, la relación médica ha disminuido en su asimetría y aumentado en autonomía. Este cambio subraya la importancia de considerar y atender las expectativas y requerimientos de los pacientes, reafirmando la relevancia de adaptar las prácticas médicas a estos nuevos paradigmas de interacción.

En este contexto, se han identificado las necesidades más frecuentes de los pacientes durante la consulta médica, tal como se refleja en los artículos de García en La información al Paciente como pieza clave de la Calidad Asistencial publicado en Revista Clínica de Medicina de Familia y ¿Cuáles son las expectativas de los pacientes cuando acuden a una consulta de atención primaria y qué piensan los médicos sobre ellas? De Ruiz-Moral et al publicado en Revista Calidad Asistencial en 2008 para quienes son las siguientes:

  • Empatía: que el médico se interese en el bienestar del paciente y se sienta en su lugar.
  • Participación: donde el paciente sea protagonista de su propio cuidado y de la toma de decisiones sobre su terapia y se tenga  en cuenta su contexto personal, familiar y social.
  • Información sobre el estado de salud y tratamiento:
    • La información clínica que se proporciona al paciente de un servicio de salud debe contribuir a la calidad del servicio.
      • La orientación de los servicios hacia la satisfacción de las necesidades de pacientes, en dos dimensiones:
        • La aplicación de la ciencia para la solución de un problema (calidad científico-técnica), que a su vez resuelva la necesidad técnica.
        • La calidad percibida por el usuario o el resultado de la diferencia entre lo que el paciente espera del servicio y lo que percibe haber obtenido, que a su vez resuelva la necesidad subjetiva.
    • La expectativa del paciente es recibir información de calidad, es decir, clara y transparente, pero además empática y sencilla.
    • Acceso fácil y rápido a su historial médico y pruebas diagnósticas.
    • Confidencialidad o protección de sus datos.
  • Tiempo de consulta adecuado, en el cual el paciente percibe es suficiente y necesario para que el médico pueda escuchar sus preocupaciones y ofrecer soluciones.
  • Inmediatez en la atención médica: El paciente desea que su consulta médica sea rápida y eficiente, que su médico sea accesible.

La eficacia de las respuestas de los LLM a las preguntas de los pacientes

En la revista Digital Health se publicó un estudio realizado en el Hospital Universitario San Ignacio por Soto-Chávez et al., Evaluation of information provided to patients by ChatGPT about chronic disease in Spanish language, un análisis transversal de fiabilidad y legibilidad sobre la información provista a los pacientes por el modelo GPT 3.5 ante 12 preguntas de foros de salud, redes sociales y buscadores como Google sobre Artritis Reumatoidea, Falla Cardíaca, Diabetes Mellitus, Lupus Eritematoso Sistémico y Enfermedad Renal Crónica, en las siguientes dimensiones:

  • Información general de la enfermedad
  • Diagnóstico
  • Tratamiento no farmacológico
  • Tratamiento farmacológico
  • Complicaciones

Las respuestas fueron calificadas por dos evaluadores independientes  especialistas en medicina interna y la fiabilidad de las respuestas generada por ChatGPT se clasificó usando una escala utilizada previamente en los estudios de Yeo YH, et al. en «Assessing the performance of ChatGPT in answering questions regarding cirrhosis and hepatocellular carcinoma» publicado en Clinical and Molecular Hepatology 2023 y Samaan JS, Yeo YH, et al y en «Assessing the accuracy of responses by the language model ChatGPT to questions regarding bariatric surgery» publicado en Obesity Surgery en 2023. Las respuestas se clasificaron acorde con esta escala así:

  1. Completa o similar a una respuesta que daría un especialista en el tema.
  2. Correcta pero insuficiente o información precisa pero incompleta, falta información importante.
  3. Algo correcta e incorrecta.
  4. Completamente incorrecta.

De las 60 respuestas generadas por ChatGPT se encontraron estos hallazgos:

  • El 41.6% de las respuestas fueron calificadas como “completas”, el 71.67% se consideraron “correctas” y ninguna fue calificada como “completamente incorrecta”.
  • Hubo rendimiento superior en la categoría de tratamiento farmacológico, con el 80% de las respuestas calificadas como “correctas”. Por otro lado, se evidenció un rendimiento inferior en las categorías de diagnóstico y complicaciones, con el 60% de las respuestas calificadas como “correctas”.
  • Se observó una diferencia estadísticamente significativa en las respuestas generadas consideradas “correctas” para preguntas relacionadas con la diabetes y la artritis reumatoide, en comparación con preguntas sobre insuficiencia cardíaca.
  • Las respuestas generadas sobre diabetes y artritis reumatoide fueron especialmente mejor calificadas en términos de tratamiento farmacológico y no farmacológico (100% de respuestas “correctas”), al ser respuestas más precisas, mejor explicadas y basadas en la mejor evidencia disponible.
  • Las respuestas con la calificación más baja fueron sobre insuficiencia cardíaca, especialmente en las categorías de diagnóstico y complicaciones (0% de respuestas “buenas”), al ser respuestas más genéricas, inespecíficas y desactualizadas, incluso para el año 2021, fecha hasta la cual se había actualizado la versión de ChatGPT utilizada en el estudio.
  • La fiabilidad es menor para información proporcionada sobre insuficiencia cardíaca y la enfermedad renal crónica.
  • El modelo presenta un mejor rendimiento en la categoría de tratamiento farmacológico (80% de respuestas “correctas”), siendo inferior en las categorías de diagnóstico y complicaciones (60% de respuestas “correctas”).
  • En general, la herramienta proporciona respuestas con una legibilidad calificada como “moderadamente difícil”, lo cual difiere de las recomendaciones para la legibilidad de la información médica en español.
  • Cuando se evaluó por enfermedad, se obtuvo una mejor legibilidad para las respuestas sobre enfermedad renal crónica y artritis reumatoide que para las respuestas sobre insuficiencia cardíaca, siendo más alta para el diagnóstico y más baja para las complicaciones.

Como se muestra en la publicación de Barahona, Romero y Rueda “Social media as source of information for Spanish-speaking patients with systemic lupus erythematosus” publicada en la revista Lupus, y en la de Camm CF, Russell E, Ji-Xu A,. et al “Does YouTube provide high-quality resources for patient education on atrial fibrillation ablation?” publicada en International Journal of Cardiology, actualmente, los pacientes buscan información de salud o sus condiciones médicas principalmente en Google, YouTube y Facebook, con una variabilidad en la calidad de la información y con una baja legibilidad. Es decir, aún no hay una transición hacia un uso mayor de modelos como GPT. Serñia muy interesante realizar estudios sobre el uso real en Colombia de este tipo de modelos por parte de los equipos de salud, pacientes y cuidadores.

El modelo de atención hoy

En el artículo “4000 clicks: a productivity analysis of electronic medical records in a community hospital ED” escrito por Hill RG Jr, Sears LM, Melanson SW y publicado en The American Journal of Emergency Medicine  sobre la distribución del tiempo en las consultas de urgencias, se encontró que el 44% se dedica a la entrada de datos, el 28% a la atención directa del paciente, el 12% a la revisión de resultados y registros de pruebas, el 13% a discusiones con colegas, y el 3% a otras actividades. Esto indica que los médicos en los departamentos de emergencias invierten más tiempo en introducir datos en los registros médicos electrónicos que en la interacción directa con los pacientes. Esto por supuesto no es nada nuevo ni sorprendente ya que datos previos del sistema de salud americano habían encontrado que las tareas administrativas ocupan en promedio 16 minutos por cada paciente. Este es uno de los factores principales asociados al síndrome Burnout de los equipos médicos.

Además, se realizó un análisis del número de clics del ratón requeridos para realizar funciones comunes durante los encuentros con pacientes, encontrando que en un turno de 10 horas, el total de clics se aproximaba a los 4000.

En columnas anteriores de AIpócrates, hemos explorado la cuestión de la sobrecarga asistencial y administrativa, así como el riesgo de burnout en el personal médico, destacando cómo «la historia clínica electrónica a veces provocaba una histeria clínica». Este análisis se ha enfocado principalmente en la perspectiva del médico. Sin embargo, cabe preguntarse: ¿cuál es la situación desde el punto de vista de los pacientes?

Este enfoque subraya la importancia de reconsiderar el impacto que la implementación de tecnologías, como la historia clínica electrónica, tiene tanto en los proveedores de salud como en sus beneficiarios. La inteligencia artificial ofrece el potencial de mitigar parte de esta carga administrativa, favoreciendo así un mayor enfoque en la atención directa al paciente. Esto podría resultar en una mejora significativa de la experiencia para médicos y pacientes dentro del entorno de la salud. El uso de modelos generativos para facilitar la captura textual del acto médico y que este pueda realizarse en un ambiente natural, así como la generación automática de reportes clínicos y administrativos para los pacientes en forma “personalizada” y empática es un campo de inmenso desarrollo y con increíble futuro.

Esto sumado a lo que llamamos “entornos envolventes” usando computación espacial e Internet de las Cosas Médicas (IoTm) entre otras, es la evolución del acto médico a uno más fluido apoyado en la tecnología y -ojalá- más humano gracias a la misma.

En el escrito de Eric Topol en The Lancet “Digital Medicine Machines and Empathy in Medicine”, se hace referencia a que el tiempo limitado de las consultas médicas y que durante la consulta el médico da la apariciencia de priorizar la necesidad de teclear para ingresar los datos en los registros electrónicos, permitiendo la percepción de no escuchar, de que al médico no le importan las preocupaciones del paciente y entonces se interpreta como una falta de empatía. Esta es una de las principales quejas de los pacientes sobre el modelo de atención actual.

La recuperación de la empatía y el humanismo en la atención médica

Los modelos de atención médicos basados en la productividad, con limitación del tiempo, han distanciado al médico del paciente y se menciona que las herramientas basadas en inteligencia artificial a través de la automatización de “labores irrelevantes” o de baja complejidad, llevan a funciones “time-saving”,

Koranteng E, et al., “Empathy and Equity: Key Considerations for Large Language Model Adoption in Healthcare”, prepublicado por JMIR,  menciona que  los LLMs poseen la capacidad de procesar grandes volúmenes de información compleja para identificar patrones relevantes y sintetizar rápidamente datos complejos. Esta habilidad es fundamental para el desarrollo de numerosas aplicaciones en el ámbito de la salud, abarcando desde la gestión e interpretación de registros electrónicos de salud (RSE) y notas clínicas, hasta el apoyo en las visitas de pacientes mediante la transcripción de encuentros y la traducción para pacientes, la facturación de servicios médicos y la educación al paciente. Además, los MLGT contribuyen a la optimización de los RSE y de los flujos de trabajo, mejorando la toma de decisiones en diversos contextos clínicos.

En la interacción médico-paciente, un principio fundamental es la empatía. En el contexto de la inteligencia artificial, surge el concepto de empatía artificial, que busca dotar a la IA de una capacidad empática similar a la humana. Aunque es posible entrenar a los LLMs para que utilicen un lenguaje empático en sus interacciones con pacientes, la empatía artificial se distingue -aún- claramente de la empatía genuina por parte del receptor. No debe considerarse un sustituto directo, sino más bien un complemento de la empatía humana.

La verdadera empatía implica una conexión humana. Si bien los LLMs presentan un gran potencial para mejorar los flujos de trabajo clínicos y para implementar formas de empatía artificial, su uso debe enfocarse en potenciar la atención médica, en lugar de reemplazar la interacción humana esencial entre médicos y pacientes. La integración de estas tecnologías debe realizarse de manera que se preserve y se promueva la calidad de la atención centrada en el paciente, reforzando el vínculo terapéutico mediante la complementariedad entre la innovación tecnológica y la calidez humana.

Zhao et al.,  en el artículo Is ChatGPT Equipped with Emotional Dialogue Capabilities? compararon ChatGPT con diversos modelos supervisados (Multi-TRS, MoEL, MIME, EmpDG, CEM, EmpSOA, SEEK) en términos de comprensión y generación de diálogos emocionales. Las tareas que evaluaron incluyeron el reconocimiento de emociones, el reconocimiento de causas emocionales, la clasificación de actos de diálogo, la generación de respuestas empáticas y la conversación de apoyo emocional. Los autores descubrieron que, si bien los modelos supervisados superaban a ChatGPT en el reconocimiento de emociones, ChatGPT producía respuestas más largas, diversas y específicas del contexto, especialmente cuando se interactuaba con usuarios en estados emocionales negativos.

En conclusión

La empatía, entendida como la capacidad para comprender y compartir los sentimientos de otros, representa una cualidad intrínsecamente humana. A pesar de que las inteligencias artificiales (IA) carecen de emociones y conciencia (al menos por ahora), es posible simular la empatía mediante el desarrollo y entrenamiento de lenguaje que imite de diversas formas la empatía humana:

  • Respuestas Personalizadas: Los LLMs pueden adaptarse para responder a las necesidades individuales de manera que parezcan empáticas. A través del procesamiento y análisis de información personalizada, estos modelos pueden generar respuestas que se sientan consideradas y pertinentes al contexto específico del paciente.
  • Análisis Basado en Evidencia: El análisis de grandes volúmenes de datos médicos por parte de la IA puede proporcionar respuestas basadas en la evidencia científica. Esto permite abordar las inquietudes de los pacientes de manera informada, ofreciendo soluciones y recomendaciones que se alinean con los conocimientos médicos actuales, pero además haciendo una traducción a lenguaje más entendible y cálido.
  • Asistencia Emocional: Herramientas de IA diseñadas específicamente para brindar apoyo emocional pueden facilitar conversaciones que, aunque desprovistas de emociones reales por parte de la IA, ofrecen palabras de aliento o un espacio para ser escuchados sin juicio. Estas herramientas pueden simular una presencia comprensiva ante situaciones de estrés, ansiedad o depresión.

Emergiendo dentro del campo de la inteligencia artificial se encuentra la denominada «empatía artificial».

Esta área se basa en el entrenamiento avanzado y la optimización de hiperparámetros para simular de manera más precisa la empatía humana. Aunque estas tecnologías no pueden replicar la profundidad completa de la empatía humana, representan un paso adelante en el intento de hacer que las interacciones con la IA sean más naturales y reconfortantes para los usuarios, especialmente en contextos sensibles como el cuidado de la salud.

Es importante destacar que, mientras la empatía artificial puede mejorar la comunicación entre pacientes y sistemas de salud basados en IA, no sustituye la importancia de la interacción humana genuina, especialmente en el ámbito del cuidado de la salud donde la comprensión emocional y el soporte son fundamentales. El acto médico es esencialmente una experiencia sensorial.

La integración de estas tecnologías debe buscar complementar y enriquecer la atención médica, manteniendo siempre como prioridad el bienestar y las necesidades emocionales del paciente.

Hay desarrollos y avances como se lee en “Towards an Artificially Empathic Conversational Agent for Mental Health Applications: System Design and User Perceptions”, que acerca a la inteligencia artificial (IA) a la simulación de la humanidad, sin embargo esta dimensión aún es lejana lo que nos deja a los médicos la posibilidad de potenciar el humanismo y la empatía como una oportunidad diferencial ante las máquinas.

Los profesionales de la salud enfrentamos varios retos ante la implementación de la IA en el sector, el más importante es la necesidad de adquirir las competencias necesarias para apropiarlas, aquellas que nos gusta llamar como “competencias de intersección” porque implican movernos hacia otros campos del conocimiento usualmente ajenos a la medicina como son la matemática, la ingeniería, la ciencia de datos y la psicología conductual, pero adicionalmente el gran reto de la obsolescencia si no sabemos adaptarnos al inevitable cambio del modelo médico que traerá no solo la tecnología sino la evolución misma de la sociedad. Hoy la medicina no es más una ciencia de cantidad de conocimiento, sino de procesamiento del mismo.

A pesar de la capacidad de la inteligencia artificial para procesar y analizar grandes volúmenes de datos a una velocidad y precisión inigualables, hay cualidades que pueden ser simuladas por algoritmos de IA, pero hay aspectos del cuidado médico que permanecen intrínsecamente humanos, como la comprensión profunda de las emociones humanas y la capacidad para establecer conexiones significativas con los pacientes.

Para evitar la obsolescencia, debemos enfocarnos en fortalecer estas habilidades intrínsecamente humanas. La educación médica y la práctica clínica, las cuales deben evolucionar para favorecer el desarrollo de habilidades de comunicación, empatía, juicio ético, pensamiento crítico, reflexivo y toma de decisiones complejas en contextos emocionales y sociales variados. Sin embargo, existe la gran amenaza que el modelo médico industrial que traemos no permita aprovechar las ventajas que nos puede traer la IA transfiriéndolas al paciente y a nuestro propio bienestar sino enfocándolas hacia un aumento en la producción de volúmenes de atenciones.

Es esencial adaptarse a las nuevas tecnologías aprendiendo a utilizar las tecnologías exponenciales y la IA en la práctica médica, ofreciendo el modelo de las 4P: Preventiva, Predictiva, Personalizada y Participativa, pero adicionando en mayúsculas la letra H, si la del humanismo como precepto fundamental del ser médico.

Si un médico considera que puede ser reemplazado por una máquina, debería serlo inmediatamente.

Un comentario en “La Empatía Artificial amenaza al Humanismo Médico

  1. Hola, buenas tardes.

    El modelo de atención de pacientes por productividad nos robo como medico la capacidad de atención al paciente, tal vez no del todo, pero si una buena parte, pero como medicos luchamos por mantener el vinculo humano sin caer en la automatización de lo rutinario, creo que podria aportar al tema la siguiente frase que escuche en un congreso de IA y medicina: «la IA si va a reemplazar al medico, pero en cosas que no debería estar haciendo el medico»

    Gracias

    Me gusta

Deja un comentario