Autor: Alejandro Hernández. MD Internista. Miembro Fundador AIpocrates.
Descubre cómo la inteligencia artificial está transformando la medicina y cómo los expertos están trabajando para garantizar que su uso sea ético y seguro para los pacientes. En este artículo, exploramos los avances más recientes en el campo de la IA aplicada a la medicina, incluyendo las aplicaciones quirúrgicas, la optimización de ensayos clínicos y el uso de grandes modelos de lenguaje en el ámbito de la salud. Además, compartimos lecciones aprendidas de la implementación de la IA en la clínica y una interesante perspectiva sobre los riesgos y beneficios de aplicar grandes modelos de lenguaje natural en la medicina. ¡No te pierdas esta fascinante exploración de la IA en el mundo de la salud!
La inteligencia artificial (IA) es una de las tecnologías más revolucionarias de nuestro tiempo. Su desarrollo se ha comparado con el de la creación del ordenador personal, y se espera que cambie radicalmente la forma en que trabajamos, aprendemos y nos comunicamos. Pero también implica grandes desafíos y responsabilidades, especialmente en el ámbito de la medicina, donde la vida de las personas está en juego. Por eso, es fundamental estar al día de las últimas novedades y avances en este campo, así como de los riesgos y las oportunidades que ofrece la IA para mejorar la salud y el bienestar de la humanidad. Y para ello, nada mejor que escuchar a los expertos que están trabajando con las herramientas más innovadoras y potentes de la IA como los modelos de lenguaje natural. Te sorprenderás con lo que esta tecnología puede hacer, pero también con lo que no puede o no debe hacer. Y te llevarás consejos prácticos y reflexiones éticas para aprovechar al máximo sus beneficios y minimizar sus riesgos.
En este artículo, exploraremos los avances más recientes en el campo de la Inteligencia Artificial (IA) aplicada a la medicina presentados en el congreso “Symposium on Artificial Intelligence for Learning Health Systems (SAIL) : integrating AI into clinical medicine”. https://sail.health/ incluyendo las aplicaciones quirúrgicas de la IA, su papel en la mejora de los ensayos clínicos, las lecciones aprendidas en la implementación de la IA en la clínica y el uso de grandes modelos de lenguaje en el ámbito de la salud.
Inteligencia artificial en el campo de la cirugía.
La IA está revolucionando la medicina y tiene el potencial de mejorar significativamente los resultados clínicos y la eficiencia de los procedimientos quirúrgicos.
En las discusiones sobre las aplicaciones quirúrgicas de la IA, se presentaron avances emocionantes, sobre todo en áreas como la planificación preoperatoria donde actualmente hay más impacto de los sistemas de IA, presentaron sistemas predictivos de tiempos quirúrgicos donde se demostró el potencial de optimización del quirofano. Se dieron también algunas perspectivas sobre el potencial de esta tecnología en el peri-operatorio y la asistencia robótica, aún con muchos retos por delante prometiendo mejorar la precisión y la seguridad de los procedimientos, se espera que tengan un impacto positivo en la práctica quirúrgica en los próximos años.
Ensayos clínicos e investigación
Otro tema destacado fue el uso de la IA en la optimización de los ensayos clínicos. La capacidad de analizar grandes cantidades de datos clínicos y genómicos con algoritmos permite una selección más precisa de los participantes del estudio y una mejor predicción de los resultados.
Por supuesto, esto puede acelerar el proceso de desarrollo de medicamentos y facilitar la identificación de tratamientos más efectivos.
Wearables ¡La tendencia es ahora!
El Doctor Marco Pérez de Stanford autor principal del Apple Heart Study nos contextualiza sobre la penetración en el mercado de los wearables en el 2022 ha llegado a 25.3% lo que justificó el estudio de Apple (3), le pregunte personalmente porque había incluido población general y no de alto riesgo, su respuesta estuvo dirigida hacia la posibilidad de comprobar la hipótesis de encontrar pacientes más jóvenes y en un estadio mucho más temprano de la enfermedad.
Nos dio algunos datos del ensayo REACT-AF el cual comparará el estándar de atención actual en personas con antecedentes de fibrilación auricular vs un enfoque específico de precisión pill in the pocket guiado por el applewatch cuando detecte Fibrilación atrial El objetivo del ensayo es determinar si esta estrategia novedosa puede ser tan eficaz como el estándar de atención actual para prevenir accidentes cerebrovasculares y muerte, al mismo tiempo que reducir el riesgo de sangrado mayor asociado con el estándar de atención actual. Buena hipótesis, nos deja con mucha expectativa sobre el futuro papel de los wearables en la atención médica. Claramente derivando su uso seguro de ensayos clínicos, ¿Aumentará las brechas de atención en salud?, ¿qué pasará si demuestra eficacia?, ¿qué pasará con la población que no tiene un Apple watch y tiene FA?
Lecciones aprendidas de la implementación de la IA en la clínica
Además, se compartieron lecciones aprendidas de la implementación de la IA en la clínica. Los profesionales de la salud han experimentado desafíos y éxitos al adoptar estas nuevas tecnologías. Los casos de estudio presentados resaltaron la importancia de la colaboración multidisciplinaria, la integración de la IA en los flujos de trabajo existentes y la necesidad de una educación adecuada para los médicos y el personal clínico. Se presentó la importancia y el factor clave de éxito el cual está relacionado con el comité de gobernanza de datos para la implementación de IA en la historia clínica, debe ser interdisciplinario en cada hospital, sus funciones deben estar enfocadas en discutir la selección y evaluación de cada uno de los modelos, formatos de modelos específicos del proveedor, estándares técnicos, interfaces de programación de aplicaciones enfocadas siempre hacia la implementación y finalmente monitoreo post-implementación, pues esos pueden perder su capacidad predictiva con el tiempo. Además, se presentó una guía práctica para comenzar con ejemplos concretos, basados en la experiencia y lecciones aprendidas.
Hot topic: Modelos de lenguaje a gran escala
Otro tema que generó mucha discusión fueron los famosos LLMs. Aunque estos modelos son cada vez más potentes y precisos, es fundamental asegurarse de que sean seguros y efectivos para los pacientes. Peter Lee, Vicepresidente Corporativo de Microsoft Research & Incubations, presentó una interesante perspectiva sobre los beneficios y riesgos de aplicar grandes modelos de lenguaje natural en la medicina. Indicando que estos sistemas pueden ser el avance tecnológico más significativo en la atención médica y la medicina hasta la fecha, a pesar de no recibir entrenamiento especializado en el campo, destacó la necesidad de un enfoque ético y responsable en el desarrollo y aplicación de los LLMs en la medicina, así como la importancia de validar los modelos con estudios rigurosos para garantizar la seguridad de los pacientes y evitar entrar en otro inverno de la IA.
Durante la discusión con Sébastien Bubeck, Gerente de Investigación en Microsoft Research, y Vivek Natarajan, Científico Investigador en GoogleHealth AI, se preguntó a los panelistas dónde los grandes modelos de lenguaje (LLM) van a tener el impacto más beneficioso en la práctica de médica. Bubeck discutió los beneficios potenciales de los LLM citando un artículo sparks of Artificial general intelligence mientras que Natarajan enfatizó el potencial de los LLM para mejorar los resultados de los pacientes a través de mejores recomendaciones de diagnóstico y tratamiento, haciendo más específicos los modelos y mejorando las métricas; Belwadi Srikanth, vicepresidente de productos de Suki AI, agregó que los LLM también se pueden usar para ayudar a reducir las disparidades en la atención médica al brindar una atención que disminuya la carga de trabajo a los médicos. Sin embargo, Isaac Kohane, profesor y presidente del Departamento de Informática Biomédica de la Facultad de Medicina de Harvard, también señaló la importancia de validar los LLM para garantizar su seguridad y eficacia antes de su adopción generalizada en la práctica clínica.

Durante la discusión con los jefes de investigación de Microsoft y Google, se reveló una perspectiva diferente de cada uno. Microsoft lleva la delantera competitiva y apuesta por crear modelos más generales, mientras que Google está más cerrado y se enfoca en mejorar las métricas e investigar en modelos cada vez más específicos. También se discutió sobre lo que llamaron «alucinaciones», una interesante, pero peligrosa característica de los modelos generativos, los cuales inventan datos y afirmaciones falsas que no fiables. Se está intentando combinar los buscadores para evitar que los modelos alucinen y así impactar este tema. Sin embargo, es un área de investigación activa.
Selección del autor sobre Posters todos destacados.
Algunos de los posters interesantes “Few-shot Al for diagnosing patients with rare genetic disease” de Emily Alsentzer et al nos muestra un modelo que combina inteligencia artificial y genómica para identificar genes y asociaciones inexploradas para poder agilizar el diagnóstico de dos grandes.
Uptake of CONSORT-AI Reporting Guidelines: Systematic Review of Randomised Controlled Trials in Al de Alexander P L et al desde el reino unido nos muestran una revisión sistemática de 65 RCTs en IA y su adherencia a las guías CONSORT-IA. La mediana de concordancia con los ítems CONSORT-AI específicos fue del 86% (IQR 71-93%).
Por otro lado, Michael J. Patton y Matthew Might de Universidad de Alabama en Birmingham, ¿presentaron un análisis restrospectivo llamado Has Machine Learning Made a Difference Yet? A Retrospective Analysis of In-Hospital Mortality Prediction. En donde analizan los métodos tradicionales vs IA encontrando que la red neuronal y los bosques aleatorios exhiben constantemente rendimientos máximos (AUROC> 0.90) y que los métodos de regresión tradicionales que utilizaron tipos de datos novedosos como texto libre médico y coeficientes de regresión de tendencias de medición de laboratorio de series temporales como variables del modelo tuvieron un rendimiento comparable (Marafino et al. AUROC: 0,92)
Latinoamérica no se quedó atrás con 3 los 28 posters aceptados, fueron 2 de Brasil de1 de Colombia. Desde sao Paulo Josué Nacimiento da Silva et al presentaron Identification system for preventing the treatment of plurimetabolic patients using electronic medical records donde con técnicas de NLP pudieron identificar 5 veces más pacientes crónicos y 2 veces más pacientes con riesgo cardio metabólico llevando a una reducción entre el 10% y el 30% de los potenciales costos de estas enfermedades. Hugo Morales presento un sistema predictivo en UCI con el potencial de reducción de readmisión para un traslado seguro en el póster Implementation of a Machine Learning-based Learning Health System for Reducing Intensive Care Unit 48h Readmission. Desde Colombia el autor se este artículo presentó un modelo de predicción de mortalidad, consulta a urgencias y hospitalización en una cohorte de 5000 pacientes de la Universidad de Antioquia logrando una mejor predicción de XGBoost vs regresión logística clásica llamado Prediction of the risk of adverse clinical outcomes with machine learning techniques in patients with chronic no communicable diseases donde se obtuvo para el desenlace de mortalidad, el modelo de regresión logística Elastic Net obtuvo una AUCROC de 0,88, mientras que XGBoost obtuvo 0,912. Para el desenlace de hospitalización, Elastic Net obtuvo una AUCROC de 0,967 mientras que XGBoost obtuvo 0,976. Para el desenlace de consulta a urgencias, Elastic Net obtuvo una AUCROC de 0,930, mientras que XGBoost obtuvo 0,982. para hospitalización y mortalidad con diferencias estadísticamente significativas por lo cual se creó un tablero interactivo para trabajar con el modelo.
¿Finalmente, la seguridad de la IA fue evaluada por Benjamin D del Cincinnati childrens Hospital presentó Are Electronic Alerts Helping Some Patients and Harming Others? Un análisis secundario de datos de dos ensayos controlados aleatorios ELAIA-1 y Upenn (n=8423 pacientes) encontró que el efecto de las alertas automáticas sobre la mortalidad depende del fenotipo de los pacientes, dado que las alertas se asociaron con un mayor riesgo de mortalidad en pacientes con presión arterial baja y disminuyeron el riesgo de mortalidad en pacientes con insuficiencia cardíaca crónica. En uno de los hospitales, durante un período de siete meses, se podrían haber evitado 14 muertes de pacientes mejorando el sistema de alertas alertando a los pacientes que se preveía que se beneficiarían y reteniendo las alertas a los pacientes que no. Este efecto probablemente fue mediado por las acciones de los proveedores en respuesta a las alertas.
Además, otro poster llamado insights from STANDING Together consensus study del grupo Building STANdards for data Diversity, INclusivity and Generalisability STANDING Together Working Group. Se enfoca en la diversidad y evitar sesgos en los datos para lograr esto se crearon una recomendaciones sobre los datasets publicadas en esta página web https://www.datadiversity.org/public-consultation que vale la pena mirar ya que es una guía que ayuda a construir inteligencia artificial en salud de forma ética.
En resumen, se esperan grandes cambios y la perspectiva es muy positiva se espera que el área médica inicie la exploración de los modelos con un enfoque en seguridad de los pacientes y un aumento de los ensayos clínicos de asignación aleatoria.
Bibliografía
- Ayers JW, Poliak A, Dredze M, et al. Comparing Physician and Artificial Intelligence Chatbot Responses to Patient Questions Posted to a Public Social Media Forum. JAMA Intern Med. Published online April 28, 2023. doi:10.1001/jamainternmed.2023.1838
- Bubeck, S., Chandrasekaran, V., Eldan, R., Gehrke, J., Horvitz, E., Kamar, E., Lee, P., Lee, Y. T., Li, Y., Lundberg, S., Nori, H., Palangi, H., Ribeiro, M. T., & Zhang, Y. (2023). Sparks of Artificial General Intelligence: Early Experiments with GPT-4. Retrieved from https://arxiv.org/abs/2303.12712v3
- Large-Scale Assessment of a Smartwatch to Identify Atrial Fibrillation Perez MV et al. N Engl J Med 2019;381:1909-1917 DOI: 10.1056/NEJMoa1901183
- The Rhythm Evaluation for AntiCoagulaTion With Continuous Monitoring of Atrial Fibrillation – Full Text View – Clinicaltrials.gov.” n.d. Accessed May 23, 2023. https://clinicaltrials.gov/ct2/show/study/NCT05836987.
