AutoML para Profesionales de la Salud:Aprendizaje Automático al alcance de sus manos

Jorge Ríos Duarte MD. Investigador Postdoctoral Mayo Clinic, Rochester MN.
Ricardo A. Peña MD, PhD
. Profesor Asociado, Facultad de Medicina, Universidad de los Andes. Miembro fundador de Aipocrates. Twitter: @DrRicardoPena

El aprendizaje automático o aprendizaje de máquina (Machine Learning – ML) en inglés) consiste en entrenar a una máquina para aprender tareas o funciones nuevas a través de datos, mejorando su desempeño mediante el entrenamiento con la mejor y más completa información disponible.1-4 En otras palabras, el ML permite a las máquinas aprender de la experiencia, como lo hacen los humanos, pero a través del análisis de grandes cantidades de datos.

A pesar de la explosión de noticias acerca de los modelos de inteligencia artificial generativa, realmente los modelos de aprendizaje automático son las herramientas de IA que más han impactado los procesos de salud en las últimas décadas. El aprendizaje automático tiene múltiples aplicaciones3,4:

  • Diagnóstico y pronóstico de enfermedades: El aprendizaje automático se puede usar para diagnosticar enfermedades de manera más precisa y temprana, y para predecir la probabilidad de que un paciente desarrolle una enfermedad en el futuro.
  • Tratamiento personalizado: El aprendizaje automático se puede usar para desarrollar planes de tratamiento personalizados para cada paciente, teniendo en cuenta sus características individuales y su historial médico.
  • Automatización de tareas: El aprendizaje automático se ha empleado para automatizar tareas repetitivas en el cuidado de la salud, como la gestión de registros médicos y la programación de citas.
  • Investigación médica: El aprendizaje automático ha sido utilizado en ciencia de datos para analizar grandes conjuntos de datos médicos o de investigación con el fin de hallar mejores relaciones entre variables complejas o en conjuntos de datos difíciles de analizar con técnicas tradicionales.

Si bien estos modelos tienen el potencial de resolver problemas avanzados en diversas áreas del conocimiento, el proceso de aprendizaje automático implica una serie de pasos que demandan un sólido conocimiento en ciencias computacionales, matemáticas y estadísticas. Esto hace que individuos con experiencia en otros campos encuentren difícil desarrollar y entrenar estos modelos, lo que restringe su aplicabilidad en problemas avanzados.1-4

Estos pasos se dividen en cuatro fases principales:

Preparación de datos: Desde la adquisición y limpieza de los datos recolectados desde diversas fuentes, hasta el uso de técnicas como la aumentación de datos (generación de datos sintéticos a partir de los reales).1 esta fase es muy importante y es una de las que más tiempo puede tomar. Antes de usar la IA es clave contar con la confianza de que los datos son confiables, completos y están organizados de forma adecuada.

Ingeniería de características: Selección de las características más relevantes de los datos iniciales, para extraer aquellas que son más útiles para responder a nuestro problema. Es posible que incluso se creen nuevas características a partir de las ya existentes.1

Entrenamiento del modelo: Incluye la selección y optimización del modelo de aprendizaje automático adecuado para solucionar nuestro problema, abordando la complejidad y número de parámetros a entrenar, así como la optimización de hiperparámetros. En este punto es relevante considerar la usabilidad, interpretabilidad y la forma de evaluar el rendimiento del modelo.1

Evaluación del modelo: En este paso se realiza el cálculo de métricas de desempeño, usando un conjunto de datos no empleados en el entrenamiento, para evaluar la funcionalidad del modelo.1 En este paso se pueden comparar las métricas del modelo creado con el de puntos de comparación (benchmarks) ya existentes, o podemos comparar varios modelos que estemos evaluando para seleccionar el mejor.

Este proceso es iterativo, permitiendo ajustar y repetir los pasos hasta obtener un modelo estable. Aun así, incluso los expertos en aprendizaje automático pueden enfrentar desafíos debido a un alto requerimiento de recursos computacionales y tiempo en el entrenamiento de un solo modelo. Este reto es aún mayor para personas que no tiene conocimientos en programación, y que pueden considerar que el aprendizaje automático es algo ajeno a sus profesiones

¿Qué es AutoML y cuáles son sus ventajas?

El concepto de AutoML (Automatic Machine Learning), o aprendizaje automático automatizado, tiene como objetivo principal superar las limitaciones mencionadas al automatizar el proceso de entrenamiento de modelos de aprendizaje automático (todos los pasos antes mencionados o uno de ellos de manera aislada).1 Esta automatización busca acercar los métodos de aprendizaje automático a expertos en dominios específicos, permitiéndoles concentrarse en sus áreas de especialización y crear soluciones con un esfuerzo reducido, a veces incluso prescindiendo completamente de la escritura de código. Sin embargo, las ventajas van más allá de la simplificación: el aprendizaje automático automatizado también está diseñado para que expertos en inteligencia artificial y aprendizaje automático creen modelos de manera más eficiente, optimizando el uso de recursos computacionales y reduciendo el tiempo necesario para construir intentos completos de entrenamiento de modelos.1

Beneficios del AutoML para Profesionales de la Salud1-4:

  • Democratización del ML: Permite a los profesionales de la salud, incluso sin experiencia en programación, aprovechar el poder del ML para la toma de decisiones clínicas, la investigación y la mejora de la atención al paciente.
  • Ahorro de tiempo y esfuerzo: El AutoML automatiza las tareas complejas y que requieren mucho tiempo del desarrollo de modelos, haciendo más eficiente el proceso de análisis de datos.
  • Optimización del rendimiento del modelo: El AutoML explora un espacio más amplio de algoritmos y configuraciones de hiperparámetros que un humano, lo que podría llevar a encontrar o construir modelos más precisos y fiables.
  • Reproducibilidad y objetividad: El AutoML elimina la subjetividad y el error humano del proceso de desarrollo del modelo, lo que lleva a resultados más reproducibles y confiables.

Limitaciones para el uso del aprendizaje automático automatizado

A pesar del potencial evidente, especialmente en campos como la medicina, la implementación de sistemas de aprendizaje automático automatizado en la literatura científica es limitada. Esto se atribuye a desafíos únicos en campos como la salud, que incluyen dificultades en el acceso a bases de datos amplias y diversas, así como la complejidad para comprender las predicciones o inferencias estimadas por estos sistemas, lo que genera desconfianza.2

Ejemplos de Plataformas de AutoML:

Múltiples plataformas de AutoML, tanto de código abierto como comerciales, han sido desarrolladas y proveen diferentes servicios a los usuarios. La selección de la plataforma depende de la experiencia y necesidades de las personas que desean usar aprendizaje automático. Idealmente la selección de la plataforma será consultada con una persona experta en ciencia de datos o inteligencia artificial:

Perspectivas futuras

El aprendizaje automático automatizado tiene gran potencial para revolucionar el campo de la medicina, acercando expertos y no expertos del aprendizaje automático al desarrollo de modelos para solucionar problemas complejos. Sin embargo, existen barreras para su uso en la medicina que resaltan una necesidad de enfocar esfuerzos de investigación en temas como el acceso a bases de datos y la explicabilidad de modelos de aprendizaje automático.

Con el progreso de las plataformas de ML podríamos optimizar la accesibilidad, usabilidad, interpretabilidad e integración de los modelos de AutoML, para mejorar nuestro rendimiento en diferentes tareas relacionadas con el análisis de datos. Además, será interesante ver el avance de la relación entre los modelos de lenguaje de gran escala (LLMs) y las plataformas de autoML. Dado que algunas tareas de análisis de datos pueden ser asistidas por modelos como ChatGPt, Gemini y Claude se podría pensar que la necesidad de plataformas de AutoML será cada vez menor. Sin embargo, los LLMs podrían ayudar a optimizar la explicabilidad y usabilidad de las plataformas de AutoML existentes o las que serán creadas.

Invitamos a la comunidad de AIpocrates a comentar cómo podrían aplicar AutoML en sus trabajos y vida diaria.

Bibliografía

  1. He X, Zhao K, Chu X. AutoML: A survey of the state-of-the-art. Knowl-Based Syst. 2021;212:106622. doi:10.1016/j.knosys.2020.106622
  2. Waring J, Lindvall C, Umeton R. Automated machine learning: Review of the state-of-the-art and opportunities for healthcare. Artif Intell Med. 2020 Apr;104:101822.
  3. Rashidi HH, Tran N, Albahra S, Dang LT. Machine learning in health care and laboratory medicine: General overview of supervised learning and Auto-ML. Int J Lab Hematol. 2021 Jul;43 Suppl 1:15-22.
  4. Lee CC, Park JY, Hsu WT. Bridging expertise with machine learning and automated machine learning in clinical medicine. Ann Acad Med Singap. 2024 Mar 27;53(3):129-131.

Deja un comentario