¿Cómo alcanzar objetivos educativos con ChatGPT? – Parte 1

Un Primer para profesores y estudiantes

Por: Luis Eduardo Pinto.

Médico y docente de medicina de la Universidad Alexander von Humboldt, miembro de AIpocrates.

Introducción

La capacidad de tomar decisiones efectivas bajo circunstancias de incertidumbre es un atributo fundamental que el médico contemporáneo debe poseer. Para alcanzar esta habilidad, es crucial que los estudiantes aprendan a gestionar su propio proceso de aprendizaje en lugar de ser meros receptáculos de conocimientos transmitidos por sus maestros. Si bien los profesores pueden ejercer como modelos a seguir, los estudiantes no pueden acceder a sus procesos mentales ni confiar en que estos sean efectivos. Los objetivos educativos propuestos por la taxonomía de Bloom constituyen una pirámide, con el conocimiento en la base y la evaluación en la cima (1). Es común que muchos docentes desconozcan los resultados de aprendizaje esperados para sus estudiantes y cómo progresar de un nivel al siguiente. Esta será una oportunidad para repasar estos conceptos.

El auge de los grandes modelos de lenguaje (GML o LLMs en inglés), en particular ChatGPT (GPT: Generative Pre-trained Transformer) (3), está marcando una revolución en curso en la investigación, atención y educación médica. A pesar de la abundancia de ideas y posibilidades, rara vez se ha establecido una conexión sólida entre la naturaleza de este modelo de procesamiento de lenguaje natural (PLN), sus capacidades y los objetivos educativos que buscamos para nuestros estudiantes.

Al iniciar la instrucción, resulta esencial que los profesores comuniquen a sus alumnos los objetivos del curso (1), los temas que proporcionarán el contexto para alcanzarlos, la secuencia del plan de estudios, las estrategias didácticas para facilitar el aprendizaje y los métodos de evaluación para monitorizar su progreso. En esta primera entrega, se establece la relación entre los primeros tres objetivos educativos de Bloom (conocimiento, comprensión y aplicación) (1)  y las capacidades de los GML, como ChatGPT. También se analiza cómo los docentes pueden demostrar su dominio de estos objetivos y cómo los estudiantes pueden acercarse a dicho dominio utilizando herramientas impulsadas por GML generativos, como ChatGPT. Al final de cada objetivo, se proponen posibles enfoques para las indicaciones (prompts) al modelo mediante la siguiente estructura genérica (6): 1) Definir un modo de actuación + 2) Definir el contexto (texto, objetivo, proyecto, etc.) + 3) Indicación + 4) Forma de la respuesta (por ejemplo: lista, texto, tabla, etc). Un ejemplo de prompt se presenta de la siguiente manera:

«Eres un experto en metodología de la investigación en salud. Enseñas Medicina Basada en la evidencia a estudiantes de medicina de quinto semestre. Con base en el siguiente texto introductorio del reporte de un ensayo clínico aleatorizado: [insertar texto], identifica el problema de investigación y redacta la pregunta siguiendo el anagrama PICO (Población / Intervención / Comparador / Desenlace). Presenta la pregunta definitiva como un texto continuo en un tono académico.»

Desde AIpocrates, nuestro objetivo es lograr que se exploren y aprovechen al máximo las posibilidades que la inteligencia artificial (IA) nos ofrece en la educación médica. Para poner en práctica nuestros consejos, el lector puede abrir una cuenta en (5) y utilizar la versión gratuita de ChatGPT, actualmente impulsada por GPT3.5 (versión gratuita). Comencemos explorando los primeros tres objetivos educativos de la taxonomía de Bloom (1) (Figura 1).

Figura 1. Pirámide jerárquica de los objetivos educativos de la taxonomía de Bloom y resultados de aprendizaje correspondientes. El conocimiento es el objetivo más simple en el plano cognitivo y la creación el más complejo. Adaptado de (1).

Conocimiento

Si bien es cierto que las respuestas de ChatGPT deben verificarse para evitar asumir como ciertas sus alucinaciones, no es menos cierto que estas últimas pueden surgir como resultado de indicaciones imprecisas que abren la puerta al lado más creativo del modelo del lenguaje. El conocimiento científico avanza rápido y cuesta mantenerse actualizado hasta en las áreas que para uno son relevantes. Dado que ChatGPT se ha entrenado con libros y páginas web hasta 2021 (3), se le puede acusar de «desactualizado» aunque la verdad es que muchos de los libros de texto físicos y digitales, que habitualmente se recomiendan como guía para los estudiantes, pudieron editarse antes y no por ello deberían descartarse.

Los docentes pueden solicitar a sus estudiantes que definan, describan, identifiquen y reconozcan conceptos, imágenes, signos, fenómenos, modelos, teorías o variables. Se espera que retengan los que sean difíciles de consultar en un momento crítico o que sean esenciales como punto de partida para el razonamiento. Amerita recordar un concepto cuando este no se pueda deducir a través de la lógica o cuando no coincida con el «sentido común». De otro modo, el dominio de un concepto se define desde un análisis conceptual o desde una definición aceptada por una comunidad experta relevante.

El análisis conceptual ayuda a los docentes a delimitar el ámbito de aplicación de un concepto y a distinguirlo de conceptos semánticamente cercanos. ChatGPT es un modelo de lenguaje generativo que lo ejemplifica claramente (2). Su entrenamiento basado en libros y páginas web (3) le permiten establecer la distancia entre conceptos (2), en contextos determinados, reduciendo las chances de confusión entre ellos.

Buscando ampliar su conocimiento, un estudiante podría promptear a ChatGPT solicitando que:

«Actúa como un experto en Psiquiatría de enlace quien orienta a un estudiante de medicina de último año acerca de la relación entre el estrés y los hábitos de vida saludables, en el contexto de la medicina del estilo de vida. Para comenzar, genera un glosario de términos o conceptos relevantes que me ayuden a comprender el tópico.»

Tengamos en cuenta que la actual versión gratuita de ChatGPT (impulsada por GPT3.5) restringe el espacio para el prompt y su respuesta (5), y que el modelo es “verboso”. Explorar un tema por subtemas, y con prompts específicos que además limiten la extensión de la respuesta, ayuda a condensar sus respuestas. Así, después de haber solicitado la generación de un temario relevante para el estrés, podemos ir directamente a un subtema crítico con un prompt como:

“Describe el rol del eje hipotálamo – hipófisis – adrenal en la respuesta a situaciones de estrés fisiológico. Haz una breve introducción y seguidamente concéntrate en los efectos de las hormonas que medían esta respuesta.” Y así, posterior y progresivamente: “Con base en la fisiología del estrés, ilustra la relación existente entre alostasis y enfermedad crónica utilizando como ejemplo la diabetes.”

Si desea profundizar, ChatGPT lo acompañará, no más intente:

“¿Cómo el estrés afecta la traducción de señal inducida por insulina en la fibra muscular esquelética?. Expresa tu respuesta en términos de mecanismos moleculares específicos conocidos.”

Se dará cuenta que el modelo se acerca al grado de detalle y profundidad que buscamos en pregrado.

Cuando surja la necesidad de distinguir entre dos conceptos, la presentación de un texto seguido de una tabla comparativa resulta muy útil para que el estudiante retenga las similitudes y diferencias entre los conceptos en conflicto. Por ejemplo:

«Por favor, explícame las diferencias fundamentales entre emoción y sentimiento, y muestra estas distinciones en una tabla comparativa, acompañada de ejemplos ilustrativos para cada uno de ellos».

Comprensión

Gran parte del aprendizaje humano consiste en la adquisición y dominio de diferentes modelos. Un modelo es una representación de un fenómeno. Varios modelos pueden diferir entre sí en su grado de aproximación a la realidad o en su utilidad didáctica. Algunos modelos no son una representación fiel del fenómeno pero son útiles mientras que otros son una representación bastante ajustada pero no aportan a la comprensión del fenómeno. En muchos libros de texto, el autor presenta modelos que ayudan al estudiante a entender o que le sirven de mapa para orientar su razonamiento, aun cuando un experto prefiera modelos más exhaustivos o más predictivos. Sin embargo, los modelos didácticos suelen ser la mejor elección para quienes apenas inician su formación en cualquier ciencia, siempre que se le advierta de su rango de aplicación limitado. Verificar que el estudiante comprende un fenómeno o un concepto requiere usualmente que lo explique apropiadamente con sus propias palabras, como una prueba de que ha internalizado un modelo acerca del mismo.

El docente puede esperar del estudiante niveles progresivos de sofisticación frente al uso de los modelos, comenzar con analogías, seguir con modelos mentales o intentar explicar sus ideas a sus compañeros. Lo anterior implica transformar un texto base en otro. Un docente juicioso haría un muestreo del material científico disponible y seleccionaría el que sea pedagógicamente relevante y preferiblemente optaría por transponer el conocimiento científico experto en la forma de conocimiento escolar. Los profesores deben saber mantener una sana tensión entre vigilancia epistemológica y utilidad del modelo. Es decir, no permitir que se introduzcan conceptos erróneos en ese proceso de simplificación. Desde esta perspectiva, el estudiante que intenta comprender puede transformar un texto en otro hasta encontrar el que facilita su comprensión y su comunicación con los demás.

Al ser un GML generativo que agrega palabras a un texto creciente, muestreando un espacio de ellas y seleccionando probabilísticamente las nuevas palabras; ChatGPT tiene un potencial inmenso para proporcionar textos equivalentes (2) que funcionan como «modelos lingüísticos en competencia». Dicho de otro modo, ChatGPT ofrecer tantos o más modelos que un docente promedio. Además, conforme el texto crece, el modelo reevalúa iterativamente el contenido generado con cada adición, garantizando coherencia de principio a fin (2). 

Se puede, por ejemplo, animar a los estudiantes a generar un guión para explicar un concepto a estudiantes más jóvenes o a un público no experto, en redes sociales. Un prompt general a modelos generativos como ChatGPT resulta en una exhibición de creatividad:

«Eres un experto en comunicación científica en salud. Te interesa el alfabetismo en salud. Usas analogías para explicar ideas difíciles de comprender. En esta oportunidad, el tema es cómo el uso inapropiado de antibiótico conduce el surgimiento de resistencia en las bacterias. Explica el mecanismo para un público amplio y no médico».

El estudiante puede refrescar el prompt para examinar diferentes posibilidades (4). Posteriormente, puede ayudarse con el ChatGPT para generar un guión, pulirlo discutiendo con el modelo, publicar la versión definitiva en sus redes sociales e invitar a sus seguidores a comentar y preguntar. 

ChatGPT puede ayudar en uno de los problemas de comprensión más prevalentes de nuestros estudiantes: transformar texto matemático en términos verbales:

“Eres un pedagógico profesor de fisiología renal. Hoy me enseñarás filtración glomerular (TFG). Quiero que me expliques, en términos simples y comprensibles, cómo interpretar la fórmula para la TFG de una sola nefrona”.

La respuesta lo sorprenderá y, aunque le invitamos a verificarla, puede pedirle a sus estudiantes detectar discrepancias y errores del modelo. Buscarlos será un ejercicio desafiante y motivador que animará la clase.

Aplicación

Aplicar es poner algo en contacto con otra cosa como la mantequilla sobre las galletas. En el ámbito del aprendizaje, aplicar significa llevar un concepto a una situación nueva. Examinar las implicaciones de un concepto dentro de un contexto diferente a su original, clasificar una instancia de acuerdo con una serie de criterios, utilizar un diagrama para hacer predicciones lógicas o efectuar un cálculo usando una fórmula con las variables relevantes, son posibilidades para desarrollar y evaluar si el estudiante es capaz de aplicar.

Un docente podría mostrar a sus estudiantes cómo un concepto adquiere un matiz completamente diferente en el contexto de otra disciplina, aclararía a sus estudiantes si una instancia cumple o no con determinados criterios e hipotetizaría en el terreno de diagramas o fórmulas matemáticas.

Clasificar es, además, una de las tareas del procesamiento de lenguaje natural (PLN). Los algoritmos de aprendizaje se alimentan de criterios preestablecidos y los utilizan como etiquetas a aplicar en nuevas instancias y los no supervisados pueden incluso descubrir nuevos criterios. En esta materia, los GML son expertos. Pueden poner en contacto una palabra con otras palabras semánticamente cercanas y lo hacen mucho mejor en contextos acotados y específicos (2). Además, pueden validar la congruencia del texto generado con el que habita en sus bases de entrenamiento. En caso que el usuario no obtenga una respuesta satisfactoria, puede pedir al modelo que lo haga «paso a paso» (Chain of thought) o mostrarle un ejemplo de cómo hacerlo (one-shot) (6). Usualmente, con esto es suficiente para que el modelo supere el escollo (4).

Un estudiante podría también, por ejemplo, solicitar al modelo de lenguaje simular un caso clínico hipotético y pedirle que aplique conceptos de homeostasis ácido base al caso o, ser más específico, y solicitar que aplique la ecuación de Henderson-Hasselbach (HH) para predecir la compensación fisiológica. Puede pedirle que resuelva el prompt paso a paso aplicando la ecuación H-H. Un primer prompt podría ser:

«Actúa como un experto profesor de nefrología y cuidado crítico. Me enseñas homeostasis ácido básico y sus trastornos. Simula un caso clínico hipotético con síntomas, signos y hallazgos de laboratorio. Aplica conceptos de homeostasis ácido base para clasificar como «acidosis metabólica» el caso simulado.» El estudiante puede verificar con otras fuentes la respuesta, refrescar la salida o mejorar el prompt antes de seguir adelante. Seguidamente, el estudiante podría promptear: «Ahora, aplica paso a paso la Henderson-Hasselbach (HH) con el fin de predecir la respuesta fisiológica a la acidosis metabólica y el efecto de la compensación sobre el pH plasmático del paciente del caso».

El ejemplo combina aplicación e inferencia predictiva con bases fisiológicas y matemáticas, de modo que el estudiante puede pedirle al modelo que aplique razonamiento matemático (H-H) y aparte razonamiento fisiológico. Debería llegar a la misma conclusión. Si no es así, puede revisar sus prompts o discutir con el modelo. En el proceso, ¡aprenderá muchísimo!

Primeras conclusiones

El primer paso para aprovechar al máximo el potencial de modelos de lenguaje como ChatGPT es dominar las técnicas básicas de prompting efectivo (4,6). Muchas de las limitaciones que se atribuyen a estos modelos están relacionadas con las restricciones del lenguaje que utilizamos cotidianamente. Si no comprendemos plenamente los objetivos educativos, su conceptualización y cómo se manifiestan en el proceso de aprendizaje (1), no seremos capaces de diseñar actividades que permitan a los estudiantes alcanzar la maestría en ellos y, de paso, nos hará perder la oportunidad de aprovechar el inmenso potencial de la IA en la educación médica. Modelos como ChatGPT pueden convertirse en los mejores aliados en el aula. ¡Aprovechemos al máximo sus capacidades!

Nota final: El autor también ha aprovechado las capacidades de ChatGPT para estructurar este documento, consultar algunos conceptos y editar algunos de sus pasajes. 

Referencias

  1. Anderson, L. W., & Krathwohl, D. R. (2001). A Taxonomy for Learning, Teaching and Assessing: A Revision of Bloom’s Taxonomy of Educational Objectives: Complete Edition. New York: Longman.
  2. Wolfram Stephen. «What Is ChatGPT Doing … and Why Does It Work?,» Stephen Wolfram Writings (2023).
  3. Yenduri, Gokul, et al. Generative Pre-trained Transformer: A Comprehensive Review on Enabling Technologies, Potential Applications, Emerging Challenges, and Future Directions. arXiv preprint arXiv:2305.10435 (2023).
  4. Zamfirescu-Pereira J. , Wong R. , Hartmann B. , & Yang Q.. Why Johnny can’t prompt: how non-AI experts try (and fail) to design LLM prompts. Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems 2023.
  5. https://chat.openai.com
  6. https://www.promptingguide.ai/es

Un comentario en “¿Cómo alcanzar objetivos educativos con ChatGPT? – Parte 1

Replica a JOSE POSADA-VILLA Cancelar la respuesta