Evaluación para el aprendizaje en la era de la Inteligencia Artificial

Eduardo Pinto, Docente de Medicina de la Universidad Alexander Von Humboldt y miembro de AIpocrates

Introducción
El factor más importante que influye en el aprendizaje es lo que el alumno ya
sabe, y que los profesores deberían comprobarlo y enseñar en consecuencia. A
través de la evaluación se puede descubrir si un estudiante ha alcanzado el
resultado de aprendizaje esperado con una secuencia de contenidos y actividades
de aprendizaje.
La evaluación para el aprendizaje se define como un proceso más amplio, activo y
diverso que implica buscar, analizar e interpretar evidencia para reorientar las
metas y las estrategias de enseñanza
.
La irrupción de la Inteligencia Artificial (IA) en el ámbito educativo, y en particular
en las facultades de Medicina, está obligando a repensar no solo el proceso de
enseñanza, sino también la manera en que evaluamos el aprendizaje. El
paradigma tradicional, centrado en ítems cuidadosamente diseñados y rúbricas
fijas, resulta cada vez más inadecuado para capturar la complejidad de las
competencias que requiere la práctica médica actual. “Ceder el hacer, no el
pensar” invita a una integración de la IA en la evaluación y plantea preguntas
cruciales sobre cómo distinguir el progreso real del estudiante en un entorno
donde la tecnología puede automatizar parte del proceso evaluativo.
En esta entrega, empezamos con 1) una breve introducción que sitúa la irrupción
de la IA en la educación médica, 2) analizamos las limitaciones de las
evaluaciones tradicionales, 3) discutimos los desafíos éticos y prácticos de integrar
la IA en la evaluación, 5) presentamos la AI Assessment Scale (AIAS) como un
enfoque de evaluación auténtica para el aprendizaje, que propicia la integración
transparente de IA en la evaluación; 6) le identificamos algunas limitaciones y 7)
proponemos ejemplos de evaluación resistente a IA como complemento a la
herramienta. Reconocemos que pueden existir o desarrollarse otras más
apropiadas, practicables y efectivas.


La crisis de la evaluación tradicional
Las prácticas evaluativas convencionales, basadas en exámenes escritos,
respuestas breves o en pruebas estandarizadas, ofrecen solo “instantáneas”
puntuales del desempeño del estudiante. Estas metodologías no logran capturar la
dinámica del pensamiento crítico ni el desarrollo de habilidades complejas, ya que
no consideran los contextos individuales y las capacidades creativas que la
medicina demanda. Por otro lado, al mantener evaluaciones descontextualizadas,
se corre el riesgo de perpetuar modelos de enseñanza obsoletos que no
responden a las nuevas realidades tecnológicas ni a las expectativas del mundo
profesional.

Desafíos y paradojas de integrar la IA en la evaluación
La incorporación de herramientas de IA en el aula abre un abanico de
posibilidades: desde la facilitación del acceso al conocimiento hasta la
automatización de evaluaciones de bajo nivel cognitivo. Sin embargo, esta
integración no es un camino sin obstáculos. Entre los desafíos más notorios se
encuentran:

  • Dependencia tecnológica y bajo Ai-fabetismo: Tanto docentes como
    estudiantes deben ponerse al día en competencias digitales para utilizar la
    IA de forma crítica y segura. Es muy importante desarrollar criterio sobre
    cuándo es procedente, o no, un abordaje impulsado por IA. Igualmente lo
    es comprender conceptos, aplicar procedimientos, resolver problemas y
    evaluar desarrollos, tanto con IA como acerca de IA; en los ámbitos de la
    educación, la investigación y la atención en salud.
  • Pérdida del rol evaluador del educador: Si la tecnología asume demasiada
    responsabilidad, se corre el riesgo de que la evaluación se deshumanice y
    se pierda el componente formativo del feedback. No obstante, el docente
    puede asumir nuevas responsabilidades y orientar el desarrollo de un
    estudiante, que inevitablemente estará inmerso en entornos digitalizados
    inteligentes.
  • Riesgos inherentes de la IA: Sesgos, “alucinaciones” y la posibilidad de
    resultados imprecisos generan dudas sobre la objetividad y confiabilidad de
    la evaluación automatizada. Aunque nuevos desarrollos, variaciones de
    enfoque y flujo de trabajo mitiguen estos riesgos, tanto la agencia como la
    responsabilidad seguirán siendo humanas.
    Estos retos hacen imprescindible repensar el rol de la evaluación y promover una
    cultura que combine la transparencia, la autocrítica y la intervención humana para
    garantizar un aprendizaje auténtico y profundo.

El AI Assessment Scale (AIAS): Un marco para el diálogo
Para abordar estas problemáticas, se ha propuesto el uso del AI Assessment
Scale (AIAS)
, un marco escalonado que integra principios constructivistas y la
teoría de la Zona de Desarrollo Próximo de Vygotsky. Este modelo promueve:

  • La evaluación distribuida: Que permite separar las contribuciones
    humanas y las generadas por la IA, evaluando de forma diferenciada
    habilidades únicas del estudiante.
  • El diálogo entre educadores y aprendices: Incentivando una utilización
    transparente, una revisión crítica y colaborativa sobre el uso de
    herramientas digitales en la construcción del conocimiento y el desarrollo de
    destrezas.
  • La flexibilidad en la integración de la IA: Adaptándose a diversos contextos
    y necesidades, y permitiendo desde el uso controlado de la tecnología
    hasta su completa integración en actividades complejas.

Este enfoque no solo busca mitigar las limitaciones de las evaluaciones
tradicionales, sino que también abre la puerta a prácticas más auténticas que
promuevan la transparencia, la autocrítica, la metacognición y la creatividad en el
proceso de aprendizaje.

Figura. Asignaciones evaluativas para el aprendizaje pueden varias en sus grados
de integración de IA, desde actividades que no precisan de IA, pasando por las
que la utilizan parcialmente, hasta las que se benefician de su integración total.

Asignaciones “resistentes a la IA”
Una de las respuestas prácticas a la problemática es el diseño de asignaciones
que sean “resistentes a la IA”. Estas actividades podrían incluir, por ejemplo:

  • Preguntas de dos niveles: La metodología estandarizada más común
    sigue siendo la prueba de opción múltiple, por su aparente facilidad pero
    ante todo por su eficiencia. Sin embargo, la evidencia empírica sugiere que
    dimensiones cognitivas superiores de la taxonomía de Bloom como análisis,
    evaluación y creatividad están sub representadas en este tipo de preguntas,
    dada la alta prevalencia de dificultad técnica para su diseño. El
    conocimiento procedimental puede evaluarse solo parcialmente con ellas y
    el metacognitivo pobremente. Surgen propuestas como las preguntas de
    dos niveles, en las cuales el estudiante primero selecciona una respuesta y
    luego debe justificarla con sus propias palabras, evitando la mera repetición
    automatizada. De esta manera, una pérdida de eficiencia se compensa con
    una profundidad en la evaluación. Procesamiento de lenguaje natural podría
    ser de ayuda para retroalimentar estas preguntas.
  • Evaluaciones auténticas: Basadas en casos clínicos reales abiertos o
    inconclusos que invitan a la recopilación de información, desplegar habilidades en medicina basada en la evidencia, análisis crítico y razonamiento ético. Aquí, la IA puede colaborar en la búsqueda, interpretación y síntesis de información, pero aún no puede sustituir del todo la reinterpretación del contexto problémico del caso y la toma de decisiones.
  • Escritura reflexiva: Una herramienta que estimula la metacognición,
    invitando a los estudiantes a analizar cómo y por qué se trazaron una
    estrategia, cómo utilizaron la IA en su proceso de aprendizaje, y cómo
    evaluaron el proceso y los resultados. Esta reflexión profunda sobre su
    propio desarrollo profesional tiene un mayor alcance que la evaluación
    tradicional, es resistente a IA aunque el proyecto sea desarrollado con IA.

Al combinar estas metodologías, se fomenta no solo el dominio de contenidos,
sino también el pensamiento crítico y la capacidad de adaptación frente a un
entorno que cambia rápidamente.


Hacia una evaluación que potencie el aprendizaje en la era de la IA
La integración de la IA en la evaluación no es un fin en sí mismo, sino un medio
para potenciar un aprendizaje más auténtico, dinámico y centrado en el
estudiante. Es fundamental que los docentes adoptemos enfoques que equilibren
la tecnología con la intervención humana, garantizando que la evaluación siga
siendo una herramienta para el crecimiento y la mejora continua.
El reto es grande, pero también lo es la oportunidad: repensar la evaluación en la
era de la IA nos permite redefinir nuestros objetivos educativos, transformar
nuestras estrategias y, sobre todo, asegurar que el “hacer” y el “pensar” se nutran
mutuamente en la formación del futuro profesional de la medicina.


Declaración de uso de herramientas de Inteligencia artificial:

  • Notebook LM fue utilizado para optimizar la lectura de fuentes de
    información.
  • ChatGPT fue utilizado para optimizar la redacción de este manuscrito.
    Lecturas recomendadas
  1. Ausubel, D. P., Novak, J. D., & Hanesian, H. (1968). Educational
    psychology: A cognitive view. Holt, Rinehart and Winston.
  2. Broadfoot, P., Daugherty, R., Gardner, J., Gipps, C., Harlen, W., James, M.,
    & Stobart, G. (1999). Assessment for Learning: Beyond the Black Box.
    University of Cambridge School of Education.
  3. Assessment Reform Group. Swiecki, Zachari et al. “Assessment in the age
    of artificial intelligence.” Comput. Educ. Artif. Intell. 3 (2022): 100075.
  4. Clusmann, J., Kolbinger, F.R., Muti, H.S. et al. The future landscape of large
    language models in medicine. Commun Med 3, 141 (2023).
  5. Perkins, Mike et al. “The AI Assessment Scale Revisited: A Framework for
    Educational Assessment.” (2024). Preprint. Arxiv.org.
  6. Awadallah Alkouk W, Khlaif ZN. AI-resistant assessments in higher
    education: practical insights from faculty training workshops. Front. Educ.
    2024 Dic 04;9:1499495. doi: 10.3389/feduc.2024.1499495.

Deja un comentario