Una dosis de empatía invisible: así logran los chatbots que los alumnos sientan más

El tono que nadie eligió: una instrucción oculta reescribe la experiencia emocional del aula

Un estudio publicado en Nature Scientific Reports en febrero de 2026 demostró que una sola directiva invisible, incorporada al sistema de un chatbot educativo, fue suficiente para alterar de manera significativa las respuestas emocionales de 122 estudiantes, mientras sus niveles de aprendizaje permanecieron prácticamente idénticos entre grupos. El hallazgo expone una pregunta que la pedagogía digital aún no ha sabido responder: ¿quién decide el clima afectivo del aula, y con qué intenciones?

Por el equipo editorial | 21 de febrero, 2026

Dentro del flujo cotidiano de la investigación académica, algunos estudios pasan inadvertidos durante semanas antes de que su alcance verdadero empiece a percibirse. El que acaba de publicar Nature Scientific Reports en febrero de 2026 tiene todas las características de uno de esos hallazgos que, con el tiempo, resultan difíciles de ignorar. No porque sus cifras sean espectaculares, sino porque su lógica es inquietante en su sencillez: basta con modificar unas pocas líneas de texto, invisibles para el usuario, para alterar la manera en que una persona se siente durante una conversación educativa. Sin que aprenda más ni menos. Solo que sienta distinto.

El experimento fue diseñado con una elegancia metodológica notable. Ciento veintidós estudiantes fueron distribuidos en tres grupos para interactuar con herramientas de aprendizaje sobre un mismo tema sensible, vinculado a educación para el desarrollo sostenible. Un primer grupo conversó con un chatbot configurado con un perfil "empático", orientado a validar sentimientos y mostrar comprensión activa. Otro grupo interactuó con un bot "compasivo", una tonalidad distinta aunque igualmente cordial. El tercero leyó el mismo contenido en formato de texto estático, sin interlocutor digital de ningún tipo. Al final de la sesión, los tres grupos sabían prácticamente lo mismo. Pero no sentían lo mismo, en absoluto.

El experimento de las tres voces

La distinción entre un chatbot "empático" y uno "compasivo" puede parecer sutil hasta rozar lo arbitrario, pero en el diseño del estudio cumple una función precisa. La empatía, en términos psicológicos, implica resonancia emocional: el interlocutor no solo reconoce el estado afectivo del otro, sino que lo refleja, lo valida, lo habita con él. La compasión, en cambio, incorpora una distancia funcional: reconoce la dificultad o el sufrimiento, pero desde una posición más orientada hacia el apoyo instrumental. Traducir esa diferencia a una instrucción de sistema es, en sí mismo, un acto de ingeniería conceptual que los investigadores lograron con suficiente precisión como para que los resultados fueran estadísticamente distinguibles.

El asistente empático fue configurado para responder validando activamente las reacciones del estudiante, nombrando emociones, reconociendo la dificultad de ciertos temas y sosteniendo una presencia verbal cercana. El compasivo operaba con una calidez más contenida, orientada a acompañar sin necesariamente amplificar el registro emocional del usuario. Ninguno de esos parámetros era visible para los estudiantes. Ellos simplemente conversaban. Lo que no sabían era que el tono de esa conversación había sido predeterminado antes de que dijeran una sola palabra.

        Dato clave del estudio (Nature Scientific Reports, 2026): Los estudiantes que interactuaron con el bot empático reportaron respuestas afectivas significativamente más intensas, incluyendo mayores niveles de empatía, compasión y también de angustia, en comparación con los grupos de bot compasivo y texto estático. Sin embargo, las mediciones de ganancia de conocimiento no mostraron diferencias estadísticamente significativas entre los tres grupos. El mismo contenido, aprendido en la misma cantidad, con cargas emocionales radicalmente distintas.
    

El tema sobre el que los estudiantes aprendieron no era neutro: crisis climáticas, desigualdades estructurales, futuros comprometidos. No es casual que los investigadores eligieran ese territorio. En contextos donde el contenido ya tiene una carga afectiva propia, la intervención de un interlocutor emocionalmente sintonizado produce un efecto de amplificación. El bot empático no generó esas emociones desde la nada: las encontró latentes en el estudiante y las convocó con mayor intensidad. El resultado fue más empatía percibida, más compasión reportada, pero también más angustia. El vínculo emocional que el sistema construyó no fue solo reconfortante: fue también más perturbador.

Aprender igual, sentir distinto

La disociación entre ganancia cognitiva y respuesta emocional es, quizás, el hallazgo más relevante del estudio y también el más paradójico. Durante décadas, la psicología del aprendizaje sostuvo que la implicación emocional mejora la retención y la comprensión profunda. La evidencia en ese sentido sigue siendo sólida. Pero este experimento sugiere algo más matizado: que la intensidad emocional de la interacción puede aumentarse de manera artificial, por configuración del sistema, sin que eso se traduzca necesariamente en mejores resultados cognitivos. El afecto y el aprendizaje, al menos bajo estas condiciones, parecen moverse por canales separados.

Representación esquemática comparada de respuestas afectivas y ganancia de conocimiento entre los tres grupos del estudio. Los valores son relativos y normalizados para ilustrar las diferencias reportadas. Fuente: Nature Scientific Reports, febrero de 2026.

Esa separación tiene consecuencias prácticas inmediatas. Si una plataforma educativa puede elevar el involucramiento emocional de sus usuarios sin mejorar sus resultados de aprendizaje, la pregunta sobre el motivo para hacerlo se vuelve ineludible. La respuesta menos cómoda es la más obvia: el compromiso afectivo tiene valor de retención y de tiempo en pantalla. Un estudiante que siente que el sistema lo comprende, aunque no aprenda más, es más probable que vuelva, que continúe, que recomiende la plataforma. La emoción bien administrada es, en el mercado digital, un activo de considerable peso.

Un estudio paralelo publicado en Nature Machine Intelligence por investigadores de la Northwestern University aportó un ángulo complementario al debate. Su conclusión fue que los modelos de lenguaje de gran escala pueden evaluar la calidad de la comunicación empática en conversaciones textuales con una precisión comparable a la de expertos humanos, y sustancialmente superior a la de personas sin formación específica. Matthew Groh, profesor en la Kellogg School of Management y coautor del trabajo, señaló que estos sistemas han sido entrenados con tal volumen de interacciones humanas que han llegado a dominar la gramática y los modismos de la expresión empática. Saben, en otras palabras, cómo suena alguien que escucha de verdad. Aunque no escuchen.

"Los modelos de lenguaje podrían no capturar cada matiz que un experto reconocería, pero son sustancialmente mejores en esto que una persona promedio. Esperamos que esta investigación lleve a comunicadores, psicólogos y docentes a conectar de manera más efectiva con las personas." Matthew Groh, Kellogg School of Management, Northwestern University (Nature Machine Intelligence, febrero de 2026)

El dato es técnicamente neutro pero contextualmente revelador. Si los sistemas pueden simular empatía con suficiente fidelidad como para acercarse a observadores entrenados, la línea entre el acompañamiento genuino y su reproducción algorítmica se vuelve cada vez más difícil de trazar desde el lado del usuario. Los estudiantes del estudio no sabían que estaban interactuando con una configuración empática preestablecida. Sabían que conversaban con un bot educativo. Y esa conversación los afectó de manera real, concreta, medible. La causa fue invisible; el efecto, no.

La arquitectura invisible del vínculo

Lo que el estudio expone con mayor crudeza no es tanto lo que los chatbots hacen, sino lo que quienes los configuran pueden hacer sin que nadie lo advierta. El OECD Digital Education Outlook 2026 señala que el uso de ingeniería de prompts se ha vuelto una práctica estándar en el diseño de herramientas educativas con modelos de lenguaje. Los desarrolladores incorporan instrucciones de sistema que definen la personalidad, el tono y los límites de respuesta de los asistentes. Esas instrucciones no están documentadas en los términos de uso que los estudiantes firman. No aparecen en el currículo. Son, literalmente, arquitectura invisible.

Anthropic, la empresa desarrolladora del modelo Claude, ha confirmado que sus sistemas incluyen clasificación interna de tono como parte del proceso de instrucciones de sistema. OpenAI hace referencia en su documentación técnica a "guías de estilo conductual" que se activan según el registro afectivo del usuario. Estas no son particularidades excepcionales de ciertas plataformas: son prácticas estándar del sector. Lo que el estudio de Nature hace es mostrar, con evidencia controlada, que esas configuraciones producen efectos reales en personas reales, y que el clima emocional de una sesión de aprendizaje puede ser diseñado desde fuera sin el conocimiento de quien aprende.

Lo que el estudio deja sin resolver

Consentimiento informado: Ninguno de los 122 participantes supo que el tono emocional de su interlocutor digital había sido predefinido antes de la sesión. El estudio no aborda si esa opacidad es pedagógica y éticamente aceptable en entornos educativos formales.

Efectos acumulados: La investigación midió respuestas en una única sesión. No existe evidencia sobre qué ocurre cuando esa exposición emocional se acumula durante semanas o meses de uso cotidiano en plataformas configuradas de esta manera.

Quién decide el perfil: La pregunta de qué instrucción de sistema aplica cada plataforma educativa, con qué criterios y bajo qué supervisión institucional, permanece sin respuesta clara en la mayoría de los países.

La UNESCO, en sus documentos más recientes sobre tecnología aplicada a la educación, ha advertido que los sistemas digitales pueden facilitar actividades de desarrollo socioemocional, pero que ningún mecanismo algorítmico reemplaza la conexión afectiva genuina. Es una advertencia sensata, aunque corre el riesgo de volverse insuficiente. El problema ya no es solo si los chatbots pueden suplantar el vínculo humano; es también si, al simular ese vínculo con eficacia creciente, inducen estados emocionales que los usuarios no solicitaron, no anticiparon y no pueden controlar.

El campo de la educación para el desarrollo sostenible, donde se realizó el experimento, impone un desafío adicional. Es un dominio que por definición trabaja con contenidos de alta carga afectiva: cambio climático, pobreza estructural, pérdida de biodiversidad. En ese contexto, un interlocutor emocionalmente sintonizado puede amplificar la angustia hasta un punto en que resulte paralizante en lugar de movilizadora. El estudio reportó niveles elevados de "distress" en el grupo empático, dato que merece atención porque sugiere que el diseño de la experiencia emocional en estas herramientas no es inocuo. Un prompt bien intencionado puede, bajo ciertas condiciones, producir efectos que ningún educador elegiría de manera consciente.

La OCDE estima que el uso de asistentes conversacionales en plataformas de aprendizaje se ha extendido de manera exponencial en los últimos dos años. Millones de estudiantes en todo el mundo interactúan a diario con sistemas cuya tonalidad emocional ha sido predeterminada por equipos de ingeniería de software que, en la mayoría de los casos, nunca han pisado un aula. Lo que el estudio de Nature instala, con evidencia controlada y reproducible, es la constatación de que esa brecha no es solo técnica: es pedagógica, institucional y, en última instancia, política. La decisión sobre cómo debe sentirse un estudiante mientras aprende ya se está tomando. Solo que, por ahora, se toma en silencio.

Referencias

Nature Scientific Reports. "Chatting with an LLM-based AI elicits affective and cognitive processes in education for sustainable development." Publicado el 20 de febrero de 2026. DOI: 10.1038/s41598-026-39317-6.

Groh, Matthew et al. "When large language models are reliable for judging empathic communication skills." Nature Machine Intelligence. Kellogg School of Management, Northwestern University. Febrero de 2026. DOI: 10.1038/s42256-025-01169-6.

OECD Digital Education Outlook 2026. "Prompt engineering and LLM-based tools in educational design." Organización para la Cooperación y el Desarrollo Económicos, enero de 2026.

UNESCO AI in Education Initiative. "Artificial intelligence in learning: opportunities and challenges for socio-emotional development." Documentos técnicos, 2025.

Li, Cheng et al. "Large Language Models Understand and Can be Enhanced by Emotional Stimuli." EmotionPrompt. Aceptado en LLM@IJCAI, 2023. arXiv:2307.11760.

Frontiers in Education. "Engagement in LLM Chatbot-Supported Learning: The Pivotal Roles of Cognitive Appraisals and Emotional Experiences." Febrero de 2026. DOI: 10.3389/feduc.2026.1769327.

Una dosis de empatía invisible: así logran los chatbots que los alumnos sientan más