Científicos de Anthropic demuestran que su tecnología atrofia habilidades críticas

El asistente que acelera tu código pero atrofia tu cerebro

Un experimento controlado de Anthropic con 52 programadores revela la paradoja del aprendizaje asistido: quienes usaron las herramientas algorítmicas mientras dominaban una biblioteca de Python obtuvieron calificaciones 17% inferiores en las pruebas de comprensión, equivalente a casi dos grados de diferencia académica. La velocidad ganada llegó a costa del conocimiento adquirido

Por el equipo editorial | 6 de febrero, 2026

Cincuenta y dos ingenieros de software, reclutados para un estudio que nadie sabía sería polémico, recibieron una tarea aparentemente sencilla: aprender Trio, una biblioteca de Python para la programación asíncrona que ninguno de ellos dominaba. La mitad tendría acceso a un asistente algorítmico capaz de generar el código correcto bajo demanda. La otra mitad trabajaría sin ayuda automatizada, enfrentando cada error y obstáculo con sus propios recursos cognitivos. Treinta minutos después, todos completarían un examen sobre los conceptos que acababan de emplear. Los resultados desafiaron las narrativas optimistas sobre la productividad aumentada: el grupo con asistencia digital obtuvo puntuaciones significativamente más bajas, no por incompetencia, sino por una forma de aprendizaje que priorizó la ejecución inmediata sobre la comprensión duradera.

El experimento, conducido por los científicos de Anthropic y publicado en enero de 2026, constituye la primera evaluación controlada y aleatoria del impacto de los sistemas conversacionales avanzados sobre la formación de las habilidades técnicas. A diferencia de los estudios previos que midieron la productividad en los profesionales ya competentes, este trabajo examinó específicamente la fase de adquisición de conocimiento, el momento crítico donde los fundamentos se consolidan o se erosionan. La pregunta no era si estos sistemas aceleran la entrega del código funcional, una pregunta cuya respuesta afirmativa ya nadie discute seriamente, sino si esa aceleración se traduce en una comprensión genuina o simplemente en una dependencia silenciosa.

Anatomía del experimento

Participantes: 52 desarrolladores de software, mayormente junior, con uso semanal de Python durante al menos un año y familiaridad con las herramientas de asistencia algorítmica, pero sin conocimiento previo de Trio.

Tarea: Completar dos ejercicios de codificación usando los conceptos de programación asíncrona en Trio, con acceso a la descripción del problema, el código inicial y las explicaciones conceptuales breves.

Condiciones: El grupo experimental con acceso a un asistente conversacional capaz de producir el código correcto; el grupo control trabajando manualmente.

Evaluación: Un examen inmediato posterior cubriendo cuatro dimensiones: depuración, lectura de código, escritura de código y comprensión conceptual.

El diseño metodológico replicó deliberadamente los escenarios reales de aprendizaje autodidacta, donde los profesionales adquieren nuevas herramientas mediante los tutoriales y la documentación sin instrucción formal estructurada. Los participantes trabajaron en una plataforma de codificación en línea, con el asistente ubicado en la barra lateral para el grupo experimental, accesible en cualquier momento y con visibilidad completa del código en progreso. No existían restricciones sobre la frecuencia o el tipo de consultas. Algunos desarrolladores formularon hasta 15 preguntas consecutivas, invirtiendo hasta 11 minutos, aproximadamente el 30% del tiempo total asignado, en las interacciones con el sistema. Esta variabilidad en los patrones de uso resultaría crucial para interpretar los resultados agregados.

Dos grados académicos de diferencia

La métrica central del estudio, la puntuación promedio en el examen de comprensión, reveló una disparidad sustancial entre los grupos. Los participantes sin asistencia algorítmica alcanzaron aproximadamente el 67% de respuestas correctas. Aquellos con acceso al asistente obtuvieron cerca del 50%, una diferencia absoluta de 17 puntos porcentuales que alcanza una significancia estadística robusta. Traducido a las escalas académicas convencionales, equivale a descender de la calificación B a la calificación D. La brecha no se distribuyó uniformemente entre las cuatro dimensiones evaluadas. La depuración, la identificación y la corrección de errores en el código defectuoso, emergió como el área de mayor deterioro, seguida por la comprensión conceptual de las abstracciones subyacentes.

Este patrón adquiere una relevancia particular al considerar que la depuración constituye precisamente la habilidad crítica para supervisar y validar el código generado automáticamente. Un programador que delega la escritura de código a los sistemas externos pero carece de la capacidad robusta para detectar los defectos sutiles queda atrapado en una dependencia asimétrica: puede producir volumen pero no puede garantizar la corrección. El estudio documenta así una forma de atrofia cognitiva selectiva, donde las capacidades que más se necesitan para usar estas herramientas de forma segura son exactamente las que más se degradan por usarlas durante el aprendizaje.

Comparación del desempeño entre el grupo con asistencia algorítmica y el grupo control en cuatro dimensiones de competencia evaluadas inmediatamente después de completar las tareas de aprendizaje

Un hallazgo secundario pero notable: la ganancia en la velocidad de completación resultó marginalmente no significativa desde la perspectiva estadística. El grupo con asistencia terminó ligeramente más rápido en promedio, pero la varianza individual fue tan alta que el efecto no alcanzó los umbrales de confianza convencionales. Varios participantes invirtieron tanto tiempo componiendo las consultas elaboradas al asistente que compensaron cualquier ahorro en la escritura manual. Esta observación contradice las intuiciones comunes sobre la automatización y la productividad. La promesa de "hacer más en menos tiempo" se materializa principalmente cuando se aplican estas herramientas a las tareas repetitivas o ya dominadas, no durante las fases exploratorias de aprendizaje donde la incertidumbre sobre cómo formular la pregunta correcta consume los recursos cognitivos comparables a resolver el problema directamente.

Contexto crítico: La investigación previa de Anthropic había documentado que los profesionales competentes pueden acelerar sus tareas hasta el 80% usando la asistencia algorítmica. La contradicción aparente se resuelve al reconocer que ambos hallazgos son correctos en sus respectivos contextos: los expertos con fundamentos sólidos extraen un beneficio masivo, mientras que los aprendices en la fase de formación pagan un costo cognitivo significativo. El desafío radica en transitar de la segunda categoría a la primera sin herramientas que socaven ese tránsito.

Patrones de uso: atajo versus tutor

El análisis cualitativo de las interacciones entre los participantes y el asistente reveló una taxonomía clara de estrategias. Un subgrupo empleó el sistema como un sustituto cognitivo: formularon las consultas directas del tipo "escribe la función que hace X" o "corrige este código", copiaron las respuestas sin modificación sustancial, y avanzaron rápidamente a la siguiente subtarea. Estos usuarios exhibieron las puntuaciones de comprensión más bajas en la evaluación posterior. Otro subgrupo adoptó una aproximación dialógica: preguntaron "por qué esta implementación funciona", "qué hace específicamente este parámetro", "cuál es la diferencia entre estos dos enfoques", luego experimentaron con las variaciones del código sugerido antes de integrarlo. Estos participantes lograron una retención notablemente superior, en algunos casos igualando o superando al grupo control.

La distinción captura un principio pedagógico fundamental: el esfuerzo cognitivo, incluyendo la confusión temporal y los errores productivos, constituye un ingrediente esencial para la consolidación de la memoria a largo plazo. Cuando un sistema externo resuelve los problemas instantáneamente, elimina no solo la dificultad sino también el mecanismo neural que convierte la experiencia en competencia. La lucha con los bugs, la lectura repetida de la documentación poco clara, la experimentación con las soluciones fallidas, todas actividades que parecen ineficientes desde la perspectiva del tiempo invertido, construyen los modelos mentales robustos que persisten más allá de la tarea inmediata. El asistente algorítmico, configurado para maximizar la satisfacción inmediata del usuario, optimiza precisamente contra estos momentos de dificultad productiva.

Analogía con las calculadoras: lección histórica

El debate sobre las herramientas que automatizan la cognición no es nuevo. Cuando las calculadoras se volvieron ubicuas en la educación matemática durante las décadas de 1970 y 1980, surgieron preocupaciones similares: los estudiantes podrían obtener las respuestas numéricas sin desarrollar la comprensión de las operaciones subyacentes. La investigación subsiguiente mostró los efectos matizados: el uso temprano e intensivo durante el aprendizaje de la aritmética básica deterioraba la fluidez mental, pero la introducción posterior, una vez consolidados los fundamentos, no generaba perjuicio y aceleraba la resolución de los problemas complejos. La lección aplicable: secuenciar la exposición a la automatización según la fase de desarrollo de la habilidad.

Los investigadores identificaron también un fenómeno de metacognición distorsionada. Los participantes que usaron la asistencia reportaron subjetivamente una mayor confianza en su dominio de Trio que los participantes del grupo control, pese a obtener las puntuaciones objetivamente inferiores. Este desajuste entre la competencia percibida y la competencia real constituye un riesgo sistémico en los entornos donde los profesionales deben autoevaluar cuándo pueden confiar en sus habilidades versus cuándo necesitan la supervisión adicional. Un ingeniero que sobreestima su capacidad de detectar los errores debido a haber completado múltiples proyectos con ayuda algorítmica intensiva puede asumir las responsabilidades para las cuales no está genuinamente preparado, con consecuencias potencialmente serias en los sistemas críticos.

Implicaciones para la formación profesional

Los resultados plantean los interrogantes urgentes para las instituciones educativas, los empleadores y los desarrolladores individuales. Si las herramientas que prometen democratizar el acceso a las capacidades técnicas simultáneamente erosionan la formación de esas capacidades, ¿cómo estructurar los procesos de aprendizaje que capturen los beneficios sin incurrir en los costos? Una posibilidad implica una secuenciación deliberada: los períodos iniciales de práctica sin asistencia para establecer los fundamentos, seguidos por la introducción gradual de la automatización una vez que los estudiantes demuestran la competencia básica. Este enfoque replica implícitamente cómo los profesionales senior usan estas herramientas hoy: poseen décadas de experiencia acumulada antes de delegar las subtareas rutinarias.

Otra dirección involucra el rediseño de los propios sistemas de asistencia para incorporar los principios pedagógicos. Los modos de "aprendizaje explicativo" o "modo estudio", ya implementados en algunas plataformas comerciales, ajustan el comportamiento del asistente para priorizar la comprensión sobre la velocidad: ofrecen las pistas en lugar de las soluciones completas, formulan las preguntas socráticas para guiar el razonamiento, insertan los pasos intermedios que requieren la confirmación activa del usuario. La efectividad de estos modos alternativos aún no ha sido evaluada con una rigurosidad comparable al estudio aquí discutido, pero representan el reconocimiento por parte de los desarrolladores de sistemas de que optimizar exclusivamente para la completación de la tarea genera las externalidades negativas sobre el desarrollo de la habilidad.

"El esfuerzo cognitivo, e incluso quedar dolorosamente atascado, probablemente sea importante para fomentar la maestría. Esta es también una lección que aplica a cómo los individuos eligen trabajar con las herramientas algorítmicas, y qué herramientas usan." Extracto del reporte de investigación de Anthropic

Para los profesionales en ejercicio, la implicación práctica es la transparencia sobre las compensaciones. Usar la asistencia intensiva en las tareas repetitivas donde ya se posee la maestría maximiza la productividad sin sacrificio de la competencia. Emplear esa misma asistencia al explorar los dominios desconocidos acelera la entrega a corto plazo pero hipoteca el aprendizaje a largo plazo. La decisión óptima depende del horizonte temporal y los objetivos: si el conocimiento adquirido es desechable, relevante solo para un proyecto único, la estrategia de delegación total puede ser racional. Si el dominio será fundamental para el trabajo futuro, la inversión en la lucha inicial sin asistencia paga los dividendos acumulativos.

Los contextos organizacionales agregan una capa adicional de complejidad. Las empresas que incentivan la velocidad de entrega sin medir la calidad de comprensión entre sus equipos pueden inadvertidamente cultivar una cultura de dependencia superficial, donde los ingenieros producen un volumen impresionante pero carecen de la capacidad colectiva para diagnosticar las fallas sistémicas o innovar más allá de los patrones previamente vistos. La métrica de productividad, medida en las líneas de código o las características entregadas por sprint, no captura la degradación gradual del capital humano técnico. Solo cuando los sistemas enfrentan las fallas inesperadas o requieren el mantenimiento profundo emerge el déficit acumulado.

Más allá del código: transferencia a otros dominios

Aunque el estudio de Anthropic se enfocó específicamente en la programación, sus implicaciones trascienden ese dominio. Cualquier campo donde los profesionales usen los sistemas conversacionales avanzados para las tareas que requieren el expertise, la redacción técnica, el análisis de datos, el diseño de experimentos, el diagnóstico médico, enfrenta potencialmente una dinámica similar. La pregunta central permanece constante: ¿la herramienta está siendo usada por alguien competente para amplificar la capacidad existente, o está siendo usada por alguien en la fase de aprendizaje como un sustituto del desarrollo de esa capacidad? La respuesta determina si la tecnología actúa como un multiplicador o como un inhibidor.

La investigación futura deberá explorar la durabilidad temporal de estos efectos. ¿Los déficits de comprensión observados inmediatamente después de la tarea persisten semanas o meses más tarde, o se disipan conforme los usuarios reflexionan sobre las experiencias acumuladas? ¿La exposición prolongada a la asistencia algorítmica durante años de práctica profesional genera una erosión progresiva de las habilidades fundamentales, o establece un nuevo equilibrio estable donde ciertas competencias se mantienen y otras se atrofian sin consecuencia práctica? Responder estas preguntas requiere los estudios longitudinales con el seguimiento de las cohortes a través de las trayectorias completas de carrera.

Paradoja del supervisor: Los sistemas de asistencia algorítmica más avanzados requieren los usuarios más competentes para extraer el valor seguro. Un principiante no puede identificar cuándo el código generado contiene las sutilezas incorrectas o introduce las vulnerabilidades latentes. Un experto reconoce estas señales y corrige proactivamente. Pero si los principiantes usan estas herramientas intensivamente durante su formación, nunca alcanzan el nivel de expertise necesario para usarlas de forma segura. El bucle se cierra en el déficit perpetuo.

El trabajo de Anthropic ofrece la evidencia cuantitativa para las intuiciones que muchos educadores y profesionales senior ya albergaban. La novedad radica en medir el fenómeno con una rigurosidad experimental, aislando el efecto causal de la asistencia sobre el aprendizaje mediante la aleatorización y el grupo control. Esta evidencia debe informar las políticas institucionales, las decisiones curriculares y las prácticas individuales. Ignorarla equivale a optimizar las métricas superficiales, la velocidad de hoy, sacrificando la capacidad estructural para mañana. La tarea colectiva consiste en diseñar los ecosistemas tecnológicos y pedagógicos donde la potencia de estas herramientas se alinee con, en lugar de socavar, la formación duradera de la competencia humana.

Referencias

Anthropic. (2026). How AI assistance impacts the formation of coding skills. https://www.anthropic.com/research/AI-assistance-coding-skills

Turner, S. D. (2026). How AI assistance impacts the formation of coding skills. Paired Ends. https://blog.stephenturner.us/p/ai-assistance-coding-skills-anthropic

Devclass. (2026). Anthropic research: skilled devs make better use of AI, but using AI is bad for learning skills. https://devclass.com/2026/02/02/anthropic-research-skilled-devs-make-better-use-of-ai-but-using-ai-is-bad-for-learning-skills/

Serenitiesai. (2026). Does AI Make You a Worse Coder? Anthropic Research 2026. https://serenitiesai.com/articles/ai-coding-skills-anthropic-research-2026

Kelk, A. (2026). AI Assisted Coding: Balancing Productivity and Skill Development. LinkedIn. https://www.linkedin.com/posts/andykelk_anthropic-released-a-study-which-found-that-activity-7423467552703668224-BZM1

National Center for Biotechnology Information. (2024). Does using artificial intelligence assistance accelerate skill decay and hinder skill acquisition? PMC11239631. https://pmc.ncbi.nlm.nih.gov/articles/PMC11239631/

Goedecke, S. (2024). How does AI impact skill formation? https://www.seangoedecke.com/how-does-ai-impact-skill-formation/

AI Tech Suite. (2025). AI Coding Boosts Speed, But Programmers Asking Less Threatens Deep Learning. https://www.aitechsuite.com/ai-news/ai-coding-boosts-speed-but-programmers-asking-less-threatens-deep-learning

Científicos de Anthropic demuestran que su tecnología atrofia habilidades críticas