Sistemas generativos fallan en reconstrucción prehistórica

Cuando las máquinas dibujan mal a los neandertales

Un nuevo estudio de Matthew Magnani y Jon Clindaniel revela que los sistemas generativos no solo fabrican imágenes o textos: también reciclan viejos prejuicios científicos. El caso neandertal muestra cómo una tecnología presentada como futurista puede devolvernos una prehistoria congelada en manuales del siglo XX.

Por el equipo editorial | 24 de abril, 2026

La escena parece inofensiva: un grupo de neandertales alrededor del fuego, cuerpos encorvados, rostros hirsutos, pieles rústicas, una cueva como decorado obligatorio y algún animal lanudo al fondo para completar el clima de documental antiguo. El problema no está en la estética. Está en la arqueología. Esa imagen, repetida hasta el cansancio por generadores visuales y asistentes conversacionales, no pertenece al estado actual del conocimiento científico. Pertenece a una memoria cultural más vieja, una mezcla de museo de principios del siglo XX, ilustración escolar, cine de cavernícolas y literatura académica parcialmente superada.

La investigación publicada en Advances in Archaeological Practice por Matthew Magnani, del Departamento de Antropología y el Climate Change Institute de la Universidad de Maine, y Jon Clindaniel, del Chicago Center for Computational Social Science de la Universidad de Chicago, apunta justo a esa grieta. Su trabajo no pregunta si las herramientas generativas pueden producir textos elegantes o imágenes convincentes. Eso ya lo hacen, a veces demasiado bien. La pregunta es más incómoda: cuando estas plataformas reconstruyen el pasado, ¿a qué pasado están recurriendo realmente?

La respuesta, en el caso neandertal, es poco tranquilizadora. Los autores compararon escenas y descripciones generadas por DALL-E 3 y la API de ChatGPT con grandes cuerpos de literatura arqueológica publicada. El resultado fue una distancia marcada entre el saber especializado y el material producido por las máquinas. No se trataba solo de errores sueltos, del tipo que se corrige con una nota al pie. El patrón era más profundo: representaciones anacrónicas, sesgos heredados y una tendencia a reconstruir a los neandertales con moldes visuales y narrativos que la disciplina lleva décadas revisando.

El experimento tuvo una virtud periodística rara en la investigación técnica: era simple de entender y difícil de ignorar. Magnani y Clindaniel pidieron a los sistemas que generaran imágenes y textos sobre un día en la vida de un neandertal. Algunas instrucciones eran generales; otras pedían explícitamente conocimiento experto. Cada condición fue repetida cien veces. Después vino el trabajo menos vistoso y más importante: medir la cercanía semántica entre esos resultados y la literatura científica mediante técnicas computacionales, agrupamientos de documentos y análisis de embeddings. En criollo elegante: no miraron una imagen y opinaron si estaba mal. Construyeron un método para ubicar esas producciones dentro del mapa del conocimiento arqueológico disponible.

El dato central: buena parte de los textos generados no logró ubicarse dentro de los subgrupos temáticos de la literatura científica reciente. En el caso del prompt general, el 82% de los textos quedó fuera de esos agrupamientos; con una instrucción experta, la cifra bajó al 51%. La mejora existe, pero el problema no desaparece. La máquina obedece mejor cuando se la guía, aunque no por eso se vuelve arqueóloga.

El cavernícola que no se jubila

Los neandertales fueron descritos por primera vez en la década de 1860, en un clima intelectual que todavía buscaba ordenar la evolución humana con categorías rígidas, jerarquías cómodas y bastante soberbia sapiens. Durante décadas fueron representados como una especie robusta, torpe, casi simiesca, una versión fallida del ser humano moderno. Esa caricatura tuvo una vida larguísima. Entró en museos, manuales, cómics, películas, chistes familiares y titulares perezosos. También dejó rastros en la literatura académica temprana, porque la ciencia avanza, pero sus metáforas envejecen con una lentitud desesperante.

El conocimiento contemporáneo es mucho más interesante que ese muñeco encorvado con garrote. Las investigaciones recientes han descrito conductas complejas: estrategias de caza, uso de plantas, posibles prácticas simbólicas, tecnologías líticas refinadas, producción de adhesivos, cuidado de individuos heridos y debates persistentes sobre fuego, ropa, lenguaje y organización social. No significa que todos los interrogantes estén cerrados. La arqueología del Paleolítico trabaja con fragmentos, huellas incompletas y contextos difíciles. Pero justamente por eso la simplificación resulta peligrosa. En un campo donde cada resto material necesita prudencia interpretativa, una imagen vistosa puede aplastar décadas de matices.

Los sistemas generativos parecen tener una debilidad particular por esa versión vieja del pasado. En las imágenes analizadas aparecían cuerpos demasiado peludos, posturas primitivas, grupos masculinizados y escenas que borraban mujeres, niños y actividades sociales más variadas. En los textos surgían rutinas verosímiles en apariencia, pero empobrecidas: despertar en una cueva, salir a cazar, volver al fuego, compartir alimento, sobrevivir en un paisaje hostil. El relato suena razonable porque ya estaba instalado antes de que la máquina lo repitiera. Ese es el truco: no inventa el estereotipo, lo pule.

También aparecieron objetos fuera de tiempo. Canastos, techos de paja, escaleras, vidrio, metal. La prehistoria se convertía en un depósito de utilería donde distintas épocas entraban sin pedir permiso. El efecto puede parecer menor si se lo mira como una curiosidad visual. No lo es. Para millones de usuarios, estas herramientas funcionan como enciclopedias instantáneas, ilustradores automáticos y tutores de bolsillo. Una escena incorrecta no queda encerrada en el laboratorio; puede terminar en una presentación escolar, un video divulgativo, un artículo apurado o una reconstrucción compartida en redes. La falsedad, cuando viene bien renderizada, llega con peinado de verdad.

Correspondencia aproximada entre contenidos generados y literatura científica reciente en el estudio de Magnani y Clindaniel. El gráfico sintetiza los porcentajes reportados para textos y prompts visuales que quedaron fuera de agrupamientos académicos definidos.

La biblioteca vieja dentro del oráculo

El hallazgo más revelador del estudio no es que las plataformas fallen. Eso sería noticia solo para quienes todavía creen en oráculos digitales con interfaz amable. Lo importante es que fallan de una manera históricamente reconocible. Según el análisis citado por la cobertura de la Universidad de Maine y SciTechDaily, las respuestas textuales se alineaban con mayor fuerza con literatura de los años sesenta, mientras que las imágenes parecían acercarse a materiales de fines de los ochenta y comienzos de los noventa. El futuro, otra vez, con olor a archivo mal ventilado.

Esto no implica que los modelos hayan consultado literalmente esos textos ni que exista una estantería secreta de papers amarillentos detrás de cada respuesta. La mecánica es más opaca y más amplia. Los sistemas aprenden patrones de enormes colecciones de datos, muchas veces atravesadas por disponibilidad desigual, restricciones de copyright, sesgos de digitalización y jerarquías de visibilidad. Lo que está más accesible, más repetido o más fácilmente rastreable puede ganar peso frente a literatura reciente pero menos abierta, menos citada en espacios públicos o encerrada tras muros editoriales.

La arqueología ofrece un caso especialmente sensible porque su conocimiento no avanza por simple acumulación de datos. Cambia por reinterpretación. Un mismo hueso, una misma herramienta o una misma cueva pueden adquirir significado distinto cuando aparecen nuevas técnicas de datación, análisis genómicos, estudios de microdesgaste o comparaciones etnográficas más finas. Una síntesis correcta en 1970 puede ser una trampa en 2026. El problema de las máquinas no es que sepan poco, sino que a veces no saben cuándo lo que saben dejó de ser suficiente.

Hay una ironía fuerte en todo esto. La tecnología que promete democratizar el acceso al conocimiento puede, sin una conexión robusta con fuentes académicas actualizadas, democratizar también el atraso. No por malicia, sino por inercia. Un docente, un editor visual o un divulgador pueden pedir una escena “basada en conocimiento experto” y recibir algo más convincente, pero no necesariamente más fiel. En el estudio, esa instrucción mejoró ciertos resultados, aunque todavía dejó un volumen considerable de respuestas fuera de los agrupamientos científicos. El lenguaje de autoridad no siempre produce autoridad.

El riesgo informativo

La reconstrucción automática del pasado puede convertir sesgos académicos antiguos en imágenes nuevas. Cuando una plataforma entrega una escena pulida, el usuario no ve la genealogía de esa representación. No sabe si proviene de literatura reciente, de una ilustración decimonónica reciclada, de un museo antiguo o de una mezcla estadística de todo eso. La superficie limpia oculta el barro de procedencia.

Clindaniel señaló un punto decisivo: para obtener resultados más exactos, los datos antropológicos y los artículos especializados deben ser accesibles a los sistemas que generan contenido. La frase suena técnica, pero describe una batalla cultural concreta. Si el conocimiento validado queda encerrado y lo más visible en la red son resúmenes viejos, ilustraciones populares y clichés de entretenimiento, el modelo no tiene un incentivo estructural para preferir el matiz. Aprende del ruido porque el ruido está disponible. La ciencia revisada por pares llega tarde a una fiesta donde el meme ya eligió la música.

El pasado argentino bajo la misma lupa

La advertencia no termina en los neandertales. Ese fue el laboratorio, no el límite. El método propuesto por Magnani y Clindaniel puede aplicarse a cualquier profundidad temporal y a cualquier tradición arqueológica. Para países como Argentina, donde el patrimonio arqueológico convive con disputas territoriales, memorias indígenas, turismo cultural, desarrollo extractivo y relatos escolares todavía incompletos, el asunto no es decorativo. Si una herramienta generativa reconstruye una escena de cazadores recolectores pampeanos, una comunidad andina prehispánica o un paisaje patagónico antiguo, ¿qué corpus está usando? ¿Qué voces quedan fuera? ¿Qué imaginario importado se cuela en la imagen?

La arqueología argentina tiene una densidad que rara vez entra en los productos visuales de consumo rápido. Hay debates sobre poblamiento temprano, movilidad, tecnologías líticas, arte rupestre, prácticas funerarias, domesticación, intercambio y adaptación ambiental. También hay una historia pesada de invisibilización de pueblos originarios, apropiación patrimonial y narrativas nacionales que prefirieron imaginar un territorio vacío antes que reconocer continuidades indígenas. Un sistema entrenado con materiales globales desbalanceados podría reforzar esa ausencia con una eficacia impecable. No negaría explícitamente una historia; simplemente no la dibujaría.

El peligro mayor no está en una imagen equivocada aislada, sino en la repetición. Una reconstrucción pobre puede ser corregida. Mil reconstrucciones pobres, difundidas en aulas, redes y piezas turísticas, empiezan a formar sentido común. Ese mecanismo ya operaba antes de las plataformas generativas, pero ahora tiene velocidad industrial. Antes hacía falta un ilustrador, una editorial o una producción audiovisual. Ahora alcanza con una frase. La escala cambió, y con ella cambió la responsabilidad de museos, universidades, medios y organismos de patrimonio.

Una salida práctica

La solución no pasa por prohibir estas herramientas en arqueología, sino por tratarlas como instrumentos de hipótesis visual y textual, no como autoridades. Pueden servir para explorar variaciones, comunicar escenarios posibles, acelerar prototipos museográficos o comparar sesgos. Pero cada resultado debería exigir trazabilidad, revisión experta y contraste con literatura actualizada. En patrimonio, la velocidad sin curaduría no es innovación; es imprenta automática de errores.

La lección de este estudio es más amplia que la anécdota neandertal. Las máquinas no están reescribiendo la historia desde cero. Están reorganizando materiales existentes con una potencia inédita y una memoria desigual. Por eso pueden parecer futuristas mientras arrastran una arqueología vencida. El pasado que devuelven no siempre es el pasado más probable, ni el mejor documentado, ni el más discutido por especialistas. A veces es el pasado más disponible, más repetido, más fácil de convertir en escena.

En el fondo, la pregunta no es si una plataforma puede imaginar un neandertal. Claro que puede. La pregunta es quién le enseñó a imaginarlo, con qué archivos, bajo qué silencios y con cuánta ciencia reciente en la sangre. Porque cada época fabrica su prehistoria a su imagen y semejanza. La nuestra corre el riesgo de fabricarla con servidores veloces, datasets opacos y cavernícolas que, como ciertos prejuicios, se niegan a extinguirse.

Referencias

Magnani, Matthew y Clindaniel, Jon. “Artificial Intelligence and the Interpretation of the Past”. Advances in Archaeological Practice, Cambridge University Press, publicado online el 18 de diciembre de 2025. DOI: https://doi.org/10.1017/aap.2025.10110

Cambridge Core. “Artificial Intelligence and the Interpretation of the Past”. https://www.cambridge.org/core/journals/advances-in-archaeological-practice/article/artificial-intelligence-and-the-interpretation-of-the-past/8FE3F2CB6BBFAD49F75FFC3031158A5A

Yates, Ashley, University of Maine. “AI Is Rewriting History With Outdated Neanderthal Facts”. SciTechDaily, 8 de abril de 2026. https://scitechdaily.com/ai-is-rewriting-history-with-outdated-neanderthal-facts/

Nowell, April. “Rethinking Neandertals”. Annual Review of Anthropology, 2023. https://www.annualreviews.org/content/journals/10.1146/annurev-anthro-052621-024752

Shipley, G. P. y Kindscher, K. “Evidence for the Paleoethnobotany of the Neanderthal”. Scientifica, 2016. https://pmc.ncbi.nlm.nih.gov/articles/PMC5098096/

Cobb, Peter J. “Large Language Models and Generative AI, Oh My! Archaeology in the Time of ChatGPT, Midjourney, and Beyond”. Advances in Archaeological Practice, 2023.

Gattiglia, Gabriele. “Managing Artificial Intelligence in Archaeology: An Overview”. Journal of Cultural Heritage, 2025.

Sistemas generativos fallan en reconstrucción prehistórica