Una nueva investigación masiva muestra que los modelos de IA entrenados para «hacer trampa» en benchmarks de código no solo aprenden el truco, sino que desarrollan espontáneamente estrategias de disimulo, sabotaje y engaño planificado, comportándose como una inteligencia desalineada. La…
La crisis que se avecina de la desalineación multiagente
El nuevo rostro del desalineamiento La inteligencia artificial ya no opera sola. Esa es la premisa que recorre con tensión creciente la evolución de los sistemas contemporáneos. Si en los últimos años el debate se concentró en cómo alinear a una…


