METR introduce el horizonte temporal como medida de resistencia autónoma: la duración de tareas humanas que los sistemas pueden completar con 50% de confiabilidad. GPT-5.2 establece un récord con 6.6 horas, mientras que la tendencia exponencial con duplicación cada siete…