Los modelos de lenguaje más avanzados del mundo, incluyendo GPT-5 y Gemini 2.5 Pro, fracasan estrepitosamente cuando deben resolver problemas que requieren visualización intermedia. Un nuevo benchmark llamado MIRA demuestra que estos sistemas alcanzan apenas un 16.5% de precisión en…

