Un error invisible se propaga por los laboratorios de computación más avanzados de nuestro tiempo. Se trata de una omisión conceptual que, a pesar de su sutileza, amenaza con estancar una de las revoluciones tecnológicas más prometedoras de la década. Mientras los equipos de investigación compiten por anunciar el próximo agente de inteligencia artificial capaz…
Gemini 3.1 Pro obtiene el puntaje más alto jamás registrado en el test de razonamiento abstracto más riguroso del sector
Tres meses después del lanzamiento de Gemini 3 Pro, Google vuelve con una versión que más que duplica el rendimiento en razonamiento abstracto y redefine, por segunda vez en un trimestre, el paisaje competitivo de los grandes modelos de lenguaje…
Por qué Grok 4.20 espera más para contestar y por qué sus respuestas son mejores
Grok 4.20, el sistema de xAI lanzado en beta el 17 de febrero de 2026, abandona la lógica del modelo único para articular cuatro agentes especializados que razonan en paralelo, se cuestionan entre sí y producen respuestas de forma colectiva:…
Un error de evaluación está guiando el entrenamiento de modelos
La inteligencia artificial generativa se ha acostumbrado a ocupar el centro del escenario: escribe, resume, traduce, corrige, conversa. La parte menos visible del espectáculo, sin embargo, es la que decide si una mejora existe de verdad o solo se…
MiniMax M2.5 y el fin del “es carísimo”
MiniMax publicó los pesos de M2.5 y fijó una bandera en un lugar que, hasta hace poco, parecía reservado a laboratorios de caja negra: 80,2% en SWE-bench Verified, el termómetro más citado para “arreglar bugs reales en repositorios reales”. El…
Ckaude Sonnet 4.6: cuando lo accesible supera lo premium
Anthropic lanzó Claude Sonnet 4.6 con una ventana de contexto de un millón de tokens en beta, precios sin cambios y métricas que en varios rubros superan a su propio modelo insignia anterior. La ecuación precio-rendimiento que durante años fue el…
La disputa entre Anthropic y el Pentágono
El Departamento de Defensa de los Estados Unidos presiona para que los sistemas de razonamiento avanzado operen bajo la premisa de todos los fines lícitos, desafiando las salvaguardas éticas de empresas como Anthropic y poniendo en juego contratos de seguridad…
Alibaba desata Qwen3.5 con capacidades que los modelos cerrados no pueden igualar
Qwen3.5 combina arquitectura dispersa de mezcla de expertos con atención lineal híbrida para alcanzar velocidades de decodificación 19 veces superiores a sus predecesores, mientras mantiene licencia Apache 2.0 y capacidades nativas multimodales que rivalizan con sistemas propietarios cerrados en tareas…
Tu inteligencia está en riesgo por culpa de la comodidad digital
Pensar duele. No es una metáfora romántica ni un lamento existencial, sino una realidad termodinámica. El cerebro humano, una masa de apenas kilo y medio que consume el veinte por ciento de la energía de todo el cuerpo, es un órgano diseñado para la supervivencia, no necesariamente para la verdad. Durante milenios, nuestra especie ha…










