Tres meses después del lanzamiento de Gemini 3 Pro, Google vuelve con una versión que más que duplica el rendimiento en razonamiento abstracto y redefine, por segunda vez en un trimestre, el paisaje competitivo de los grandes modelos de lenguaje…
Por qué Grok 4.20 espera más para contestar y por qué sus respuestas son mejores
Grok 4.20, el sistema de xAI lanzado en beta el 17 de febrero de 2026, abandona la lógica del modelo único para articular cuatro agentes especializados que razonan en paralelo, se cuestionan entre sí y producen respuestas de forma colectiva:…
Un error de evaluación está guiando el entrenamiento de modelos
La inteligencia artificial generativa se ha acostumbrado a ocupar el centro del escenario: escribe, resume, traduce, corrige, conversa. La parte menos visible del espectáculo, sin embargo, es la que decide si una mejora existe de verdad o solo se…
MiniMax M2.5 y el fin del “es carísimo”
MiniMax publicó los pesos de M2.5 y fijó una bandera en un lugar que, hasta hace poco, parecía reservado a laboratorios de caja negra: 80,2% en SWE-bench Verified, el termómetro más citado para “arreglar bugs reales en repositorios reales”. El…
Ckaude Sonnet 4.6: cuando lo accesible supera lo premium
Anthropic lanzó Claude Sonnet 4.6 con una ventana de contexto de un millón de tokens en beta, precios sin cambios y métricas que en varios rubros superan a su propio modelo insignia anterior. La ecuación precio-rendimiento que durante años fue el…
Alibaba desata Qwen3.5 con capacidades que los modelos cerrados no pueden igualar
Qwen3.5 combina arquitectura dispersa de mezcla de expertos con atención lineal híbrida para alcanzar velocidades de decodificación 19 veces superiores a sus predecesores, mientras mantiene licencia Apache 2.0 y capacidades nativas multimodales que rivalizan con sistemas propietarios cerrados en tareas…
Ring-1T-2.5: Resolución imposible al alcance de todos
La arquitectura del silencio reflexivo: la ingeniería que permite a Ring-1T-2.5 superar los límites de la memoria digital Ant Group despliega un motor de un billón de parámetros capaz de igualar las capacidades de razonamiento de los laboratorios privados más avanzados…
Por qué la IA es demasiado lógica para entender la política
La búsqueda de una inteligencia que nos devuelva la mirada ha sido una constante en la ambición tecnológica contemporánea. Observamos los modelos de lenguaje actuales y, seducidos por su elocuencia, tendemos a proyectar sobre ellos las sombras y luces de nuestra propia estructura cognitiva. Creemos que, al hablar como nosotros, deben necesariamente razonar bajo las…
GLM-5 escala al top de Artificial Analysis y reescribe el ranking
Zhipu AI presenta GLM-5, un sistema de 744 mil millones de parámetros que alcanza el primer puesto entre modelos de código abierto en el Artificial Analysis Intelligence Index, iguala el rendimiento de Claude Opus 4.5 en tareas de programación, y…










