Suscríbete a MUNDO IA

Categoría: Modelos & Arquitecturas

Generated Image February 19, 2026 - 7_32PM

Gemini 3.1 Pro obtiene el puntaje más alto jamás registrado en el test de razonamiento abstracto más riguroso del sector

  Tres meses después del lanzamiento de Gemini 3 Pro, Google vuelve con una versión que más que duplica el rendimiento en razonamiento abstracto y redefine, por segunda vez en un trimestre, el paisaje competitivo de los grandes modelos de lenguaje…

Leer Más
Figuras Grok fotorrealistas

Por qué Grok 4.20 espera más para contestar y por qué sus respuestas son mejores

  Grok 4.20, el sistema de xAI lanzado en beta el 17 de febrero de 2026, abandona la lógica del modelo único para articular cuatro agentes especializados que razonan en paralelo, se cuestionan entre sí y producen respuestas de forma colectiva:…

Leer Más
Generated Image February 17, 2026 - 9_56PM

Un error de evaluación está guiando el entrenamiento de modelos

    La inteligencia artificial generativa se ha acostumbrado a ocupar el centro del escenario: escribe, resume, traduce, corrige, conversa. La parte menos visible del espectáculo, sin embargo, es la que decide si una mejora existe de verdad o solo se…

Leer Más
Generated Image February 17, 2026 - 9_15PM

Así funciona la IA que aprende sola a gestionar su propia memoria

La IA que aprende a recordar: cómo los sistemas autónomos están resolviendo el problema de la memoria Un equipo de investigadores canadienses presentó un marco que enseña a los agentes de inteligencia artificial a diseñar su propia memoria, superando en todos los entornos probados a los sistemas concebidos por expertos humanos. Hay un defecto de…

To access this post, you must purchase Suscripción Mundo IA Pro.

Leer Más
Rack datacenter Minimax

MiniMax M2.5 y el fin del “es carísimo”

  MiniMax publicó los pesos de M2.5 y fijó una bandera en un lugar que, hasta hace poco, parecía reservado a laboratorios de caja negra: 80,2% en SWE-bench Verified, el termómetro más citado para “arreglar bugs reales en repositorios reales”. El…

Leer Más
Centro de an_lisis Claude

Ckaude Sonnet 4.6: cuando lo accesible supera lo premium

Anthropic lanzó Claude Sonnet 4.6 con una ventana de contexto de un millón de tokens en beta, precios sin cambios y métricas que en varios rubros superan a su propio modelo insignia anterior. La ecuación precio-rendimiento que durante años fue el…

Leer Más
App Qwen activa

Alibaba desata Qwen3.5 con capacidades que los modelos cerrados no pueden igualar

  Qwen3.5 combina arquitectura dispersa de mezcla de expertos con atención lineal híbrida para alcanzar velocidades de decodificación 19 veces superiores a sus predecesores, mientras mantiene licencia Apache 2.0 y capacidades nativas multimodales que rivalizan con sistemas propietarios cerrados en tareas…

Leer Más
Robot Examen 2

Ring-1T-2.5: Resolución imposible al alcance de todos

La arquitectura del silencio reflexivo: la ingeniería que permite a Ring-1T-2.5 superar los límites de la memoria digital Ant Group despliega un motor de un billón de parámetros capaz de igualar las capacidades de razonamiento de los laboratorios privados más avanzados…

Leer Más
Androide Indiferente 1

Por qué la IA es demasiado lógica para entender la política

La búsqueda de una inteligencia que nos devuelva la mirada ha sido una constante en la ambición tecnológica contemporánea. Observamos los modelos de lenguaje actuales y, seducidos por su elocuencia, tendemos a proyectar sobre ellos las sombras y luces de nuestra propia estructura cognitiva. Creemos que, al hablar como nosotros, deben necesariamente razonar bajo las…

To access this post, you must purchase Suscripción Mundo IA Pro.

Leer Más
Podio IA 1

GLM-5 escala al top de Artificial Analysis y reescribe el ranking

  Zhipu AI presenta GLM-5, un sistema de 744 mil millones de parámetros que alcanza el primer puesto entre modelos de código abierto en el Artificial Analysis Intelligence Index, iguala el rendimiento de Claude Opus 4.5 en tareas de programación, y…

Leer Más