Los modelos de lenguaje más avanzados del mundo, incluyendo GPT-5 y Gemini 2.5 Pro, fracasan estrepitosamente cuando deben resolver problemas que requieren visualización intermedia. Un nuevo benchmark llamado MIRA demuestra que estos sistemas alcanzan apenas un 16.5% de precisión en…
LeJEPA: Menos trucos, más matemáticas
En los anales de la ciencia, existen momentos de profunda claridad que logran transformar un campo que operaba en la penumbra de la intuición en una disciplina regida por la luz de la teoría y la prueba. La alquimia, con sus…
Domesticando al villano: IA, alineamiento y el arte de la ficción
Alfred Hitchcock, el maestro del suspense, sostenía una máxima infalible: «Cuanto más exitoso es el villano, más exitosa es la película». El antagonista es el motor del drama, el espejo oscuro que define al héroe y la medida de la tensión…
El techo invisible donde los modelos dejan de pensar
Cuando más contexto significa peor rendimiento: las cuatro formas en que los modelos colapsan Ventanas de contexto de un millón de símbolos prometieron revolucionar agentes autónomos. Una investigación reciente demuestra lo opuesto: acumular información provoca envenenamiento que se replica,…
Análisis de arquitectura: El cerebro dual de GPT-5.1
OpenAI despliega una actualización mayor. Más allá de la «calidez», la nueva arquitectura de modo dual y la personalización tonal suponen un hito en la eficiencia computacional, la fiabilidad y la adaptabilidad de la IA. Por el Equipo Editorial |…
AgileThinker: pensar rápido, decidir mejor
Los modelos más avanzados de lenguaje pueden resolver ecuaciones complejas y traducir idiomas con fluidez, pero colapsan cuando el mundo no espera pacientemente su respuesta. Una nueva investigación llamada AgileThinker revela la «brecha temporal» que ha mantenido a los sistemas…
Google descubre IA que transcribe y razona como humanos
Un misterioso nuevo modelo de Gemini en pruebas muestra capacidades de razonamiento abstracto espontáneo mientras alcanza precisión de nivel humano experto en la transcripción de documentos históricos handwritten. Por el Equipo Editorial | 12 de noviembre, 2025 Google está probando…
GDPVAL: la IA entra en la economía
Durante muchos años hemos medido la inteligencia de nuestras máquinas a través de juegos y abstracciones. El hito de Deep Blue derrotando a Kaspárov en ajedrez, o el más reciente y esotérico triunfo de AlphaGo sobre el campeón mundial de…
DeepEyes V2: cuando la IA aprende a usar el mundo
En el torbellino de la innovación tecnológica, donde cada día parece traer un nuevo hito, es fácil caer en la fatiga de la novedad. Sin embargo, de vez en cuando, surge un trabajo que no es simplemente un paso…










