DeepSWE, el nuevo benchmark de DataCurve, intenta medir algo que los rankings tradicionales todavía capturan mal: la capacidad de un agente de programación para entrar en un repositorio real, entender una consigna breve, modificar varios archivos, evitar regresiones y…
Claude Opus 4.8 cambia la carrera por los agentes autónomos
Anthropic presentó Claude Opus 4.8 el mismo día en que anunció una ronda Serie H de 65.000 millones de dólares, con una valuación post-money de 965.000 millones. El movimiento combina una mejora técnica concentrada en programación, agentes y trabajo profesional…
GPT-5.5: el primer modelo de OpenAI diseñado para actuar, no solo responder
OpenAI lanzó su sistema más capaz hasta la fecha, uno que no solo responde preguntas sino que planifica, ejecuta, corrige y entrega resultados completos. La brecha entre asistente y agente acaba de cerrarse un tramo decisivo. Por el equipo editorial…
Kimi K2.6 compite con todos
Moonshot AI presentó Kimi K2.6 como una pieza de código abierto orientada a programación, ejecución prolongada y coordinación de enjambres de agentes. La novedad no reside solo en sumar puntos en benchmarks, sino en empujar una transición más incómoda para…
La tecnología exacta que permite a las computadoras automejorarse solas
El software contemporáneo padece una parálisis arquitectónica fundamental que limita su propio potencial evolutivo. Un nuevo paradigma computacional propone entidades digitales capaces de reescribir su propio código fuente en tiempo real para dominar cualquier disciplina científica. El código informático contemporáneo…
La técnica para coordinar múltiples modelos de inteligencia artificial
La precisión exigida por una línea de código no admite matices poéticos ni interpretaciones ambiguas. Un solo carácter fuera de lugar, una coma mal posicionada o una variable declarada en el instante equivocado pueden derribar arquitecturas lógicas enteras. En el ámbito de la programación competitiva, donde los problemas requieren una mezcla casi sobrehumana de ingenio…
La inminente obsolescencia técnica de los programadores humanos
La ingeniería informática se basó, durante muchos años, en acumular librerías y evadir la modificación de sistemas antiguos por miedo al colapso. Hoy, la automatización cognitiva amenaza con dinamitar estos pilares, proponiendo un retorno a estructuras monolíticas y empujando a…
Lo que la investigación de IA ignora actualmente
Un error invisible se propaga por los laboratorios de computación más avanzados de nuestro tiempo. Se trata de una omisión conceptual que, a pesar de su sutileza, amenaza con estancar una de las revoluciones tecnológicas más prometedoras de la década. Mientras los equipos de investigación compiten por anunciar el próximo agente de inteligencia artificial capaz…
Nuevo modelo de código abierto chino vence a OpenAI y Anthropic con menos recursos
Un modelo de IA chino con 40 mil millones de parámetros acaba de vencer a Claude y GPT-5.1: cómo un fondo de inversión logró lo imposible IQuest-Coder, un modelo de inteligencia artificial para programación desarrollado por Quest Research y respaldado por el gigante chino de fondos cuantitativos UBIQUANT, obtuvo 81.4% en SWE-Bench Verified, superando a…
Programar en 2025: la paradoja del conocimiento que la IA está dejando atrás
¿Tiene sentido aprender a programar si los algoritmos ya lo hacen por nosotros? Esa pregunta, que hasta hace poco era un ejercicio de futurología teórica, hoy atraviesa foros educativos, currículas universitarias y debates entre ejecutivos de las grandes empresas tecnológicas. Lo…










