El techo del 70%: por qué el benchmark FACTS es una alarma para la IA empresarial BENCHMARKS / FACTUALIDAD IA 2025 El techo del 70%: por qué el benchmark FACTS es una alarma para la IA empresarial Google y Kaggle acaban de ponerle número a algo que muchos equipos intuían: incluso los mejores modelos de…
Nomos 1: El «David» del Open Source que humilló a los gigantes en matemáticas
Nomos 1: La Revolución Matemática del Open Source REPORTE ESPECIAL / NOUS RESEARCH Nomos 1: El «David» del Open Source que humilló a los gigantes en matemáticas Un modelo de código abierto de apenas 30B de parámetros ha logrado lo imposible: superar a casi todos los humanos en el examen de matemáticas más difícil del…
GPT-5.2 «Thinking»: El contraataque que deja a Gemini en el espejo retrovisor
LANZAMIENTO OFICIAL / DIC 2025 GPT-5.2 «Thinking»: El Contraataque que Deja a Gemini en el Espejo Retrovisor Tras semanas de especulación y un «Código Rojo» interno, OpenAI ha liberado su respuesta directa al empuje de Gemini 3. Los benchmarks oficiales muestran…
Inteligencia artificial vs. sentido común: una auditoría de consumo
La humanidad ha observado con una mezcla de fascinación colectiva y vértigo existencial cómo los sistemas de inteligencia artificial generativa pasaban de ser meras curiosidades de laboratorio a convertirse en oráculos digitales capaces de aprobar exámenes de abogacía con honores, escribir sonetos emulando el estilo del Siglo de Oro o depurar código informático complejo en…
LexGenius: La prueba definitiva para la inteligencia artificial jurídica
La fascinación contemporánea por los sistemas computacionales avanzados suele chocar de frente con una realidad mucho más prosaica: la capacidad de procesar información no equivale a la sabiduría necesaria para aplicarla. Durante los últimos años, hemos sido testigos de un despliegue tecnológico sin precedentes, donde algoritmos generativos han demostrado habilidades sorprendentes para escribir poesía, programar…
Openness Index: ¿Quién es realmente transparente en inteligencia artificial?
La gran auditoría de la apertura: un nuevo índice expone la realidad detrás del marketing «Open Source» en IA Artificial Analysis lanza el «Openness Index», una métrica estandarizada que desmantela el mito de los pesos abiertos y revela que la verdadera transparencia científica es un bien escaso, liderado inesperadamente por instituciones académicas y laboratorios chinos…
SpatialBench: la prueba que demuestra la torpeza física de la IA
La frontera final de la inteligencia sintética no resultó ser la creatividad artística ni la profundidad filosófica, como anticipaban las obras de ciencia ficción. El verdadero obstáculo ha resultado ser mucho más prosaico y, a la vez, insuperablemente complejo: entender qué…
Evaluación algorítmica: lecciones desde los hospitales universitarios
Investigadores de la Universidade da Coruña presentan HEAD-QA v2, una expansión monumental del conjunto de datos que utiliza los exámenes más rigurosos del sistema sanitario español para poner a prueba la verdadera capacidad de inferencia en los modelos de lenguaje…
Infinity-RoPE: la tecnología que permite crear películas eternas en casa
Investigadores de Virginia Tech y la compañía Fal introducen un marco revolucionario que permite generar videos de duración ilimitada con control preciso de las acciones y transiciones cinematográficas, superando las barreras de memoria y coherencia que limitaban a los modelos…
El fin de las alucinaciones visuales en la generación de diagramas técnicos
La ciencia moderna se enfrenta a una paradoja monumental. Jamás en la historia de la humanidad habíamos generado conocimiento a una velocidad tan vertiginosa, y sin embargo, la capacidad para sintetizar, comunicar y visualizar esos hallazgos no ha evolucionado al mismo…










