La discusión sobre cómo medir la inteligencia de las máquinas acompaña a la informática desde su origen. Durante décadas, la referencia popular fue el experimento propuesto por Alan Turing en 1950, que reducía la evaluación a una situación de conversación encubierta….
OpenAI, GPT-5 y el trabajo: qué significa que la IA se acerque al rendimiento profesional
El lanzamiento de un esquema de evaluación orientado a tareas con valor económico directo cambió la manera de medir el aporte de la inteligencia artificial a la actividad profesional. OpenAI presentó un conjunto de pruebas aplicadas que enfrenta a sus sistemas…
Del benchmark al veredicto: cómo la IA ya aprueba el CFA y cambia la evaluación de modelos
En una madrugada de mayo, un grupo de investigadores activó un par de servidores y pulsó “ejecutar”. Al otro lado de la línea, un conjunto de modelos de lenguaje comenzó a trabajar sobre algo inusual: no era un enigma literario ni…
Jueces de silicio, confianza humana: la nueva ciencia para hacer fiables las evaluaciones de la IA
Por un instante proyectemos a través de nuestra imaginación que un sistema de inteligencia artificial, uno de esos modelos de lenguaje gigantes que hoy dominan los titulares, debe juzgar la calidad de un resumen de noticias. No se trata de generar…
La segunda génesis: cómo la evolución artificial está creando una nueva especie de IA
Un innovador laboratorio de inteligencia artificial con sede en Tokio ha presentado una metodología revolucionaria que utiliza los principios de la selección natural y la evolución para crear nuevos modelos de IA. Este enfoque, que se aleja radicalmente de los métodos…
La conquista del ruido: la búsqueda de la IA que realmente sabe escuchar
En el tejido silencioso de nuestra vida digital, una de las capacidades más transformadoras de la inteligencia artificial es también una de las más subestimadas: la habilidad de escuchar. La tecnología de conversión de voz a texto, o STT (Speech-to-Text), se…
La maratón de la mente: la búsqueda para medir la verdadera autonomía de la inteligencia artificial
El horizonte temporal de las tareas de ingeniería de software que los diferentes LLM pueden completar el 50% del tiempo Este gráfico ilustra el crecimiento exponencial de la autonomía de los modelos de IA, demostrando que la complejidad de las tareas…
El bucle del descubrimiento: la IA de Google que formula hipótesis, experimenta y aprende sola
La historia del descubrimiento científico es una crónica de la paciencia humana. Es la imagen de Johannes Kepler pasando una década inmerso en las tablas astronómicas de Tycho Brahe para descifrar las leyes del movimiento planetario. Es Marie Curie en su…
La conversación ininterrumpida: cómo la nueva IA de Google aprende a escuchar en tiempo real
Hemos aprendido a hablar con las máquinas a través de un lenguaje fracturado, una suerte de dialecto digital lleno de pausas incómodas y turnos rígidamente definidos. Es una conversación de monólogos. Hablamos, nos detenemos, esperamos. La máquina procesa, piensa en silencio…
La cicatriz cognitiva: el descubrimiento de que los errores envenenan el pensamiento artificial
En el vertiginoso mundo de la inteligencia artificial, una idea se había instalado con la fuerza de un dogma: para resolver los problemas más enrevesados, las máquinas necesitaban «pensar más». Este principio, aparentemente intuitivo, dio origen a una carrera por crear…