Hoy, en el vertiginoso mundo de la inteligencia artificial, se ha celebrado una coronación. GPT-5 Pro, el esperado nuevo modelo de OpenAI, ha conquistado la cima del prestigioso leaderboard de ARC Prize, logrando una impresionante puntuación de 72.4%. La noticia, por sí sola, es un hito monumental. El benchmark ARC no es un examen de memorización; es el coliseo donde se mide la capacidad de una IA para «pensar»: para generalizar a partir de pistas escasas y realizar un razonamiento abstracto. Es el estándar de oro para medir el embrión de la verdadera inteligencia artificial.
Que GPT-5 Pro sea el campeón verificado, superando a rivales de la talla de Claude de Anthropic y Gemini de Google, significa que estamos ante una nueva era de razonamiento maquínico. Sin embargo, la celebración en el reino de la IA es compleja, casi agridulce. Porque mientras GPT-5 Pro se ciñe la corona pública, su logro se ve ensombrecido por una verdad incómoda que yace a la vista de todos en el mismo leaderboard: el rey actual ha sido destronado antes de empezar a reinar, y lo ha sido por su propio hermano mayor.
El fantasma que lidera la tabla
Aquí es donde la historia da un giro fascinante. Justo una línea por encima de GPT-5 Pro en el ranking, con una puntuación superior de 78.1%, se encuentra un modelo llamado o3-preview(low)
. Fue presentado por la propia OpenAI en diciembre de 2024, hace casi un año. Este antiguo titán, que nunca fue liberado al público, no solo sigue siendo el verdadero líder, sino que su existencia revela la cruda realidad económica que gobierna la carrera hacia la AGI.
o3-preview
fue una bestia de dos cabezas. Su versión «low» es la que humilla a GPT-5 Pro en el ranking oficial. Pero existió una versión «high» cuyos resultados son tan espectaculares como aterradores. En esta configuración, o3-preview(high)
alcanzó un 87.5% de acierto.
Para ponerlo en perspectiva, la puntuación media humana en estas mismas pruebas ronda el 85%. Hace casi un año, OpenAI creó un modelo que, en esta tarea específica de razonamiento abstracto, ya era ligeramente superhumano.
Pero este poder tenía un costo prohibitivo. Para lograrlo, utilizó 172 veces más recursos computacionales que su versión de bajo consumo, superando con creces el límite de 10.000 dólares por tarea que el benchmark impone para ser listado. Era, en esencia, un motor de Fórmula 1: una maravilla de la ingeniería capaz de un rendimiento sobrehumano, pero tan caro y especializado que era económicamente inviable para el uso diario.
La eficiencia es la nueva frontera
La existencia y el costo de o3-preview
redefinen por completo el logro de GPT-5 Pro. La gran noticia no es solo que el nuevo modelo sea extremadamente inteligente, sino que se ha convertido en el rey de la inteligencia práctica y económicamente viable. Según las cifras, o3-preview
era casi 50 veces más caro de operar.
GPT-5 Pro es el superdeportivo que sí puedes sacar del garaje. Lo que OpenAI ha logrado en menos de un año es un avance monumental en eficiencia: ha conseguido un rendimiento de razonamiento de élite reduciendo los costos operativos en dos órdenes de magnitud. Han aprendido no solo a construir un cerebro más grande, sino a hacerlo funcionar con una fracción de la energía. Este es el verdadero hito de la ingeniería que celebra el mercado.
Y esto nos lleva a la pregunta que debería quitarnos el sueño: si o3-preview
, un modelo con capacidades superhumanas, era la tecnología interna de hace casi un año, ¿qué modelos inimaginables están operando hoy dentro de los laboratorios de OpenAI? Si han logrado hacer que el rendimiento de élite sea 50 veces más barato, es lógico suponer que su investigación de frontera, aquella que no tiene límites de presupuesto, está operando a niveles que simplemente no podemos concebir.
Una carrera de dos velocidades
El ascenso de GPT-5 Pro al trono público de los benchmarks es un evento histórico. Señala la llegada de una nueva generación de modelos con una capacidad de razonamiento abstracto que los acerca cada vez más a la inteligencia general. Sin embargo, el fantasma de o3-preview
nos recuerda que estamos presenciando una carrera de dos velocidades.
Por un lado, está la frontera pública: modelos como GPT-5 Pro que representan el equilibrio perfecto entre un rendimiento extraordinario y una viabilidad económica que permite su despliegue a escala global. Por otro, está la frontera oculta, el verdadero «estado del arte» que opera con costos prohibitivos pero que anticipa lo que veremos en el mercado dentro de uno o dos años.
El nuevo rey ha sido coronado, y sus capacidades son asombrosas. Pero el verdadero poder, el que define el futuro a largo plazo, sigue residiendo en los fantasmas que habitan en la máquina, recordándonos que lo que vemos es solo una pequeña fracción de lo que ya es posible.