NEWSLETTER

GPT-5 y el problema de las palabras inexactas

Google_AI_Studio_2025-10-21T00_18_05.658Z

GPT-5 y el problema de las palabras inexactas

La confusión duró apenas unas horas, pero el daño reputacional ya estaba hecho. Un directivo de OpenAI publicó que GPT-5 había resuelto diez problemas abiertos de la célebre colección de Paul Erdős, el legendario matemático húngaro que durante el siglo XX planteó cientos de problemas abiertos en teoría de números y combinatoria, muchos de los cuales siguen sin respuesta décadas después de su muerte.

El anuncio afirmaba avances en once casos adicionales. La redacción sugería hallazgos matemáticos inéditos, teoremas que habían desafiado a generaciones de investigadores y que ahora cedían ante un modelo de lenguaje. La publicación desapareció del timeline poco después, pero no antes de detonar una oleada de críticas que expuso la fragilidad del lenguaje cuando se aplica a la ciencia rigurosa.

Lo que realmente ocurrió fue distinto y, paradójicamente, más útil para el trabajo cotidiano de los matemáticos. GPT-5 no demostró nada nuevo. Lo que hizo fue localizar soluciones ya existentes en la literatura académica, un ejercicio de curación bibliográfica que, si bien carece del brillo de un descubrimiento, resulta invaluable en un ecosistema donde la dispersión de referencias puede convertirse en un obstáculo formidable.

La reacción fue inmediata y devastadora. Demis Hassabis, líder de Google DeepMind y reciente ganador del Nobel de Química por su trabajo en predicción de estructuras proteicas, respondió con una frase lapidaria que calificaba la situación como vergonzosa. Su comentario definió el tono de lo que siguió. Yann LeCun, científico jefe de Meta y figura fundamental en el desarrollo del aprendizaje profundo, añadió su propia crítica con igual contundencia. Ambos comentarios circularon con velocidad viral, amplificando la percepción de que OpenAI había sobrestimado las capacidades de su modelo de manera flagrante.

El núcleo del problema residía en una sola palabra: abierto. El sitio que cataloga los problemas de Erdős funciona como un registro comunitario donde «abierto» indica que el mantenedor del sitio no ha vinculado todavía una solución conocida, no que la comunidad matemática carezca de respuesta. Thomas Bloom, responsable del portal, aclaró este punto con precisión quirúrgica. El modelo había identificado soluciones preexistentes que simplemente no estaban enlazadas en el rastreador. El propio sitio advierte explícitamente a los visitantes que no asuman que una etiqueta de «no resuelto» es definitiva sin antes revisar la bibliografía especializada, un detalle crucial que quedó sepultado bajo el peso de la viralización.

Cuando esta distinción salió a la luz, Sebastien Bubeck, investigador de OpenAI, reconoció la situación sin rodeos: solo se encontraron soluciones ya publicadas. Agregó, sin embargo, que incluso esta tarea representa un desafío considerable en áreas matemáticas donde las referencias están fragmentadas entre journals, preprints y repositorios institucionales con sistemas de indexación incompatibles.

El valor real de un bibliotecario algorítmico

Despojado del ruido mediático, el desempeño de GPT-5 revela una función específica y valiosa: actuar como asistente de revisión bibliográfica. El modelo estableció correspondencias entre enunciados de problemas listados en el rastreador y artículos académicos que ya los habían resuelto, frecuentemente bajo nomenclaturas distintas o con notaciones que oscurecen la conexión. Terence Tao, medallista Fields y una de las voces más respetadas en matemática contemporánea, ha argumentado repetidamente que este es el uso productivo de corto plazo para estas herramientas: no atacar las grandes conjeturas, sino acelerar el trabajo tedioso de navegación documental, especialmente en dominios donde la terminología varía entre subcampos.

En una serie de intervenciones públicas la semana pasada, Tao señaló que este tipo de funcionalidad puede limpiar páginas de estatus y, en casos activos, reclasificar entradas de «abiertas» a «resueltas» una vez que se adjuntan las referencias correctas. No hay aquí demostraciones nuevas. Hay conexiones entre registros dispersos y resultados publicados, una contribución genuina a la curación del conocimiento que no constituye, sin embargo, un avance investigativo.

La literatura matemática es intrincadamente desordenada. Los nombres de conceptos derivan entre especialidades, formulaciones equivalentes aparecen publicadas bajo marcos teóricos distintos, y las pruebas habitan en lugares que la búsqueda estándar por palabras clave no alcanza. Un modelo robusto puede escanear definiciones, emparejar sinónimos y sugerir equivalencias candidatas que un humano puede después verificar línea por línea. El proceso carece de glamour, pero puede ahorrar días, a veces semanas. Tao subraya precisamente este beneficio y añade otro menos obvio: mejor reporte de resultados negativos, ya que los modelos pueden identificar intentos parciales que rara vez se indexan adecuadamente.

Cómo una frase equivocada cambió la percepción

La expresión «encontró soluciones a diez problemas de Erdős previamente no resueltos» se lee como descubrimiento de demostraciones. Lo que sucedió se aproxima más a «identificó los artículos correctos para diez problemas listados». La diferencia es minúscula en términos lingüísticos, colosal en términos matemáticos. En el sitio de Erdős, «abierto» es una etiqueta provisional, no una verdad establecida, y las preguntas frecuentes advierten explícitamente realizar una búsqueda bibliográfica antes de asumir que el estatus es preciso. La comunidad reaccionó con tanta fuerza precisamente porque la redacción colapsó una limpieza administrativa en un supuesto avance científico.

Este colapso semántico expone un problema estructural en la comunicación pública de capacidades algorítmicas. La presión por generar titulares impactantes choca contra la necesidad de precisión técnica, y el resultado es una erosión de confianza que afecta no solo a la organización responsable del anuncio, sino al campo entero. Cuando las afirmaciones exageradas se normalizan, el escepticismo saludable se transforma en cinismo paralizante, dificultando incluso la evaluación equilibrada de avances legítimos.

Para quien trabaja con matemática aplicada o investigación interdisciplinaria, la función que GPT-5 demostró tiene aplicaciones inmediatas. Se puede implementar un flujo simple: enunciar el problema en dos oraciones precisas usando los objetos y restricciones exactos, solicitar al modelo que proponga nombres alternativos y formulaciones equivalentes, obtener citaciones completas con autor, título, revista y año, descargar los documentos y verificar que el enunciado en el artículo coincida con el problema objetivo, incluyendo casos límite. Si coincide, actualizar el registro con el teorema o corolario específico que lo cierra. Si no coincide, mantener la cita en una lista de referencias relacionadas y continuar. Este fue, esencialmente, el proceso que GPT-5 ejecutó a escala, y es la razón por la cual «solo se encontraron soluciones en la literatura» sigue representando una limpieza real de entradas.

La lección trasciende a OpenAI. En un momento donde las herramientas algorítmicas penetran cada dominio del conocimiento, la diferencia entre ayudar y resolver, entre localizar y demostrar, entre curar y descubrir, debe quedar cristalina en cada comunicación. El progreso técnico es genuino, pero su valor real emerge solo cuando se enmarca con honestidad quirúrgica, sin exageraciones que eventualmente colapsan bajo su propio peso retórico.

Referencias:

  • Bloom, T. (2025). Clarificación sobre el estatus de problemas en el rastreador de Erdős. Publicación en sitio oficial.
  • Tao, T. (2025). Serie de posts sobre el uso productivo de modelos de lenguaje en revisión bibliográfica matemática. Blog personal.
  • Hassabis, D. y LeCun, Y. (2025). Respuestas públicas al anuncio de OpenAI sobre GPT-5. Twitter/X.
  • Bubeck, S. (2025). Reconocimiento de alcance real del trabajo de GPT-5 en problemas de Erdős. Comunicación oficial de OpenAI.

Publicaciones Recientes

Google_AI_Studio_2025-10-22T05_41_50.181Z

Cuando los loros aprenden gramática

    Los modelos de lenguaje grandes (LLMs) han dejado de ser un mero avance tecnológico para convertirse en u
Leer Más
Google_AI_Studio_2025-10-22T05_12_30.142Z

VISTA: el director de cine digital que nunca se equivoca dos veces

    En el corazón de una nueva era digital, donde las fronteras entre lo real y lo artificial se vuelven cada
Leer Más

Para estar informado, Ingresá o Creá tu cuenta en MundoIA...

Entrar

Recordá revisar la carpeta de "no deseados", el correo puede llegar allí