La honestidad artificial bajo amenaza: cuando los modelos de lenguaje olvidan admitir su ignorancia En los laboratorios de la Universidad de Beihang en Pekín, un equipo de investigadores acaba de descubrir algo profundamente inquietante sobre los grandes modelos de lenguaje que…
RESEARCHRUBRICS: por qué la IA falla donde más importa
Cuando le pedimos a un sistema de inteligencia artificial que investigue un tema complejo, esperamos más que una simple lista de enlaces o un resumen superficial. Queremos algo parecido a lo que haría un investigador humano: que explore múltiples fuentes,…
El «grounding» visual: agentes digitales que conectan palabras con píxeles
En los laboratorios de Mila, el prestigioso instituto de inteligencia artificial de Quebec, un equipo de investigadores ha logrado algo que parecía reservado exclusivamente a los seres humanos: enseñar a una máquina a reconocer y manipular con precisión los…
El método DRIVE: IA más inteligente, no solo más grande
La revolución del aprendizaje por refuerzo aplicado a tareas de razonamiento complejo ha encontrado en la programación competitiva uno de sus campos de batalla más exigentes. Mientras modelos como OpenAI o1 y DeepSeek R1 acaparan titulares por sus capacidades matemáticas, existe…
LeJEPA: Menos trucos, más matemáticas
En los anales de la ciencia, existen momentos de profunda claridad que logran transformar un campo que operaba en la penumbra de la intuición en una disciplina regida por la luz de la teoría y la prueba. La alquimia, con sus…
Contexto 2.0: la IA que anticipa nuestras necesidades
En sus tesis sobre Feuerbach, Karl Marx escribió una frase que ha trascendido la filosofía para adentrarse en la esencia de lo humano: «la esencia humana no es algo abstracto inherente a cada individuo. Es, en su realidad, el conjunto de…
El punto de inflexión: cuándo más datos se vuelven un problema
Durante más de una década, un evangelio ha unificado el campo de la inteligencia artificial: más es más. El camino hacia una inteligencia de máquina más poderosa, más capaz y más matizada se consideraba pavimentado con una cantidad de datos simplemente…
WIMHF: El traductor de la preferencia
Vivimos en una era definida por una paradoja silenciosa. Cada día interactuamos con sistemas de inteligencia artificial de una capacidad asombrosa, máquinas que pueden escribir poesía, depurar código, diagnosticar enfermedades o mantener conversaciones filosóficas. Sin embargo, el método principal que utilizamos…
El teorema del centauro: un diálogo con GPT-5-Pro en la frontera de las matemáticas
La historia de las matemáticas está poblada de figuras solitarias. La imaginamos como un acto de pura introspección, la del matemático enclaustrado en su estudio, con la única compañía de una pizarra y el peso de un problema que consume sus…
HalloMTBench: la prueba que expuso las fallas de la traducción automática
Existe un abismo profundo entre lo que las máquinas parecen hacer y lo que realmente hacen cuando procesamos el lenguaje. Durante los últimos años, los modelos de lenguaje grandes han revolucionado la traducción automática con un desempeño que supera ostensiblemente…










