En poco menos de diez años hemos construido una relación con la inteligencia artificial generativa basada fundamentalmente en la verborrea. Desde los primeros modelos de lenguaje hasta los gigantescos sistemas actuales como GPT-4 o Llama, la premisa operativa ha sido siempre…
HalloMTBench: la prueba que expuso las fallas de la traducción automática
Existe un abismo profundo entre lo que las máquinas parecen hacer y lo que realmente hacen cuando procesamos el lenguaje. Durante los últimos años, los modelos de lenguaje grandes han revolucionado la traducción automática con un desempeño que supera ostensiblemente…
Jueces de silicio, confianza humana: la nueva ciencia para hacer fiables las evaluaciones de la IA
Por un instante proyectemos a través de nuestra imaginación que un sistema de inteligencia artificial, uno de esos modelos de lenguaje gigantes que hoy dominan los titulares, debe juzgar la calidad de un resumen de noticias. No se trata de generar…



