El Center for AI Safety y Scale AI publicaron en Nature el benchmark mas dificil jamas disenado para LLMs: 2.500 preguntas creadas por casi 1.000 expertos de 50 paises que los modelos mas avanzados del mundo no pueden responder. GPT-4o…
Un error de evaluación está guiando el entrenamiento de modelos
La inteligencia artificial generativa se ha acostumbrado a ocupar el centro del escenario: escribe, resume, traduce, corrige, conversa. La parte menos visible del espectáculo, sin embargo, es la que decide si una mejora existe de verdad o solo se…
El tiempo, el límite de la IA
El tiempo roto: la peligrosa amnesia cronológica de la inteligencia artificial Una auditoría fundamental revela que los modelos de lenguaje fallan en el concepto más básico de la historia: la secuencia. Vivimos un idilio colectivo con las nuevas arquitecturas de…
De Motwani a ChatGPT: el legado de 50 años de algoritmos aleatorios
Una conexión sorprendente une los modelos de lenguaje más avanzados con los algoritmos aleatorios estudiados desde los años 40: el no determinismo intencional que caracteriza a sistemas como ChatGPT representa la aplicación práctica de principios matemáticos desarrollados durante décadas en…
«Empathic Prompting»: IA que lee emociones
Durante la última década, hemos aprendido a conversar con las máquinas. Lo que comenzó como un ejercicio de comandos rígidos, escribiendo instrucciones en terminales oscuras, ha florecido en un diálogo fluido con entidades incorpóreas. Hablamos con grandes modelos de lenguaje, los…
IA en equipo contra la alucinación
El Consorcio de la Razón En las últimas semanas, el mundo ha sido testigo de cómo Demis Hassabis, la mente detrás de Google DeepMind, recibía el Premio Nobel. Un reconocimiento que no solo celebra un logro en la predicción de la…
TRACE: El mapa que revela cómo «piensa» realmente la inteligencia artificial
Las inteligencias artificiales de hoy son capaces de componer música, depurar código informático complejo y debatir sobre filosofía. Sin embargo, si le hacemos una pregunta que un niño podría resolver en segundos, esta mente digital asombrosa puede entrar en…
Un estudio cuestiona el uso de ROUGE en la detección de alucinaciones de LLMs
Por Javier Ruiz, Periodista Especializado en Inteligencia Artificial y Tecnología Emergente, para Mundo IA El espejismo de la detección: por qué ROUGE engaña en las alucinaciones de los LLMs La publicación de un estudio en arXiv cuestiona la métrica más usada…
AgentFly y el método para escalar sin tocar el modelo
Por Benjamín Vidal, Periodista Especializado en Inteligencia Artificial y Ciencia y Datos, para Mundo IA Cómo escalar agentes sin tocar el modelo base Un equipo de UCL y Huawei Noah’s Ark presenta una arquitectura de agentes que mejora en operación…
Meta lanza Llama 4
Meta Presenta Llama 4: La Nueva Generación de IA que Redefine el Rendimiento El panorama de la inteligencia artificial está en constante evolución, y Meta acaba de dar un paso significativo con el anuncio de Llama 4. Esta nueva familia de…










