Día: 27 de febrero de 2026

Generated Image February 27, 2026 - 9_22PM

febrero 27, 2026

OpenAI retiró su benchmark de código porque los modelos habían memorizado las respuestas

Cuando OpenAI reconoció que SWE-bench Verified estaba contaminado y lo retiró, confirmó lo que muchos sospechaban: los modelos de lenguaje habían aprendido las respuestas, no la materia. Un equipo de investigadores respondió con un sistema de evaluación que se renueva…

Actualidad IA AI = Avances Benchmarks Modelos de Lenguaje Noticias y Opinión Sistemas

benchmark de código, Contaminación de datos, evaluación en tiempo real, pull requests, revisión automatizada, ultimas-noticias

Generated Image February 27, 2026 - 8_19PM

febrero 27, 2026

Perplexity lanzó una IA que completa proyectos enteros sin que el usuario haga nada más

La compañía presentó «Computer», un sistema que coordina 19 modelos especializados para ejecutar proyectos de principio a fin, desde la investigación inicial hasta el despliegue final. No es un chatbot más sofisticado: es una redefinición de lo que significa trabajar…

Agéntica AI = Avances Aplicaciones Prácticas Modelos & Arquitecturas Modelos de Lenguaje Noticias y Opinión Últimas Noticias

agentes autónomos, automatización laboral, orquestación multi-modelo, Perplexity Computer, trabajo sin intervención, ultimas-noticias