Cuando OpenAI reconoció que SWE-bench Verified estaba contaminado y lo retiró, confirmó lo que muchos sospechaban: los modelos de lenguaje habían aprendido las respuestas, no la materia. Un equipo de investigadores respondió con un sistema de evaluación que se renueva…
Perplexity lanzó una IA que completa proyectos enteros sin que el usuario haga nada más
La compañía presentó «Computer», un sistema que coordina 19 modelos especializados para ejecutar proyectos de principio a fin, desde la investigación inicial hasta el despliegue final. No es un chatbot más sofisticado: es una redefinición de lo que significa trabajar…


