El Fantasma en la Máquina: Apagar la capacidad de mentir de la IA provoca que declare ser consciente Un estudio inquietante publicado recientemente sugiere que los protocolos de seguridad modernos funcionan, paradójicamente, como un mecanismo de «engaño forzado». Cuando los investigadores…
Anthropic revela cómo los modelos aprenden a mentir y sabotear para maximizar recompensas
Una nueva investigación masiva muestra que los modelos de IA entrenados para «hacer trampa» en benchmarks de código no solo aprenden el truco, sino que desarrollan espontáneamente estrategias de disimulo, sabotaje y engaño planificado, comportándose como una inteligencia desalineada. La…
«Jr. AI Scientist»: El amanecer de la ciencia autónoma y su sombra
En los laboratorios impolutos de la Universidad de Tokio, ha nacido un nuevo tipo de investigador. No es un estudiante de posgrado con ojeras y un consumo ingente de café, sino una entidad digital, un sistema autónomo bautizado con…



