Mythos no debería leerse como otro lanzamiento ruidoso de una empresa que necesita titulares. Esa interpretación es cómoda, y en parte tentadora, porque Anthropic sabe narrar el peligro con precisión quirúrgica. Pero el centro del asunto es más duro: por primera vez hay evidencia suficiente para tratar la automatización avanzada de investigación ofensiva como un problema operativo inmediato, no como una hipótesis de laboratorio. El modelo no inaugura el ciberataque automatizado. Eso ya existía. Lo que cambia es la calidad del razonamiento, la paciencia para sostener cadenas largas y la capacidad de cerrar el tramo que separa una sospecha técnica de una prueba explotable.
Ese tramo era el territorio caro de los investigadores humanos. Un escáner tradicional podía señalar un fallo probable. Un fuzzer podía provocar un crash. Un equipo experto debía mirar el rastro, separar ruido de señal, reconstruir el camino hasta la explotación real y decidir si había una vulnerabilidad seria o una falsa alarma con buena cara. Mythos reduce esa distancia. Ahí está la ruptura. No en que encuentre bugs, sino en que puede razonar alrededor de ellos, probarlos, encadenarlos y, en ciertos casos, convertir piezas menores en una intrusión coherente.
Anthropic lo presentó dentro de Project Glasswing, una iniciativa con acceso restringido para empresas e instituciones que mantienen infraestructura crítica. La lista inicial incluye actores de peso: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. Ese elenco dice más que cualquier adjetivo. Nadie reúne a esa mesa para una simple demo de relaciones públicas. Tampoco alcanza para creer cada cifra sin matices, porque las compañías también venden percepción de liderazgo. La posición razonable es más incómoda: hay marketing, sí, pero el fenómeno que lo sostiene es real.
El bug dejó de ser escaso
La afirmación más importante de Anthropic no es que Mythos sea “peligroso”. Esa palabra ya está gastada. El dato que obliga a mirar dos veces es que el modelo encontró miles de vulnerabilidades de alta severidad, incluidas fallas en sistemas operativos y navegadores importantes. Según la propia empresa, algunas tenían diez o veinte años; una vulnerabilidad ya corregida en OpenBSD llevaba veintisiete años escondida en un sistema famoso por su cultura de seguridad. Ese ejemplo vale más que una estadística inflada, porque ataca una creencia silenciosa de la industria: que los proyectos más auditados ya solo contienen errores marginales. No. Contienen fallos difíciles, y ahora existe una herramienta capaz de buscarlos sin cansancio.
Mozilla ofreció el caso más concreto. En Firefox 150 corrigió 271 vulnerabilidades identificadas durante una evaluación inicial con Claude Mythos Preview. No es una cifra normal. La organización venía de una colaboración anterior con Claude Opus 4.6 que había ayudado a encontrar 22 bugs sensibles en Firefox 148. El salto no prueba que Mythos sea infalible, pero sí prueba algo más relevante: cuando el sistema se integra en una tubería de revisión seria, con humanos, pruebas y proceso de publicación, puede aumentar violentamente el volumen de hallazgos accionables.
El cambio de fondo: durante años la seguridad ofensiva dependió de una combinación rara de talento, tiempo y obsesión. Mythos no elimina esa combinación, pero la multiplica. Eso desplaza el problema desde la búsqueda hacia la digestión. La pregunta ya no es solo “cuántos fallos puede encontrar un equipo”, sino “cuántos puede absorber sin romper su propio proceso de ingeniería”.
Cloudflare fue más preciso que muchos comentaristas. Su equipo no describió a Mythos como una varita mágica, sino como una clase distinta de herramienta. La diferencia que observaron no fue la mera detección, sino la construcción de cadenas de explotación. Un ataque real rara vez depende de un único error espectacular. Suele armarse con piezas: una lectura indebida, una escritura parcial, una fuga de memoria, una primitiva que habilita otra, una ruta de entrada que parecía secundaria. El valor de Mythos aparece cuando une esas piezas y produce una prueba convincente. Un bug sin demostración es una hipótesis. Un bug con prueba de concepto empieza a competir por atención en una cola de parches.
Ahí está también su debilidad práctica. Un modelo que produce muchos hallazgos puede destruir a un equipo si no viene acompañado por una arquitectura de validación. Cloudflare lo dijo con una claridad rara en el mundo corporativo: apuntar un agente genérico a un repositorio grande y pedirle que “encuentre vulnerabilidades” es una mala forma de trabajar. El sistema divaga, se aferra a hipótesis débiles, llena la cola con sospechas y consume tiempo humano. La ganancia aparece cuando el modelo opera dentro de un arnés: tareas estrechas, agentes paralelos, revisión adversarial, deduplicación, pruebas reproducibles y trazabilidad hasta puntos realmente alcanzables por un atacante.
La prueba británica importa, pero no dice todo
El informe del AI Security Institute del Reino Unido es el punto externo más fuerte. AISI evaluó Claude Mythos Preview y concluyó que representa un avance claro frente a modelos anteriores. En tareas CTF de nivel experto, aquellas que ningún sistema podía completar antes de abril de 2025, Mythos alcanzó una tasa de éxito del 73 por ciento. El resultado que concentró más atención fue “The Last Ones”, una simulación de ataque corporativo de 32 pasos, desde reconocimiento inicial hasta toma completa de la red. AISI estimó que un experto humano necesitaría unas 20 horas para completarla. Mythos fue el primer modelo evaluado por el instituto que la resolvió de punta a punta, en 3 de 10 intentos, con un promedio de 22 pasos completados.
Ese resultado es serio. También tiene borde. La propia evaluación aclara que la simulación no equivale a comprometer una red bien defendida en condiciones reales. No había defensores activos, herramientas de detección funcionando como en una organización madura ni penalizaciones por acciones que en producción activarían alertas. Este matiz no reduce el hallazgo a humo. Lo vuelve más útil. Mythos no demostró que pueda derrotar sin ayuda a cualquier banco, hospital o ministerio. Demostró algo más concreto y suficiente para preocupar: puede sostener una cadena larga de acciones técnicas en un entorno vulnerable, con autonomía y rendimiento superior al de generaciones anteriores.
Conviene desconfiar de dos lecturas fáciles. La primera dice que todo es exageración de Anthropic. Es floja. Mozilla, Cloudflare y AISI no son extras contratados para decorar un comunicado. Sus observaciones apuntan en la misma dirección: hay una mejora cualitativa en investigación de vulnerabilidades asistida por modelos. La segunda lectura dice que Mythos inaugura una especie de apocalipsis automático. También es mala. Los resultados más alarmantes siguen dependiendo de acceso, infraestructura de prueba, andamiajes, presupuestos de tokens, validación humana y contextos cuidadosamente preparados. La amenaza no es un oráculo maligno que ataca desde el vacío. Es una fábrica de capacidad técnica que abarata trabajos antes reservados a especialistas escasos.
Eso es bastante grave sin necesidad de teatro.
La zona más débil de la narrativa de Anthropic está en la extrapolación. La empresa sostiene que modelos similares estarán más disponibles pronto, y esa predicción parece plausible. Pero no todos los hallazgos publicados permiten medir cuánto del salto pertenece al modelo y cuánto al sistema que lo rodea. Cloudflare insiste en el arnés. Anthropic también habla de herramientas, flujos y procesos. Algunos trabajos académicos recientes empujan en esa dirección: tal vez la verdadera unidad de poder no sea “el modelo” aislado, sino el conjunto formado por modelo, herramientas, memoria, ejecución, revisión y paralelización. Si eso es correcto, restringir Mythos ayuda, pero no alcanza. Otros actores pueden reproducir partes de la capacidad con modelos inferiores y mejor ingeniería alrededor.
El nuevo cuello de botella
Project Glasswing muestra una inversión curiosa. La seguridad informática siempre vivió con una carencia: faltaban ojos expertos para revisar código crítico. Mythos introduce el problema contrario. Empiezan a sobrar hallazgos. En su actualización inicial, Anthropic dijo que sus socios habían encontrado más de diez mil vulnerabilidades de alta o crítica severidad en software sistémico. También informó que, en más de mil proyectos open source escaneados, Mythos estimó 6.202 vulnerabilidades de alta o crítica severidad dentro de un conjunto total de 23.019. De las 1.752 evaluadas por firmas externas o por la propia compañía, el 90,6 por ciento fueron verdaderos positivos, y el 62,4 por ciento quedaron confirmadas como altas o críticas.
Esos porcentajes son fuertes, aunque no conviene tratarlos como ley universal. Dependen del conjunto de proyectos, del proceso de triage y de criterios de severidad. Lo que sí queda claro es el desplazamiento del costo. Antes el cuello de botella era encontrar. Ahora es verificar, informar, coordinar y corregir. Anthropic reconoció que algunos mantenedores pidieron bajar el ritmo de divulgaciones porque no podían procesarlas. Ese detalle vale oro: una herramienta de defensa puede convertirse en una carga si arroja más verdad de la que el ecosistema puede metabolizar.
La defensa rápida no basta
El reflejo natural será exigir parches más veloces. Tiene sentido, pero no resuelve lo central. Si las pruebas de regresión llevan un día, prometer una corrección en dos horas puede producir software más frágil. La respuesta real no es correr como pollo sin cabeza, sino rediseñar la arquitectura defensiva: aislar componentes, reducir privilegios, bloquear rutas de explotación, automatizar despliegues seguros y aceptar que el tiempo entre descubrimiento y parche se volvió una superficie de ataque.
El efecto más profundo de Mythos quizá no esté en los ataques espectaculares, sino en la humillación de una costumbre. Durante años, buena parte de la industria convivió con deuda técnica bajo una premisa tácita: muchos fallos eran demasiado difíciles de encontrar, demasiado caros de explotar o demasiado improbables para merecer urgencia. Esa premisa empieza a pudrirse. Si una máquina puede revisar grandes superficies de código, sostener hipótesis, generar pruebas y escalar hallazgos, la ignorancia deja de ser un refugio razonable. El software viejo no se vuelve peligroso porque Mythos exista. Era peligroso antes. Mythos solo baja la luz y muestra el piso lleno de vidrios.
La decisión de no publicarlo masivamente es defendible. No por paternalismo tecnológico, sino por asimetría temporal. Los defensores necesitan coordinación, presupuesto, permisos, pruebas y despliegues. Los atacantes necesitan una ruta que funcione. En una etapa de transición, liberar capacidad ofensiva de alto nivel antes de que las organizaciones puedan absorberla sería irresponsable. Pero esa restricción no debe confundirse con solución. El conocimiento operacional se filtra. Las técnicas se copian. Los arneses mejoran. Los modelos públicos avanzan. La ventana para blindar sistemas críticos probablemente sea breve.
Mythos no es el monstruo de la historia. Es el instrumento que revela que el castillo tenía demasiadas puertas sin cerrar. La pregunta incómoda no es si Anthropic exageró un poco para controlar el relato. Seguramente lo hizo. La pregunta que importa es otra: qué ocurre cuando la capacidad de encontrar vulnerabilidades se vuelve más barata que la capacidad humana de corregirlas. Esa inversión ya empezó. Y cuando una industria descubre que su recurso escaso dejó de ser el descubrimiento y pasó a ser el juicio, la coordinación y la reparación, no está ante una novedad de producto. Está ante un cambio de régimen.
Referencias
Anthropic. Project Glasswing: Securing critical software for the AI era.
Anthropic Frontier Red Team. Assessing Claude Mythos Preview’s cybersecurity capabilities.
Anthropic. Project Glasswing: An initial update.
AI Security Institute. Our evaluation of Claude Mythos Preview’s cyber capabilities.
Mozilla. The zero-days are numbered.
Mozilla Hacks. Behind the scenes hardening Firefox with Claude Mythos.
Cloudflare. Project Glasswing: what Mythos showed us.
Anthropic Institute. When AI builds itself.
David, Isaac y Gervais, Arthur. Benchmarking Mythos-Linked Bug Rediscovery. arXiv:2605.17416.



