Claude Mythos y la NSA: el clickbait vs lo que pasó

Hace unos días, scrolleando LinkedIn, me crucé con un titular que me frenó en seco: “La NSA revela que Mythos entró en casi todos los sistemas clasificados en horas”. Foto de un tipo aterrado, logo de Anthropic, formato de fuente seria. Y por un segundo me lo creí. Lo guardé para compartirlo.

Después hice lo que debí hacer primero: fui a leer las fuentes. Y resulta que la historia real es bastante distinta de la que me estaban vendiendo. Más interesante, además. Este post es eso: lo que de verdad pasó con Claude Mythos, dónde está el truco del titular, y el filtro que ahora uso para no volver a caer. Porque caí varias veces estos meses, no me hago el listo.

El titular que casi me trago

La imagen circulaba con estética de mercado de predicciones y una frase en mayúsculas:

🧠 ¿No sabes qué modelo de IA usar?

Intro a LLMs te da el criterio para elegir modelo por costo y caso de uso — y cierra con un test A/B real de 5 modelos en OpenRouter.

Ver el curso

“NSA REVEALS MYTHOS BROKE INTO ALMOST ALL CLASSIFIED SYSTEMS IN HOURS”

Traducido: la NSA reveló que Mythos entró en casi todos los sistemas clasificados en horas. Suena a película. Una IA que, sola, rompe la seguridad del organismo de inteligencia más temido del mundo en una tarde.

El problema no es que sea 100% mentira. Es que toma un hecho real, le arranca todos los matices, le cambia la fuente, y lo viste de noticia oficial. Vamos por partes.

Qué es Claude Mythos (el modelo real detrás del titular)

Mythos sí existe, no es un invento. Es un modelo de Anthropic de la clase más capaz que tienen, hermano de Claude Fable 5 (mismo modelo base, distinto nivel de candados). Está afinado para ciberseguridad y biología, y es bueno de verdad encontrando fallos de software.

Lo importante: no es un producto que cualquiera puede abrir y usar. Anthropic no lo liberó al público. Lo da con cuentagotas a un grupo chico de socios dentro de una iniciativa llamada Project Glasswing, pensada para encontrar y arreglar vulnerabilidades en el software crítico del mundo. Once empresas grandes adentro (Amazon, Apple, Google, Microsoft, Cisco, la Linux Foundation) más otras cuarenta. Cuesta US$10 por millón de tokens de entrada y US$50 de salida.

¿Qué logró de verdad? Esto es lo que la propia Anthropic documentó:

Encontró más de 10.000 vulnerabilidades de severidad alta o crítica en software open source. El 99% todavía sin parchear cuando lo reportaron.
Solo, sin ayuda humana después del primer pedido, encontró y explotó una falla de ejecución remota de código en FreeBSD que llevaba 17 años escondida.
En navegadores armó exploits funcionales donde modelos anteriores fallaban casi siempre.

Y acá viene el dato que ningún titular de pánico te cuenta, porque lo puso la misma Anthropic: contra el kernel de Linux, después de miles de intentos, no logró ningún exploit remoto. Solo escalada de privilegios local. Y sus demos de navegador corrieron en un entorno de prueba sin el sandbox ni las defensas reales que tendría un browser de verdad.

O sea: la herramienta es potentísima encontrando agujeros. Pero “encontrar agujeros en un laboratorio” y “entrar a una red blindada de producción” son dos cosas distintas. Guarda esa frase.

De dónde salió lo de la NSA

Acá está el truco. El titular dice “LA NSA REVELA”. La NSA no reveló nada.

Lo que pasó fue esto: el senador Mark Warner, vicepresidente del comité de inteligencia del Senado, comentó que el general Joshua Rudd (que dirige la NSA y el Cyber Command) le había dicho en privado que Mythos “entró en casi todos nuestros sistemas clasificados, no en semanas, sino en horas”. Eso lo recogió The Economist a mediados de junio.

Léelo de nuevo. No es la NSA hablando. Es un senador contando lo que un general le dijo en una conversación privada. Segunda mano. Sin transcript público, sin documento oficial, sin que ningún organismo lo confirme. La diferencia entre “la NSA reveló X” y “un señor dijo que otro señor le contó X” es enorme, y el titular la borra de un plumazo.

¿Y los que saben del tema? Lo bajaron a tierra rápido:

El propio periodista de The Economist que difundió la frase se retractó de la lectura literal: dijo que sería un error tomarla al pie de la letra y que se equivocó al no agregar matices.
Investigadores de seguridad apuntaron lo obvio: los sistemas clasificados serios están air-gapped, físicamente desconectados de internet. Una IA no “entra en horas” a una red que no tiene cable hacia afuera. Para mover algo ahí adentro necesitas a un humano metiendo un USB. Por diseño.
La lectura más sensata es que esto fue un ejercicio autorizado contra entornos que imitan esas redes, encontrando cadenas de vulnerabilidades. No un asalto real a la NSA de verdad.

El dato duro, el único incontestable de toda esta historia, es otro y casi nadie lo destacó: el Departamento de Comercio de Estados Unidos emitió una orden de control de exportación y Anthropic apagó Mythos y Fable 5 para todo el mundo alrededor del 12 de junio. Eso pasó. Es verificable. Es la parte realmente seria. Y quedó tapada por el meme del hackeo a la NSA.

Por qué casi caigo (y por qué tú también podrías)

Desarmé el titular y me quedó la receta a la vista. Es siempre la misma, y funciona porque ataca cómo leemos con el pulgar a mil por hora:

Agarran un hecho real. Mythos encuentra vulnerabilidades a una escala que asusta. Cierto.
Le arrancan los matices. Fuera el “en un entorno de prueba”, fuera el “falló contra Linux”, fuera el “no confirmado”.
Le cambian la fuente. “Un senador repitió un chisme privado” se convierte en “LA NSA REVELA”.
Lo visten de autoridad. Logo, formato de fuente seria, mayúsculas, y una foto de alguien con cara de terror.

El resultado es un titular técnicamente anclado en algo real, pero que dice algo que nadie confirmó. Y como tiene un pie en la verdad, tu cabeza lo deja pasar. A mí me pasó. La vergüenza dura poco, el aprendizaje queda.

Mi filtro de 30 segundos para no volver a tragármela

No necesitas ser experto en ciberseguridad. Tres preguntas antes de creer (o peor, antes de compartir):

¿Quién lo dice de verdad? Busca la fuente primaria. Si el rastro es “X dijo que Y le dijo”, ya baja el volumen. El chisme oficial sigue siendo chisme.
¿Dónde están los matices? Toda historia técnica real tiene “peros”. Si un titular es 100% catástrofe sin un solo matiz, no es que la realidad sea limpia: es que te la limpiaron a propósito.
¿Qué dice la fuente original? Anthropic publica sus reportes completos, con sus propios límites incluidos. Ir a leerlos toma cinco minutos. En este caso, la misma empresa te cuenta que su modelo falló contra Linux. Eso no aparece en ningún meme.

Cinco minutos en la fuente primaria desarman casi cualquier titular de pánico. El costo de no hacerlo es compartir humo y, peor, tomar decisiones con miedo en vez de con información.

La parte que sí da miedo (y por qué es buena noticia para ti)

No vine a decirte que todo es exageración y que duermas tranquilo. La historia real, sin inflar, ya es bastante fuerte: una IA encontró sola una falla crítica que estuvo 17 años escondida, y destapó más de diez mil vulnerabilidades graves en el software que usamos todos. Eso solo cambia las reglas de la ciberseguridad. No hace falta inventarle un asalto a la NSA.

Y ahí está el punto que repito siempre: la IA es lo suficientemente poderosa como para que no necesitemos venderla con miedo de más. El titular falso no te informa, te paraliza. El hecho real te da una ventaja, porque entiendes qué hace de verdad la herramienta y puedes usarla.

Como founder, ese es tu trabajo con cada noticia de IA que te explota en la cara: no asustarte con el titular, ir a ver qué hay debajo. El que entiende la herramienta toma mejores decisiones que el que la teme. Yo caí en el clickbait. La diferencia es que después fui a leer. Haz lo mismo y vas a estar adelante del 90% que solo comparte la captura.

Preguntas frecuentes

¿Qué es Claude Mythos?

Es un modelo de IA de Anthropic de la misma clase que Claude Fable 5, especializado en ciberseguridad y biología. No es de acceso público: se usa de forma restringida con socios seleccionados dentro de Project Glasswing. Cuesta US$10 por millón de tokens de entrada y US$50 por millón de salida.

¿Claude Mythos hackeó la NSA?

No está confirmado. La frase salió de un senador (Mark Warner) contando lo que un general le dijo en privado, no de un comunicado de la NSA. El periodista que lo difundió se retractó de la lectura literal y varios expertos la consideran implausible, porque los sistemas clasificados están aislados de internet (air-gapped). Lo que sí está confirmado es que Mythos encuentra vulnerabilidades de software a gran escala.

¿Cómo identificar una noticia falsa o exagerada sobre IA?

Tres preguntas de 30 segundos: ¿quién lo dice de verdad (fuente primaria o "alguien dijo que otro le dijo")?, ¿dónde están los matices (si no hay ninguno, sospechá)?, y ¿qué dice la fuente original? Ir a la fuente primaria (el blog de la empresa, el transcript) suele tomar cinco minutos y desarma el 90% de los titulares de pánico.