Anthropic veta el acceso público a su nuevo modelo por su "peligrosa" capacidad de hackeo - Ciencia

En lugar de una comercialización abierta, Anthropic ha lanzado el denominado Proyecto Glasswing -que toma su nombre de la mariposa de alas de cristal que utiliza sus alas transparentes para ocultarse a plena vista-, un modelo de defensa en ciberseguridad a la que podrán acceder más de 40 organizaciones, entre las que figuran Amazon, Apple, Google, Microsoft, Nvidia, CrowdStrike, JPMorgan Chase, Cisco, Broadcom, Palo Alto Networks y la Linux Foundation.

El objetivo es que estos gigantes utilicen la potencia de Mythos para identificar y parchear vulnerabilidades en la infraestructura crítica de software antes de que actores malintencionados puedan explotarlas.

Durante las pruebas internas, Mythos demostró una capacidad autónoma -sin intervención humana, mas allá de escribir el prompt- para hallar fallos de seguridad en los principales sistemas operativos y navegadores web actuales.

Entre los hallazgos más sorprendentes, la IA detectó una vulnerabilidad en el sistema OpenBSD que había permanecido oculta durante 27 años, y otra en la biblioteca de vídeo FFmpeg que no había sido detectada tras cinco millones de pruebas automáticas en 16 años.

"La versión preliminar de Claude Mythos demuestra un salto cualitativo en estas capacidades de ciberseguridad: las vulnerabilidades que ha detectado han logrado, en algunos casos, eludir décadas de revisiones humanas y millones de pruebas de seguridad automatizadas", anotó Anthropic en un comunicado.

Los datos de rendimiento de Mythos marcan una ruptura con la progresión incremental vista hasta ahora en el sector. En el banco de pruebas SWE-bench Verified, el modelo alcanzó una puntuación del 93,9 %, mientras que en las olimpiadas matemáticas USAMO logró un 97,6 %, frente al 42,3 % que obtenían los modelos punteros hace solo unos meses.

El anuncio ha tenido un eco inmediato en Wall Street, sobre todo en las acciones de las principales firmas de ciberseguridad tradicional, como CrowdStrike y Palo Alto Networks, sufrieron caídas iniciales de entre el 5 % y el 11 %, ante el temor de los inversores de que una IA autónoma pueda hacer obsoletos los productos actuales.

No obstante, ambas compañías forman parte del Proyecto Glasswing, integrando ya esta tecnología en sus sistemas de defensa.

A finales del mes pasado, las acciones del sector de ciberseguridad sufrieron una caída después de que la revista Fortune sacara a la luz el borrador de una entrada de blog de Anthropic, en la que se revelaban las avanzadas capacidades cibernéticas del modelo, así como sus posibles riesgos.

Esta semana, según Bloomberg, el presidente de la Reserva Federal, Jerome Powell, y el secretario del Tesoro, Scott Bessent, se reunieron con los directores ejecutivos de los principales bancos de Estados Unidos -como Bank of America, Citigroup, Goldman Sachs, Morgan Stanley y Wells Fargo- para discutir los posibles riesgos cibernéticos planteados por el modelo Mythos de Anthropic.

De acuerdo con CNBC, la reunión es una señal de que las capacidades avanzadas de esta IA constituyen una preocupación prioritaria para la administración del presidente de Estados Unidos, Donald Trump, y podrían amenazar los cimientos del sistema financiero estadounidense.

La relación entre Anthropic y el Pentágono no pasa por su mejor momento, después de que la empresa de IA impugnara la reciente decisión del Departamento de Defensa (DoD) de catalogar su tecnología como un riesgo para la seguridad nacional en la cadena de suministro.

Pese a esta disputa pública, los medios especializados han informado que el DoD ha continuado utilizando la tecnología de Anthropic durante la guerra de Irán.