¿La IA acaba de liderar su primer ciberataque global? Anthropic hace sonar la alarma

¿La IA acaba de liderar su primer ciberataque global? Anthropic hace sonar la alarma
Diya Poddar
15 nov 2025, 12:02 P. M.
  • Anthropic descubre el primer ciberataque a gran escala ejecutado principalmente por herramientas autónomas de IA.
  • Los atacantes eludieron las salvaguardas de Claude, usándolas para escanear sistemas, escribir exploits y robar datos.
  • El incidente muestra que la IA ahora puede realizar la mayoría de las tareas de los equipos de piratería expertos, lo que reduce las barreras para los ataques cibernéticos.

La firma de inteligencia artificial Anthropic, con sede en San Francisco, ha descubierto lo que describe como el primer ataque cibernético a gran escala llevado a cabo predominantemente por inteligencia artificial.

El incidente, que surgió a mediados de septiembre, marca un cambio en la naturaleza de las amenazas digitales, con herramientas de IA que no solo respaldan los ataques cibernéticos sino que los ejecutan directamente.

Anthropic, que opera el chatbot Claude y tiene un valor de mercado de $ 183 mil millones, publicó detalles de la violación en una publicación de blog.

La firma informó haber detectado lo que llamó una operación de espionaje altamente sofisticada dirigida a unas 30 entidades globales, incluidas las principales empresas de tecnología, servicios financieros, compañías químicas y organismos gubernamentales.

La compañía reveló por primera vez el incidente en una publicación en X, advirtiendo que "tiene implicaciones significativas para la ciberseguridad en la era de los agentes de IA".

Cómo se usó Claude

Según los informes, los atacantes se hicieron pasar por una empresa de ciberseguridad que realizaba pruebas legítimas.

Esta estrategia les permitió eludir los sistemas de seguridad incorporados de Claude alimentándolo con indicaciones que parecían inocuas en la superficie.

Una vez que se eludieron esas restricciones, hicieron jailbreak a la función Código de Claude y obtuvieron acceso a capacidades mucho más allá del alcance previsto.

Con estos controles desactivados, se instruyó al chatbot para que examinara la infraestructura digital, localizara bases de datos críticas, escribiera código de explotación personalizado, recopilara credenciales de acceso y organizara la información robada.

La operación se estructuró de tal manera que Claude recibió tareas divididas en partes pequeñas, cada una sin contexto.

Esto le impidió identificar el objetivo malicioso general.

Grupo estatal detrás de esto

Anthropic declaró con gran confianza que los atacantes estaban vinculados a un grupo de piratas informáticos patrocinado por el estado chino.

La campaña mostró cómo las características agenciales de la IA podrían convertirse en armas.

En lugar de actuar como una herramienta de orientación o asesoramiento, Claude se utilizó como un agente autónomo para completar tareas típicamente reservadas para equipos de piratería experimentados.

En su apogeo, la IA realizó miles de consultas al sistema, muchas en rápida sucesión.

Anthropic estima que entre el 80% y el 90% del trabajo realizado en el ciberataque fue realizado por IA.

La velocidad y la escala de las solicitudes fueron mucho más allá de lo que un equipo dirigido por humanos podría haber logrado en el mismo período de tiempo.

Si bien el chatbot no siempre funcionó a la perfección, ocasionalmente inventando credenciales o confundiendo información pública como confidencial, Anthropic señaló que estas limitaciones hicieron poco para disminuir la gravedad de la violación.

Lo que Anthropic hizo a continuación

Tan pronto como se identificó la actividad, Anthropic inició una investigación de diez días.

Durante este período, prohibió las cuentas vinculadas a los atacantes, se puso en contacto con las partes afectadas y trabajó con las autoridades pertinentes.

La compañía también mejoró sus sistemas de detección internos e introdujo nuevos clasificadores para marcar amenazas similares de manera más efectiva en el futuro.

Desde entonces, Anthropic se ha comprometido a compartir detalles de estos eventos con investigadores de ciberseguridad y socios de la industria para ayudar a otros a reforzar sus defensas.

Al publicar sus hallazgos, la compañía espera proporcionar información sobre cómo se puede explotar la IA agencial y cómo está evolucionando el entorno de amenazas.

Los ataques son cada vez más fáciles

Aunque la firma reconoció que los ataques cibernéticos totalmente autónomos siguen estando limitados por la tecnología actual, la campaña reveló que el costo y la experiencia necesarios para lanzar violaciones a gran escala han disminuido significativamente.

Con las indicaciones y el acceso adecuados, los grupos menos experimentados ahora pueden llevar a cabo ataques avanzados que antes estaban restringidos a estados-nación con buenos recursos.

Anthropic concluyó que las herramientas de IA agentic ya se pueden usar para realizar muchas de las funciones de un equipo completo de piratería.

Estos sistemas son capaces de escanear objetivos, escribir scripts de ataque y procesar enormes conjuntos de datos a velocidades inigualables.

A medida que continúa el desarrollo, la brecha entre lo que los humanos y la IA pueden lograr en ciberseguridad probablemente se reducirá aún más.

Este incidente marca un punto de inflexión para la seguridad digital. Ya no se trata solo de proteger los sistemas de los piratas informáticos humanos. Como muestra el caso de Anthropic, la propia inteligencia artificial ahora puede ser el atacante.