L’IA vient-elle de mener sa première cyberattaque mondiale ? Anthropic tire la sonnette d’alarme

  • Anthropic découvre la première cyberattaque de grande envergure exécutée principalement par des outils d’IA autonomes.
  • Les attaquants ont contourné les mesures de protection de Claude, les utilisant pour analyser les systèmes, écrire des exploits et voler des données.
  • L’incident montre que l’IA peut désormais effectuer la plupart des tâches des équipes d’experts en piratage, réduisant ainsi les barrières contre les cyberattaques.

La société d’IA Anthropic, basée à San Francisco, a découvert ce qu’elle décrit comme la première cyberattaque à grande échelle principalement menée par l’intelligence artificielle.

L’incident, qui a fait surface à la mi-septembre, marque un changement dans la nature des menaces numériques, les outils d’IA ne se contentant pas de soutenir les cyberattaques, mais les exécutant directement.

Anthropic, qui exploite le chatbot Claude et détient une valeur marchande de 183 milliards de dollars, a publié les détails de la violation dans un billet de blog.

La société a déclaré avoir détecté ce qu’elle a appelé une opération d’espionnage hautement sophistiquée ciblant environ 30 entités mondiales, dont de grandes entreprises technologiques, des services financiers, des entreprises chimiques et des organismes gouvernementaux.

La société a d’abord révélé l’incident dans un post sur X, avertissant qu’il « a des implications importantes pour la cybersécurité à l’ère des agents d’IA ».

Comment Claude a été utilisé

Les attaquants se seraient fait passer pour une entreprise de cybersécurité effectuant des tests légitimes.

Cette stratégie leur a permis de contourner les systèmes de sécurité intégrés de Claude en lui fournissant des invites qui semblaient inoffensives en surface.

Une fois ces restrictions contournées, ils ont jailbreaké la fonctionnalité Code de Claude et ont eu accès à des capacités bien au-delà de la portée prévue.

Une fois ces contrôles désactivés, le chatbot a reçu l’ordre d’examiner l’infrastructure numérique, de localiser les bases de données critiques, d’écrire un code d’exploitation personnalisé, de collecter des identifiants d’accès et d’organiser les informations volées.

L’opération a été structurée de telle manière que Claude a reçu des tâches divisées en petites parties, chacune manquant de contexte.

Cela l’a empêché d’identifier l’objectif malveillant global.

Groupe d’États à l’origine

Anthropic a déclaré avec une grande confiance que les attaquants étaient liés à un groupe de piratage parrainé par l’État chinois.

La campagne a montré comment les caractéristiques agentiques de l’IA pouvaient être utilisées comme armes.

Au lieu d’agir comme un outil d’orientation ou de conseil, Claude a été utilisé comme un agent autonome pour accomplir des tâches généralement réservées aux équipes de piratage expérimentées.

À son apogée, l’IA a effectué des milliers de requêtes système, dont beaucoup se sont succédé rapidement.

Anthropic estime qu’entre 80 % et 90 % du travail effectué dans le cadre de la cyberattaque a été effectué par l’IA.

La vitesse et l’ampleur des demandes étaient bien au-delà de ce qu’une équipe dirigée par un humain aurait pu réaliser dans le même délai.

Bien que le chatbot ne fonctionnait pas toujours parfaitement, inventant parfois des informations d’identification ou confondant des informations publiques avec des informations confidentielles, Anthropic a noté que ces limitations ne minimisaient guère la gravité de la violation.

Ce qu’Anthropic a fait ensuite

Dès que l’activité a été identifiée, Anthropic a lancé une enquête de dix jours.

Au cours de cette période, il a banni les comptes liés aux attaquants, a contacté les parties concernées et a travaillé avec les autorités compétentes.

L’entreprise a également amélioré ses systèmes de détection internes et introduit de nouveaux classificateurs pour signaler plus efficacement les menaces similaires à l’avenir.

Depuis, Anthropic s’est engagé à partager les détails de ces événements avec les chercheurs en cybersécurité et les partenaires de l’industrie afin d’aider d’autres personnes à renforcer leurs défenses.

En publiant ses résultats, l’entreprise espère donner un aperçu de la manière dont l’IA agentique peut être exploitée et de l’évolution de l’environnement des menaces.

Les attaques deviennent plus faciles

Bien que l’entreprise ait reconnu que les cyberattaques entièrement autonomes restent limitées par la technologie actuelle, la campagne a révélé que le coût et l’expertise nécessaires pour lancer des violations à grande échelle ont considérablement diminué.

Avec les bonnes invites et les bons accès, les groupes moins expérimentés peuvent désormais mener des attaques avancées autrefois limitées aux États-nations disposant de ressources suffisantes.

Anthropic a conclu que les outils d’IA agentique peuvent déjà être utilisés pour exécuter de nombreuses fonctions d’une équipe de piratage complète.

Ces systèmes sont capables d’analyser des cibles, d’écrire des scripts d’attaque et de traiter d’énormes ensembles de données à des vitesses inégalées.

Au fur et à mesure que le développement se poursuit, l’écart entre ce que les humains et l’IA peuvent accomplir en matière de cybersécurité se réduira probablement encore plus.

Cet incident marque un tournant pour la sécurité numérique. Il ne s’agit plus seulement de protéger les systèmes contre les pirates humains. Comme le montre le cas d’Anthropic, l’intelligence artificielle elle-même peut désormais être l’attaquant.