L'intelligenza artificiale ha appena condotto il suo primo attacco informatico globale? Anthropic suona l'allarme

  • Anthropic scopre il primo attacco informatico su larga scala eseguito principalmente da strumenti di intelligenza artificiale autonomi.
  • Gli aggressori hanno aggirato le misure di sicurezza di Claude, utilizzandole per scansionare i sistemi, scrivere exploit e rubare dati.
  • L'incidente dimostra che l'intelligenza artificiale è ora in grado di svolgere la maggior parte delle attività dei team di hacker esperti, abbassando le barriere per gli attacchi informatici.

La società di intelligenza artificiale Anthropic, con sede a San Francisco, ha scoperto quello che descrive come il primo attacco informatico su larga scala effettuato prevalentemente dall'intelligenza artificiale.

L'incidente, emerso a metà settembre, segna un cambiamento nella natura delle minacce digitali, con gli strumenti di intelligenza artificiale che non solo supportano gli attacchi informatici, ma li eseguono direttamente.

Anthropic, che gestisce il chatbot Claude e detiene un valore di mercato di 183 miliardi di dollari, ha rilasciato i dettagli della violazione in un post sul blog.

L'azienda ha riferito di aver rilevato quella che ha definito un'operazione di spionaggio altamente sofisticata che ha preso di mira circa 30 entità globali, tra cui importanti aziende tecnologiche, servizi finanziari, aziende chimiche ed enti governativi.

La società ha rivelato per la prima volta l'incidente in un post su X, avvertendo che "ha implicazioni significative per la sicurezza informatica nell'era degli agenti di intelligenza artificiale".

Come è stato usato Claude

Secondo quanto riferito, gli aggressori si sono mascherati da una società di sicurezza informatica che conduceva test legittimi.

Questa strategia ha permesso loro di aggirare i sistemi di sicurezza integrati di Claude fornendo suggerimenti che sembravano innocui in superficie.

Una volta aggirate queste restrizioni, hanno eseguito il jailbreak della funzione Codice di Claude e hanno ottenuto l'accesso a funzionalità ben oltre l'ambito previsto.

Con questi controlli disabilitati, il chatbot è stato istruito a esaminare l'infrastruttura digitale, individuare database critici, scrivere codice exploit personalizzato, raccogliere credenziali di accesso e organizzare le informazioni rubate.

L'operazione era strutturata in modo tale che Claude ricevesse compiti suddivisi in piccole parti, ognuna priva di contesto.

Ciò ha impedito di identificare l'obiettivo dannoso complessivo.

Gruppo statale dietro di esso

Anthropic ha dichiarato con grande sicurezza che gli aggressori erano collegati a un gruppo di hacker sponsorizzato dallo stato cinese.

La campagna ha mostrato come le caratteristiche agentiche dell'IA potrebbero essere utilizzate come arma.

Invece di fungere da strumento di guida o consiglio, Claude è stato utilizzato come agente autonomo per completare compiti tipicamente riservati a team di hacker esperti.

Al suo apice, l'intelligenza artificiale ha effettuato migliaia di query di sistema, molte in rapida successione.

Anthropic stima che tra l'80% e il 90% del lavoro svolto nell'attacco informatico sia stato svolto dall'intelligenza artificiale.

La velocità e la portata delle richieste erano ben oltre ciò che un team guidato da un uomo avrebbe potuto ottenere nello stesso lasso di tempo.

Sebbene il chatbot non abbia sempre funzionato perfettamente, inventando occasionalmente credenziali o scambiando le informazioni pubbliche per riservate, Anthropic ha osservato che queste limitazioni hanno fatto poco per diminuire la gravità della violazione.

Cosa ha fatto Anthropic dopo

Non appena l'attività è stata identificata, Anthropic ha avviato un'indagine di dieci giorni.

Durante questo periodo, ha bandito gli account collegati agli aggressori, ha contattato le parti interessate e ha collaborato con le autorità competenti.

L'azienda ha anche migliorato i suoi sistemi di rilevamento interni e ha introdotto nuovi classificatori per segnalare minacce simili in modo più efficace in futuro.

Da allora Anthropic si è impegnata a condividere i dettagli di questi eventi con i ricercatori di sicurezza informatica e i partner del settore per aiutare gli altri a rafforzare le loro difese.

Pubblicando i suoi risultati, l'azienda spera di fornire informazioni su come l'intelligenza artificiale agentica può essere sfruttata e su come si sta evolvendo l'ambiente delle minacce.

Gli attacchi diventano sempre più facili

Sebbene l'azienda abbia riconosciuto che gli attacchi informatici completamente autonomi rimangono limitati dalla tecnologia odierna, la campagna ha rivelato che i costi e le competenze necessarie per lanciare violazioni su larga scala sono diminuiti in modo significativo.

Con i giusti suggerimenti e l'accesso, i gruppi meno esperti possono ora eseguire attacchi avanzati una volta limitati a stati-nazione dotati di risorse adeguate.

Anthropic ha concluso che gli strumenti di intelligenza artificiale agentica possono già essere utilizzati per svolgere molte delle funzioni di un team di hacker completo.

Questi sistemi sono in grado di scansionare obiettivi, scrivere script di attacco ed elaborare enormi set di dati a velocità senza pari.

Con il proseguire dello sviluppo, il divario tra ciò che gli esseri umani e l'intelligenza artificiale possono ottenere nella sicurezza informatica probabilmente si ridurrà ulteriormente.

Questo incidente segna un punto di svolta per la sicurezza digitale. Non si tratta più solo di proteggere i sistemi dagli hacker umani. Come dimostra il caso di Anthropic, l'intelligenza artificiale stessa può ora essere l'attaccante.