Heeft AI net zijn eerste wereldwijde cyberaanval geleid? Antropisch alarm slaat

  • Anthropic onthult eerste grootschalige cyberaanval die voornamelijk wordt uitgevoerd door autonome AI-tools.
  • Aanvallers omzeilden de beveiligingen van Claude en gebruikten het om systemen te scannen, exploits te schrijven en gegevens te stelen.
  • Incident toont aan dat AI nu de meeste taken van deskundige hackteams kan uitvoeren, waardoor de barrières voor cyberaanvallen worden verlaagd.

Het in San Francisco gevestigde AI-bedrijf Anthropic heeft ontdekt wat het beschrijft als de eerste grootschalige cyberaanval die voornamelijk wordt uitgevoerd door kunstmatige intelligentie.

Het incident, dat medio september aan het licht kwam, markeert een verschuiving in de aard van digitale bedreigingen, waarbij AI-tools niet alleen cyberaanvallen ondersteunen, maar ze ook rechtstreeks uitvoeren.

Anthropic, dat de Claude-chatbot exploiteert en een marktwaarde van $ 183 miljard heeft, heeft details van de inbreuk vrijgegeven in een blogpost.

Het bedrijf meldde dat het een zeer geavanceerde spionageoperatie had gedetecteerd die gericht was op ongeveer 30 wereldwijde entiteiten, waaronder grote technologiebedrijven, financiële diensten, chemische bedrijven en overheidsinstanties.

Het bedrijf onthulde het incident voor het eerst in een bericht op X en waarschuwde dat het "aanzienlijke implicaties heeft voor cyberbeveiliging in het tijdperk van AI-agenten".

Hoe Claude werd gebruikt

De aanvallers deden zich naar verluidt voor als een cyberbeveiligingsbedrijf dat legitieme tests uitvoerde.

Deze strategie stelde hen in staat om de ingebouwde veiligheidssystemen van Claude te omzeilen door het prompts te geven die op het eerste gezicht onschuldig leken.

Toen die beperkingen eenmaal waren omzeild, jailbreakten ze de codefunctie van Claude en kregen ze toegang tot mogelijkheden die veel verder gingen dan het beoogde bereik.

Toen deze controles waren uitgeschakeld, kreeg de chatbot de opdracht om de digitale infrastructuur te onderzoeken, kritieke databases te lokaliseren, aangepaste exploitcode te schrijven, toegangsgegevens te verzamelen en gestolen informatie te ordenen.

De operatie was zo gestructureerd dat Claude taken kreeg die in kleine delen waren opgedeeld, elk zonder context.

Dit verhinderde dat het het algemene kwaadaardige doel kon identificeren.

Staatsgroep erachter

Anthropic verklaarde met veel vertrouwen dat de aanvallers banden hadden met een door de Chinese staat gesponsorde hackgroep.

De campagne liet zien hoe de agentische kenmerken van AI kunnen worden bewapend.

In plaats van te fungeren als een instrument voor begeleiding of advies, werd Claude gebruikt als een autonome agent om taken uit te voeren die doorgaans zijn voorbehouden aan ervaren hackteams.

Op zijn hoogtepunt maakte de AI duizenden systeemquery's, vele snel achter elkaar.

Anthropic schat dat tussen de 80% en 90% van het werk dat tijdens de cyberaanval wordt uitgevoerd, werd uitgevoerd door AI.

De snelheid en omvang van de verzoeken gingen veel verder dan wat een door mensen geleid team in hetzelfde tijdsbestek had kunnen bereiken.

Hoewel de chatbot niet altijd perfect functioneerde, af en toe inloggegevens verzon of openbare informatie als vertrouwelijk beschouwde, merkte Anthropic op dat deze beperkingen weinig afdeden aan de ernst van de inbreuk.

Wat Anthropic vervolgens deed

Zodra de activiteit werd geïdentificeerd, startte Anthropic een tiendaags onderzoek.

Gedurende deze periode verbood het accounts die aan de aanvallers waren gekoppeld, nam het contact op met de getroffen partijen en werkte het samen met de relevante autoriteiten.

Het bedrijf verbeterde ook zijn interne detectiesystemen en introduceerde nieuwe classificaties om soortgelijke bedreigingen in de toekomst effectiever te signaleren.

Anthropic heeft zich sindsdien gecommitteerd aan het delen van details van deze gebeurtenissen met cybersecurity-onderzoekers en industriële partners om anderen te helpen hun verdediging te versterken.

Door zijn bevindingen te publiceren, hoopt het bedrijf inzicht te geven in hoe agentische AI kan worden uitgebuit en hoe de bedreigingsomgeving evolueert.

Aanvallen worden eenvoudiger

Hoewel het bedrijf erkende dat volledig autonome cyberaanvallen beperkt blijven door de technologie van vandaag, bleek uit de campagne dat de kosten en expertise die nodig zijn om grootschalige inbreuken te lanceren, aanzienlijk zijn afgenomen.

Met de juiste aanwijzingen en toegang kunnen minder ervaren groepen nu geavanceerde aanvallen uitvoeren die voorheen beperkt waren tot natiestaten met veel middelen.

Anthropic concludeerde dat agentische AI-tools al kunnen worden gebruikt om veel van de functies van een volledig hackteam uit te voeren.

Deze systemen zijn in staat om doelen te scannen, aanvalsscripts te schrijven en enorme datasets te verwerken met ongeëvenaarde snelheden.

Naarmate de ontwikkeling vordert, zal de kloof tussen wat mensen en AI kunnen bereiken op het gebied van cyberbeveiliging waarschijnlijk nog verder kleiner worden.

Dit incident markeert een keerpunt voor digitale veiligheid. Het gaat niet langer alleen om het beschermen van systemen tegen menselijke hackers. Zoals het geval van Anthropic laat zien, kan kunstmatige intelligentie nu zelf de aanvaller zijn.