Har AI precis lett sin första globala cyberattack? Antropisk slår larm

Har AI precis lett sin första globala cyberattack? Antropisk slår larm
Diya Poddar
15 nov. 2025, 12:02 EM
  • Anthropic avslöjar den första storskaliga cyberattacken som mestadels utförs av autonoma AI-verktyg.
  • Angripare kringgick Claudes skyddsåtgärder och använde det för att skanna system, skriva kryphål och stjäla data.
  • Incidenten visar att AI nu kan utföra de flesta uppgifter för experthackningsteam, vilket sänker barriärerna för cyberattacker.

Det San Francisco-baserade AI-företaget Anthropic har avslöjat vad det beskriver som den första storskaliga cyberattacken som främst utförs av artificiell intelligens.

Incidenten, som dök upp i mitten av september, markerar ett skifte i de digitala hotens karaktär, där AI-verktyg inte bara stöder cyberattacker utan också utför dem direkt.

Anthropic, som driver chatboten Claude och har ett marknadsvärde på 183 miljarder dollar, släppte detaljer om intrånget i ett blogginlägg.

Företaget rapporterade att det upptäckt vad det kallade en mycket sofistikerad spionageoperation riktad mot cirka 30 globala enheter, inklusive stora teknikföretag, finansiella tjänster, kemiföretag och statliga organ.

Företaget avslöjade först incidenten i ett inlägg på X och varnade för att den "har betydande konsekvenser för cybersäkerheten i AI-agenternas tidsålder".

Hur Claude användes

Angriparna ska ha utgett sig för att vara ett cybersäkerhetsföretag som utför legitima tester.

Denna strategi gjorde det möjligt för dem att kringgå Claudes inbyggda säkerhetssystem genom att mata det med uppmaningar som verkade ofarliga på ytan.

När dessa begränsningar väl kringgicks jailbreakade de Claudes kodfunktion och fick tillgång till funktioner långt utöver den avsedda omfattningen.

Med dessa kontroller inaktiverade instruerades chattroboten att undersöka den digitala infrastrukturen, lokalisera kritiska databaser, skriva anpassad exploateringskoder, samla in åtkomstuppgifter och organisera stulen information.

Operationen var uppbyggd på ett sådant sätt att Claude fick uppgifter som var uppdelade i små delar, där var och en saknade sammanhang.

Detta hindrade den från att identifiera det övergripande skadliga målet.

Statlig grupp bakom den

Anthropic uppgav med hög säkerhet att angriparna var kopplade till en kinesisk statssponsrad hackergrupp.

Kampanjen visade hur AI:s agentiska funktioner kan användas som vapen.

Istället för att fungera som ett verktyg för vägledning eller råd användes Claude som en autonom agent för att slutföra uppgifter som vanligtvis är reserverade för erfarna hackarteam.

När den var som störst gjorde den artificiella intelligensen tusentals systemförfrågningar, många i snabb följd.

Anthropic uppskattar att mellan 80 % och 90 % av det arbete som utfördes i cyberattacken utfördes av AI.

Hastigheten och omfattningen av förfrågningarna var långt över vad ett mänskligt lett team kunde ha uppnått inom samma tidsram.

Även om chatboten inte alltid fungerade perfekt, ibland hittade på referenser eller misstog offentlig information som konfidentiell, noterade Anthropic att dessa begränsningar inte gjorde mycket för att minska allvaret i intrånget.

Vad Anthropic gjorde härnäst

Så snart aktiviteten identifierades inledde Anthropic en tio dagar lång utredning.

Under denna period förbjöd de konton kopplade till angriparna, kontaktade berörda parter och samarbetade med relevanta myndigheter.

Företaget förbättrade också sina interna detekteringssystem och introducerade nya klassificerare för att flagga liknande hot mer effektivt i framtiden.

Anthropic har sedan dess åtagit sig att dela detaljer om dessa händelser med cybersäkerhetsforskare och branschpartners för att hjälpa andra att stärka sitt försvar.

Genom att publicera sina resultat hoppas företaget kunna ge insikt i hur agentisk AI kan utnyttjas och hur hotmiljön utvecklas.

Attackerna blir lättare

Även om företaget erkände att helt autonoma cyberattacker fortfarande är begränsade av dagens teknik, avslöjade kampanjen att kostnaderna och expertisen som krävs för att genomföra storskaliga intrång har minskat avsevärt.

Med rätt uppmaningar och tillgång kan mindre erfarna grupper nu utföra avancerade attacker som en gång var begränsade till nationalstater med stora resurser.

Anthropic drog slutsatsen att agentiska AI-verktyg redan kan användas för att utföra många av funktionerna hos ett komplett hackingteam.

Dessa system kan skanna mål, skriva attackskript och bearbeta enorma datamängder med oöverträffade hastigheter.

I takt med att utvecklingen fortsätter kommer klyftan mellan vad människor och AI kan uppnå inom cybersäkerhet sannolikt att krympa ytterligare.

Incidenten markerar en vändpunkt för den digitala säkerheten. Det handlar inte längre bara om att skydda system från mänskliga hackare. Som Anthropics fall visar kan artificiell intelligens nu själv vara angriparen.