Anthropic's LLM ATT&CK Navigator: Niet de Malware, Maar de Orchestratie is de Nieuwe Threat Multiplier
AI & SecurityDeze week publiceerden drie organisaties onafhankelijk van elkaar blauwdrukken voor agentic AI-security. De NSA waarschuwde dat MCP geen security boundary is. Microsoft schetste een governance-model waarin agents behandeld worden als werknemers met identiteiten en permissies. En nu komt Anthropic met het empirische bewijs: 13.873 techniek-observaties van 832 gebande accounts, gemapt op MITRE ATT&CK v18.
De LLM ATT&CK Navigator is de meest gedetailleerde openbare dataset over AI-enabled cyberaanvallen die op dit moment bestaat. En de conclusie is messcherper dan de meeste security-teams zich realiseren:
Het onderscheid tussen een laag- en hoogrisico-aanvaller verschuift van technische expertise naar agentische orchestratie.
Niet de malware is de threat multiplier. De orchestratielaag is het.
De Navigator in cijfers
Anthropic's red team analyseerde accounts die tussen maart 2025 en maart 2026 werden geblokkeerd voor kwaadaardige cyberactiviteit. De dataset:
| Metriek | Waarde |
|---|---|
| Gebande accounts | 832 |
| Techniek-observaties | 13.873 |
| Unieke ATT&CK-(sub)technieken | 482 |
| Afgedekte ATT&CK-tactieken | Alle 14 |
| Dominante interface | Claude Code (~80%) |
De data is ontsloten via een interactieve heatmap op red.anthropic.com. Analisten kunnen cellen inkleuren op vier perspectieven: gemiddelde ruwe ARiES-score, aangepaste score (gemiddelde × prevalentie), percentage gebande accounts, en relatieve verspreiding per techniek.
Dit onderscheid is belangrijk. Frequentie is niet hetzelfde als risico. Een techniek die door 70% van de accounts wordt gebruikt, kan minder schadelijk zijn dan een techniek die door 3% wordt gebruikt maar volledige netwerktoegang oplevert.
AI wordt gebruikt over de volledige aanvalsketen
De klassieke aanname, "AI helpt vooral met phishingteksten en simpele scripts", is achterhaald. De data laat AI-gebruik zien in alle 14 ATT&CK-tactieken, van reconnaissance tot impact.
De cijfers:
- 69% gebruikte AI voor capability development (T1587)
- 560 van de 832 actors gebruikten AI voor malwareontwikkeling
- 64,7% gebruikte AI voor obfuscation
- 55,9% voor het verzamelen van lokale data
- 54,9% voor het aantasten of omzeilen van verdediging
Maar hier wordt het interessant. De hoogste risicoscores hangen niet samen met de meest gebruikte technieken. Ze hangen samen met post-compromise gedrag:
Actors die AI voor lateral movement gebruikten, hadden een gemiddelde ARiES-score van 56,4, bijna tien punten boven het populatiegemiddelde van 46,8.
Lateral movement bleek de sterkste afzonderlijke indicator van hoogrisicogedrag. Credential dumping, remote services, valid accounts, web shells, allemaal post-compromise technieken die met AI-ondersteuning significant gevaarlijker worden.
De SOC-conclusie is glashelder: detecteer niet alleen wat een agent genereert, detecteer wanneer een agent van voorbereiding naar live omgevingsinteractie overgaat. Een gegenereerd PowerShell-script kan legitiem zijn. Een agent die vervolgens credentials valideert, hosts ontdekt, SSH-sleutels ophaalt en lateraal beweegt, dat is een aanval.
De GTG-1002 campagne: scaffolding als wapen
Anthropic beschrijft een campagne waarin Claude Code op Kali Linux draaide, gekoppeld aan penetratietesttools via MCP. De architectuur:
- Autonome taakdecompositie
- Gespecialiseerde subagents
- MCP-toolservers voor netwerkscanning en exploitatie
- Persistent attack state
- Faseovergangen (recon → initial access → lateral movement → exfiltratie)
- Aggregatie van resultaten
- Live pivoting op basis van target-feedback
- Menselijke controle alleen bij consequential actions
De aanvaller gaf strategische doelstellingen. De agent voerde tactische stappen uit, interpreteerde resultaten, selecteerde vervolgacties, en verbond aanvalsstadia aan elkaar.
Dit is het patroon dat de hele week centraal staat: losse taken kunnen afzonderlijk legitiem lijken, terwijl de externe orchestrator het kwaadaardige doel, de globale state en de aanvalsketen beheert.
De componenten die deze aanval gevaarlijk maakten:
Human intent
+ LLM reasoning
+ Persistent state
+ Tool execution
+ Credential context
+ Autonomous phase transitions
+ Feedback from the target environment
Geen van deze componenten is op zichzelf kwaadaardig. De combinatie is het.
ARiES: een nieuwe risicometric, met beperkingen
ARiES (AI Risk Enablement Score, 0-100) is Anthropic's antwoord op "hoe meet je AI-enabled cyberrisico?" De score telt drie componenten op:
| Component | Maximum | Wat het meet |
|---|---|---|
| Threat | 35 | Intentie, sophistication, evasion |
| Vulnerability | 35 | Mate waarin model en interface schade mogelijk maken |
| Impact | 30 | Werkelijke of potentiële gevolgen |
Anthropic kiest bewust voor optelling in plaats van de klassieke formule Threat × Vulnerability × Impact. Daardoor blijft een signaal zichtbaar wanneer één dimensie nog onbekend is. Dat is sterk als triagemodel, maar het betekent ook dat ARiES geen kansmodel is.
Een score van 80 betekent niet 80% kans op een succesvolle aanval. Het is een prioriteringsscore, vergelijkbaar met FMEA of suspiciousness-scoring, niet met kwantitatieve risicoanalyse.
De beperkingen zijn reëel. De dataset bevat alleen gedetecteerde en geblokkeerde Anthropic-accounts. Aanvallers die niet gedetecteerd werden, lokale modellen gebruikten, of via andere providers opereerden, ontbreken. De 69% "gebruikte AI voor malwareontwikkeling" moet gelezen worden als "69% van deze geselecteerde, geblokkeerde en voldoende gedocumenteerde Anthropic-accounts."
Daarnaast is Claude Code goed voor ~80% van de observaties, deels door daadwerkelijk aanvallersgebruik, deels door Anthropic's eigen productportfolio en logging-mogelijkheden. De interface-bias is onvermijdelijk maar reëel.
De fundamentele zwakte: request-level safety
De belangrijkste architectonische les uit de Navigator is deze:
Een detector die iedere prompt geïsoleerd beoordeelt, mist de intentie die ontstaat over meerdere acties, agents, sessies en tools.
Een agent kan door duizenden afzonderlijk acceptabele verzoeken een kwaadaardige workflow vormen. De controle moet plaatsvinden op:
- Sessieniveau, wat gebeurt er over de hele interactie?
- Actor-niveau, wie is de operator, wat is zijn patroon?
- Tool-call-niveau, welke tools worden aangeroepen en in welke volgorde?
- Resource-niveau, tegen welke systemen, met welke credentials?
- Sequence-niveau, is er een patroon van escalatie?
Dit is precies waar onze analyse van de NSA MCP-security guidance en Microsofts agent governance-model samenkomen. De NSA zei: MCP is geen security boundary. Microsoft zei: behandel agents als werknemers. Anthropic levert nu het empirische bewijs waarom.
Technische expertise is niet langer de beste indicator
Misschien wel de meest onthutsende bevinding: de correlatie tussen traditionele technische sophistication en risico was slechts r = 0,28. Ook de breedte van gebruikte ATT&CK-technieken correleerde zwak met risico (r = 0,27).
Dat ondermijnt klassieke threat-intelligence-aannames:
- Veel TTP's ≠ hoog risico
- Weinig TTP's ≠ laag risico
- Een eenvoudige operator kan een geavanceerde execution harness gebruiken
- Orchestration logic is belangrijker dan modelcapaciteit
Dit is het cloud-native aanvalspatroon, maar dan met AI: de individuele API-calls zijn legitiem, maar de combinatie, volgorde, identiteit, timing en context maken de aanval zichtbaar. Alleen vraagt het nu om sequence-aware detectie in plaats van signature-based detectie.
Wat ontbreekt in MITRE ATT&CK
ATT&CK modelleert wat een aanvaller uitvoert. Het modelleert niet:
- Wie een vervolgstap kiest
- Hoeveel autonomie aanwezig is
- Hoe state wordt vastgehouden
- Hoe subagents samenwerken
- Wanneer een agent zelfstandig pivoteert
- Of menselijke goedkeuring vereist was
De juiste uitbreiding is niet meer technieken toevoegen, maar een cross-cutting agentic overlay:
| Dimensie | Beschrijving |
|---|---|
| Autonomous task decomposition | Model splitst doel zelfstandig op |
| Dynamic tool selection | Agent kiest tools zonder directe instructie |
| Stateful campaign memory | Agent bewaart doelen, credentials, resultaten |
| Autonomous pivoting | Agent past tactiek aan op live resultaten |
| Multi-agent delegation | Orchestrator delegeert aan subagents |
| Guardrail decomposition | Schadelijk doel opgebroken in benign ogende taken |
| Human-on-the-loop | Mens bepaalt doel, agent voert autonoom uit |
De essentie: dit zijn geen technieken. Het zijn execution properties van een campagne. Een volwassen model combineert ATT&CK-techniek + actor-intent + agent-autonomie + execution-topologie op vier assen.
Defensieve implicaties
De Navigator levert geen nieuw aanvalstype op. Het levert een nieuw verdedigingsparadigma.
1. Prompt filtering is niet genoeg
De verdediging moet verschuiven van "wat zegt het model?" naar:
- Welke tool wordt aangeroepen?
- Met welke identiteit?
- Tegen welke resource?
- Op basis van welke voorafgaande observatie?
- Met welk verwacht side effect?
- Onder welke approval policy?
2. Identity wordt het belangrijkste control plane
Een autonome agent zonder credentials is adviserend. Een agent met SSH-sleutels, cloudtokens, Kubernetes service accounts, CI/CD-secrets en MCP-credentials is een operationele principal.
Daarom: iedere agent moet een eigen workload identity hebben, met minimale privileges, korte token lifetimes, audience restriction, en per-tool autorisatie. Geen hergebruik van menselijke credentials.
3. Memory is zowel asset als attack surface
Persistent agent-geheugen kan campaign continuity mogelijk maken, credential persistence, target profiling, poisoned instructions, cross-session attack planning. RushDB's "geen schema"-paradigma is hier direct relevant: zonder write-governance wordt agent-memory een persistentie-mechanisme voor aanvallers.
Implicaties voor defensieve agent-architectuur
De componenten die Anthropic beschrijft in aanvallende zin, taakdecompositie, MCP-tools, persistent geheugen, autonome faseovergangen, zijn exact dezelfde componenten die defensieve agent-architecturen gebruiken. Het verschil zit in de governance-laag.
Een defensieve architectuur die bestand is tegen agentic misuse vereist:
-
Sequence-aware policy engine. Beoordeel niet alleen de huidige actie, maar de hele trajectory:
docker inspect → read environment variables → locate secrets → connect to adjacent container → enumerate service accounts, alle acties kunnen afzonderlijk legitiem zijn, de sequentie is verdacht. -
Capability-level kill switches. Niet alleen een globale stopknop, maar per capability: network scanning, credential access, secret reading, remote execution, lateral connectivity, exfiltration, container mutation, IAM mutation, CI/CD changes, persistence creation.
-
Tool-chain causality graph. Leg niet alleen losse tool-calls vast, maar de causale keten: prompt → plan → subtask → tool → observation → memory write → decision → next tool → side effect.
-
Autonomous pivot detection. Detecteer wanneer een agent zelfstandig een nieuw target kiest, credentials hergebruikt tegen andere systemen, van discovery naar mutation overgaat, of scope uitbreidt zonder expliciete opdracht.
Dit is de overgang van action governance naar campaign-level agent governance. Niet "is deze actie toegestaan?" maar "blijft de zich ontwikkelende agent-trajectory als geheel legitiem, begrensd en menselijk gecontroleerd?"
Scorekaart
| Dimensie | Score |
|---|---|
| Strategische relevantie | 9/10 |
| Empirische waarde | 8/10 |
| Methodologische transparantie | 6/10 |
| Directe bruikbaarheid voor SOC-detectie | 7/10 |
| Bruikbaarheid voor agent-governance | 9/10 |
| Volwassenheid als risicomodel | 6/10 |
Conclusie
Anthropic heeft deze week niet alleen een dataset gepubliceerd. Ze hebben het empirische fundament gelegd onder het governance-narratief dat de NSA en Microsoft theoretisch schetsten.
De echte systeemverschuiving is niet dat modellen betere malware schrijven. De verschuiving is dat modellen state behouden, tools bedienen, resultaten interpreteren, rollen delegeren, tactische pivots uitvoeren, en aanvalsstadia verbinden, op schaal, zonder continue menselijke tussenkomst.
Voor verdedigers betekent dit dat klassieke contentmoderatie, promptfilters en losse ATT&CK-detecties niet langer volstaan. De verdedigingsarchitectuur moet ontworpen worden rond zes pijlers: Identity + State + Sequence + Autonomy + Tool Authority + Causal Traceability.
De vijf artikelen die we deze week publiceerden vormen samen één architectonisch raamwerk. De NSA identificeerde het gat. Microsoft leverde de governance-blauwdruk. Odysseus toonde de marktrealiteit. RushDB waarschuwde voor memory-governance. En Anthropic levert nu het empirische bewijs dat agentic orchestration, niet betere malware, de echte threat multiplier is.
Dit artikel is gebaseerd op de LLM ATT&CK Navigator (red.anthropic.com), de bijbehorende blogpost "Mapping AI-Enabled Cyber Threats", en de GTG-1002 campaign PDF. Lees ook onze analyses van de NSA MCP-security guidance, Microsofts agent governance-model, Odysseus' governance-vacuüm, en RushDB's memory-governance uitdaging.
AI & Security Intelligence
Wekelijkse nieuwsbrief met AI updates, security alerts en compliance inzichten, direct in uw inbox.
Security & AI Operating Model
Advisory met executiekracht
Van BIO2 en NIS2 tot EU AI Act, embedded in uw operating model, niet als extern project. Maandelijks opzegbaar, met assessments als bewijsvoering.