Generatieve AI voor de Publieke Sector.

1. Executive summary

Generatieve Artificiële Intelligentie (AI) biedt een transformatief potentieel voor de publieke sector, variërend van efficiëntieverbeteringen in casemanagement tot geavanceerde burgerinteractie. De adoptie ervan wordt echter niet primair beperkt door technologische capaciteiten, maar door de stringente juridische en ethische kaders van de Europese Unie. De kernprincipes van datasoevereiniteit, de bescherming van grondrechten en robuuste cybersecurity vormen de harde randvoorwaarden waarbinnen elke implementatie moet plaatsvinden. De fundamentele uitdaging is de veilige, verifieerbare en compliante operationalisering van deze technologie, waarbij het vertrouwen van de burger centraal staat. Dit rapport stelt vast dat een succesvolle strategie een ‘governance-first’ benadering vereist, waarbij investeringen in beleid, toezicht en technische waarborgen prevaleren boven de technologie zelf.

Inhoudsopgave

Key decision points

De implementatie van Generatieve AI dwingt publieke organisaties tot strategische keuzes op de volgende assen:

Soevereiniteit versus Capaciteit: Er bestaat een inherente spanning tussen het gebruik van state-of-the-art, vaak niet-EU-gebaseerde, propriëtaire modellen en de inzet van volledig soevereine, maar potentieel minder capabele, open-source alternatieven. De aanbeveling is een hybride strategie:
Gevoelige Data: Voor de verwerking van persoonsgegevens, en in het bijzonder bijzondere categorieën persoonsgegevens (AVG Art. 9), is de inzet van soeverein gehoste, open-source Small Language Models (SLM’s) de enige verdedigbare route.
Niet-Gevoelige Data: Voor publiek gerichte, niet-gevoelige taken kunnen zorgvuldig gescreende propriëtaire API’s worden overwogen, mits deze worden ondersteund door robuuste contractuele (bijv. Data Processing Addendum) en technische (bijv. end-to-end encryptie met klantbeheerde sleutels) waarborgen.
Investering in governance: De initiële en meest significante investering dient gericht te zijn op het vestigen van een robuust governancekader. Dit omvat de oprichting van een multidisciplinair AI Governance Committee, de ontwikkeling van een verplicht opleidingsprogramma voor alle betrokken rollen, en de implementatie van een ‘evaluatie-sluis’ (evals-gate) als verplichte kwaliteits- en compliancepoort voor elke AI-applicatie die in productie wordt genomen.
Prioritering van RAG: Retrieval-Augmented Generation (RAG) wordt geïdentificeerd als het meest levensvatbare en veilige startpunt voor de publieke sector. Dit patroon ‘grondt’ de antwoorden van het model in verifieerbare, interne kennisbronnen (bijv. beleidsdocumenten, wetteksten), wat het risico op hallucinaties significant mitigeert en de transparantie en traceerbaarheid van de output maximaliseert.1

Generatieve AI voor de Publieke Sector

Primary risico’s

De adoptie van Generatieve AI introduceert nieuwe en versterkte risico’s die proactief beheerst moeten worden:

Juridisch & compliance risico: Non-compliance met de GDPR/AVG, de EU AI Act en de Schrems II-jurisprudentie kan leiden tot substantiële boetes, operationele beperkingen en, belangrijker nog, een onherstelbaar verlies van publiek vertrouwen. Een significant risico is ‘compliance-washing’, waarbij leveranciers soevereiniteit claimen zonder de onderliggende juridische blootstelling aan extraterritoriale wetgeving (zoals FISA 702 en de CLOUD Act) adequaat te mitigeren.3
Security risico: De technologie creëert nieuwe aanvalsvectoren, waaronder geavanceerde prompt-injectie, databesmetting (data poisoning) van RAG-bronnen of fine-tuning datasets, en modeldiefstal. Deze risico’s bedreigen niet alleen het AI-model zelf, maar de gehele, vaak complexe, software- en datatoeleveringsketen.4
Operationeel risico: Een te grote afhankelijkheid van ‘black box’-modellen zonder adequate evaluatie en monitoring leidt tot onvoorspelbare prestaties. Modeldrift kan de kwaliteit van de dienstverlening ongemerkt degraderen. Daarnaast wordt de Total Cost of Ownership (TCO) van zelf-gehoste modellen vaak onderschat; deze wordt niet gedomineerd door hardware, maar door de hoge kosten van gespecialiseerd personeel.6

Quick wins & meetbare impact

Om op een gecontroleerde en waardevolle manier te starten, worden de volgende quick wins voorgesteld:

Intern kennismanagement (Implementatie binnen 30 dagen):
Initiatief: Implementeer een RAG-gebaseerde chatbot voor intern gebruik door ambtenaren. Deze draait op een soeverein gehoste SLM (bijv. Llama 3.1) en is gekoppeld aan een gecureerde, interne kennisbank (bijv. HR-beleid, IT-handleidingen, juridische richtlijnen).
Meetbare KPI’s:
Reductie van de gemiddelde zoektijd naar specifieke beleidsinformatie met 30%.
Feitelijkheidsscore van ≥95% met 100% citatiedekking voor alle antwoorden.
Ondersteuning bij opstellen en samenvatten (Implementatie binnen 90 dagen):
Initiatief: Bied een beveiligde, on-premise of in een soevereine cloud gehoste tool aan voor het samenvatten van openbare rapporten en het opstellen van concepten voor niet-gevoelige, interne en externe communicatie.
Meetbare KPI’s:
Reductie van de tijd besteed aan het samenvatten van documenten met 25%.
PII-lekkage (Personally Identifiable Information) van nul, afgedwongen door geautomatiseerde output-filters.

2. Methodologie en definities

Scoping en benadering

Dit rapport is opgesteld conform een strikte methodologie die gebaseerd is op drie kernprincipes: evidence-based, audit-ready, en zero trust default. Elke kernbewering is onderbouwd met verifieerbare bronnen [bron]. Alle aanbevolen architecturen en processen zijn ontworpen om reproduceerbaar en auditeerbaar te zijn, en gaan uit van een Zero Trust-beveiligingsmodel waarbij vertrouwen nooit impliciet is en altijd geverifieerd wordt. De inhoud is direct toepasbaar op beleidsvorming, architectuurontwerp en operationeel beheer binnen de context van de EU en de Nederlandse overheid.

Core definities

Een eenduidig begrippenkader is essentieel voor een effectieve discussie en beleidsvorming.

Generatieve AI versus Traditionele AI

Er bestaat een fundamenteel onderscheid tussen generatieve en traditionele AI.

Traditionele AI analyseert en interpreteert bestaande data om taken uit te voeren binnen vooraf gedefinieerde grenzen, zoals classificatie (bijv. spamdetectie), regressie (bijv. voorspellen van vastgoedprijzen) of clustering.7 Het doel is het verbeteren van efficiëntie, nauwkeurigheid en besluitvorming op basis van patronen in bekende data.9
Generatieve AI creëert nieuwe, synthetische content die niet eerder bestond, zoals tekst, afbeeldingen, softwarecode of muziek.8 Deze systemen leren de onderliggende patronen en structuren van de trainingsdata om originele, coherente outputs te genereren. Deze creatieve capaciteit introduceert fundamenteel nieuwe risico’s die bij traditionele AI niet of in mindere mate aanwezig zijn, zoals het fabriceren van feitelijk incorrecte informatie (hallucinatie) en het potentieel voor misbruik voor de creatie van desinformatie of deepfakes.11

Foundation Models, LLMs, en SLMs

Binnen het domein van Generatieve AI bestaat een hiërarchie van modeltypes.

Foundation Models (FMs): Dit zijn grootschalige, vooraf getrainde AI-modellen die als basis (foundation) dienen voor een breed scala aan gespecialiseerde taken. Een kenmerkend aspect is hun vaak multimodale karakter, wat betekent dat ze verschillende soorten data kunnen verwerken en genereren, zoals tekst, afbeeldingen en audio.13
Large Language Models (LLMs): Dit is een prominente subcategorie van FMs die gespecialiseerd is in het verwerken en genereren van menselijke taal. LLM’s worden gekenmerkt door hun enorme omvang, vaak met honderden miljarden of zelfs biljoenen parameters, en zijn getraind op zeer omvangrijke en diverse datasets, zoals een groot deel van het publieke internet.14 Voorbeelden zijn de GPT-serie van OpenAI en Gemini van Google.
Small Language Models (SLMs): Dit zijn taalmodellen met aanzienlijk minder parameters (variërend van enkele miljoenen tot enkele miljarden) dan LLM’s. SLM’s zijn efficiënter, vereisen minder rekenkracht en zijn daardoor geschikter voor on-premise of edge-implementaties.15 Door hun training op meer gecureerde, domeinspecifieke datasets, hebben ze vaak een lager risico op bias en zijn ze kosteneffectiever voor gespecialiseerde taken.14

Agents versus Agentic AI

De distinctie tussen agents en agentic AI is cruciaal, omdat het een fundamentele verschuiving in autonomie en controle impliceert, met verstrekkende gevolgen voor governance en risicobeheer.

Agents (of Tools): Dit zijn LLM-gebaseerde systemen die de capaciteit hebben om externe tools (zoals API’s, rekenmachines of zoekmachines) aan te roepen om een taak uit te voeren. De acties en de volgorde ervan worden doorgaans vooraf gedefinieerd of in een strikt gecontroleerde lus uitgevoerd, waarbij de mens de controle behoudt over het algehele proces (human-in-the-loop).
Agentic AI: Dit beschrijft AI-systemen die zijn ontworpen om autonoom beslissingen te nemen en acties te ondernemen om complexe doelen te bereiken met beperkt menselijk toezicht.10 Een agentic systeem reageert niet alleen op een prompt, maar kan proactief een meerstappenplan opstellen, uitvoeren en dynamisch aanpassen op basis van nieuwe informatie.17

Deze verschuiving van een reactief naar een proactief en autonoom paradigma is niet louter een technologische evolutie, maar een revolutie in governance. Waar traditionele software en AI-systemen voorspelbaar reageren op specifieke inputs, is het gedrag van een agentic systeem emergent en niet volledig deterministisch.17 Dit maakt traditionele, retrospectieve audits en controles onvoldoende. De governance voor agentic AI moet dynamisch zijn, met real-time monitoring, interventiemogelijkheden (zoals kill switches), en een identiteitsgedreven aanpak waarbij elke agent wordt behandeld als een unieke entiteit met eigen permissies en een onuitwisbaar audittrail.17 De juridische en ethische vraagstukken rondom aansprakelijkheid – wie is verantwoordelijk als een autonoom systeem een schadelijke beslissing neemt? – zijn complex en worden door de huidige wettelijke kaders nog niet volledig geadresseerd.20

3. Rolgebaseerde deep-dives

Deze sectie biedt gedetailleerde, uitvoerbare richtlijnen voor zes sleutelrollen binnen een Generatieve AI-project in de publieke sector. Elke rolbeschrijving volgt een vaste structuur (a t/m f) en dwingt de gedefinieerde drempelwaarden en artefacten af.

3.1 Data Scientist

a. Taken en Use Cases

De Data Scientist is verantwoordelijk voor de evaluatie, aanpassing en validatie van AI-modellen om te verzekeren dat deze effectief, eerlijk en veilig zijn binnen de publieke context.

Model evaluatie en selectie: Het systematisch evalueren van kandidaat-modellen (zowel open-source als propriëtair) aan de hand van publieke sector-specifieke benchmarks. Dit omvat niet alleen nauwkeurigheid, maar ook het testen op bias en eerlijkheid, met specifieke aandacht voor stereotypische outputs gerelateerd aan beschermde persoonskenmerken onder EU-wetgeving.21
Fine-Tuning van SLM’s: Het aanpassen van open-source SLM’s (bijv. Llama 3.1, Mistral) op domeinspecifieke, niet-gevoelige publieke data (bijv. geanonimiseerde jurisprudentie, beleidsnota’s) om de prestaties voor specifieke taken, zoals juridische samenvattingen of beleidsanalyse, te verbeteren.21
Synthetische data generatie: Het gebruik van generatieve modellen (bijv. GANs of diffusiemodellen voor tabeldata) om privacy-beschermende synthetische datasets te creëren. Deze datasets kunnen worden gebruikt voor het testen van systemen, het uitvoeren van onderzoek of het trainen van andere modellen, zonder gebruik te maken van echte persoonsgegevens, in lijn met de GDPR-principes van dataminimalisatie.23
Ontwikkeling van evaluatie-suites: Het creëren van ‘gold standard’ datasets en adversarial test sets om modellen rigoureus te testen op hallucinaties, PII-lekkage en bias, zowel voor als tijdens de productie.21

b. Technische aanpak

Tooling: Python, met frameworks als PyTorch of TensorFlow. Essentiële bibliotheken zijn Hugging Face Transformers voor modelinteractie, en LangChain of LlamaIndex voor het prototypen van RAG-systemen.21 MLflow wordt gebruikt voor het systematisch tracken van experimenten en modelversies.
Pipelines: Gebruik van MLOps-pipelines voor geautomatiseerde model-evaluatie en fine-tuning. Integratie met CI/CD-systemen om een her-evaluatie te triggeren bij de introductie van nieuwe modelversies of datasets.
Data: Strikte naleving van dataminimalisatie (AVG Art. 5). Voor fine-tuning wordt uitsluitend gebruikgemaakt van geanonimiseerde of gepseudonimiseerde data. Voor alle gebruikte trainings- en evaluatiedata worden Data Cards opgesteld die de herkomst, inhoud en potentiële vooroordelen documenteren.

c. Risico’s en mitigaties

Risico: Introductie van bias vanuit trainingsdata, wat leidt tot discriminerende uitkomsten en een schending van AVG Art. 5 en de eerlijkheidsprincipes van de EU AI Act.8
Mitigatie: Implementeer fairness-metrieken (bijv. demografische pariteit, gelijke kansen) in de evaluatie-suite. Gebruik tools voor het detecteren en mitigeren van bias in datasets vóór de training. Voer een verplichte DPIA uit voor elk model dat persoonsgegevens verwerkt.
Risico: “Memorization” door het model, wat kan leiden tot het lekken van gevoelige informatie uit de trainingsdata.
Mitigatie: Pas technieken zoals differentiële privacy toe tijdens het fine-tuning proces. Gebruik geautomatiseerde PII-detectiescanners op de modeloutputs als onderdeel van de evaluatie-harness.

d. Evals en KPI’s

Hallucinatiegraad: ≤1% op een gecureerde “gold standard” vraag-en-antwoord dataset. Gemeten via LLM-as-a-judge evaluatoren (bijv. Arize, Galileo) 32 of via handmatige beoordeling.
Bias Metrieken: De ongelijkheid in false positive/negative rates tussen beschermde groepen moet kleiner zijn dan 5%.
Feitelijkheid (RAG): ≥90% nauwkeurigheid ten opzichte van de brondocumenten.
PII-lekkage: 0 gedetecteerde gevallen in een testset van 10.000 adversarial prompts.

e. Runbook en SRE implicaties

Monitoring: Continue monitoring van modelprestatiemetrieken (nauwkeurigheid, bias) om modeldrift te detecteren. Gebruik van observability-platformen zoals WhyLabs voor geautomatiseerde driftdetectie.34
Incidentrespons: Indien de modelprestaties onder de gedefinieerde SLO’s zakken, wordt een geautomatiseerde alert naar het Data Science-team gestuurd. Het runbook beschrijft de stappen om het model opnieuw te evalueren ten opzichte van de gold standard dataset en, indien nodig, een hertrainingspijplijn te activeren.

f. Deliverables en checklists

Een volledig ingevulde Model Card voor elk productiemodel.
Een evaluatierapport voor de modelselectie, inclusief scores op alle KPI’s.
Een Data Card voor elke gebruikte dataset.
Een checklist voor de pre-fine-tuning data bias assessment.

3.2 Data engineer

a. Taken en Use Cases

De Data Engineer legt de fundering voor betrouwbare Generatieve AI-systemen door te zorgen voor robuuste en kwalitatief hoogwaardige datapijplijnen.

Data Ingestie Pijplijnen voor RAG: Het bouwen van schaalbare en robuuste pijplijnen voor het opnemen en verwerken van documenten (PDF’s, DOCX, webpagina’s) uit interne bronnen en deze transformeren naar een formaat dat geschikt is voor een vectordatabase.29
Vectorisatie en Indexering: Het beheren van het proces van het opdelen van documenten in ‘chunks’, het genereren van embeddings met een geselecteerd model, en het indexeren van deze vectoren in een vectordatabase (bijv. Pinecone, Weaviate, Chroma).35
Data governance en herkomst: Het waarborgen dat de datalijn (lineage) van bron tot vectorindex volledig traceerbaar is. Het implementeren van data-retentiebeleid dat in lijn is met de Archiefwet en de AVG.38
Anonimiseringspijplijnen: Het bouwen van geautomatiseerde pijplijnen die PII detecteren en redigeren of pseudonimiseren voordat datasets worden gebruikt voor model fine-tuning of RAG-indexering.

b. Technische aanpak

Tooling: Apache Spark of Beam voor grootschalige dataverwerking. Airflow of Prefect voor orchestratie. LangChain of LlamaIndex voor documentverwerkingscomponenten.29 Vectordatabases zoals Weaviate 36 of Pinecone.35
Architectuur: Een event-driven architectuur waarbij een nieuwe of bijgewerkte document in een bronsysteem (bijv. SharePoint) automatisch de ingestie- en herindexeringspijplijn activeert.
IaC: Gebruik van Terraform of Bicep om alle datainfrastructuurcomponenten als code te definiëren en te beheren, wat zorgt voor reproduceerbaarheid en versionering.

c. Risico’s en mitigaties

Risico: “Garbage in, garbage out” – lage kwaliteit of verouderde data in de RAG-kennisbank leidt tot onjuiste of misleidende modelantwoorden.
Mitigatie: Implementeer data-kwaliteitscontroles en validatiestappen in de ingestiepijplijn. Etablisseer een proces voor het versioneren en updaten van documenten in de vector store.
Risico: Een inefficiënte chunking- of embeddingstrategie leidt tot slechte retrieval-prestaties, waardoor het model niet de juiste context krijgt.
Mitigatie: Voer A/B-tests uit met verschillende chunkingstrategieën (bijv. recursive character splitting, semantische chunking) en embeddingmodellen. Monitor retrieval-metrieken zoals hit rate en Mean Reciprocal Rank (MRR).

d. Evals en KPI’s

Data Ingestie Latency: p95 latency van documentupdate tot beschikbaarheid in de vector store ≤5 minuten.
Pijplijn Uptime: ≥99.9%.
Data Kwaliteitsscore: <1% van de documenten die falen in de validatiechecks per batch.

e. Runbook en SRE implicaties

Monitoring: Monitor de gezondheid van de pijplijn (bijv. aantal verwerkte documenten, faalpercentages) en de prestaties van de vectordatabase (query latency, indexgrootte).
Rollback: In geval van een foutieve data-ingestiebatch, moet er een runbook zijn om de vectorindex terug te draaien naar de vorige stabiele versie.

f. Deliverables en Checklists

Terraform/Bicep-scripts voor de datainfrastructuur.
Data-flow diagrammen voor alle RAG-ingestiepijplijnen.
Checklist voor het toevoegen van een nieuwe databron aan het RAG-systeem.

3.3 Software engineer

a. Taken en Use Cases

De Software Engineer is verantwoordelijk voor de veilige en performante integratie van Generatieve AI-functionaliteit in applicaties voor de publieke sector.

Applicatie-integratie: Het integreren van LLM API’s of zelf-gehoste modellen in applicaties, zoals burgerportalen of interne zaaksystemen.
Bouwen van RAG Orchestration: Het schrijven van de applicatielogica die een gebruikersvraag aanneemt, relevante context ophaalt uit de vectordatabase, de aangevulde prompt samenstelt, het LLM aanroept en het antwoord verwerkt.39
API Gateway en Beveiliging: Het implementeren van een beveiligde API-gateway voor het beheren van de toegang tot het LLM, het afdwingen van rate limiting en het afhandelen van authenticatie en autorisatie.
Ontwikkeling van Agent Tools: Het bouwen van veilige, gesandboxte tools die een LLM-agent kan aanroepen om acties uit te voeren (bijv. een database bevragen, een agenda controleren).

b. Technische aanpak

Tooling: Backend-frameworks (bijv. Python met FastAPI, Java met Spring Boot), frontend-frameworks. Orchestratie-bibliotheken zoals LangChain en LlamaIndex.40 Een API Gateway zoals Kong of Azure API Management.
Architectuur: Een microservices-architectuur waarbij de GenAI-functionaliteit is ingekapseld in een dedicated service. Gebruik van asynchrone verwerking voor LLM-aanroepen die langer kunnen duren.
CI/CD: Volledig geautomatiseerde CI/CD-pijplijnen voor het testen en deployen van de applicatie, inclusief integratietesten voor de GenAI-componenten.

c. Risico’s en mitigaties

Risico: Onveilige Output Handling (OWASP LLM02) – De output van het LLM wordt direct doorgegeven aan downstream systemen (bijv. een databasequery), wat exploits mogelijk maakt.5
Mitigatie: Behandel alle LLM-output als onvertrouwde gebruikersinput. Sanitize en valideer alle outputs. Gebruik geparametriseerde queries en voer nooit door een LLM gegenereerde code uit zonder sandboxing en validatie.
Risico: Overmatige Autonomie (Excessive Agency, OWASP LLM06) – Agent-tools hebben te ruime permissies, wat kan leiden tot onbedoelde en potentieel schadelijke acties.42
Mitigatie: Pas het principe van ‘least privilege’ toe op alle agent-tools. Vereis human-in-the-loop bevestiging voor elke hoog-risico actie (bijv. het versturen van een e-mail, het wijzigen van een record). Sandbox de uitvoering van alle tools.

d. Evals en KPI’s

End-to-End Latency (p95): Voor een 2k token tekstgeneratietaak, ≤1200 ms.
API Foutpercentage: ≤0.1%.
Security: Nul kritieke kwetsbaarheden gedetecteerd door SAST/DAST-scans in de CI-pijplijn.

e. Runbook en SRE implicaties

Monitoring: Traceer requests door de gehele applicatiestack, van API-gateway tot vectordatabase en LLM, met behulp van correlatie-ID’s. Monitor tokengebruik en kosten per request.
Kill Switch: Implementeer een “kill switch” op het niveau van de API-gateway om de GenAI-functie onmiddellijk uit te schakelen in geval van een ernstig beveiligingsincident of uit de hand lopende kosten.

f. Deliverables en Checklists

OpenAPI-specificatie voor de API van de applicatie.
CI/CD-pijplijnconfiguratie (bijv. Jenkinsfile, GitHub Actions YAML).
Checklist voor de veilige ontwikkeling van agent-tools.

3.4 Site Reliability Engineer (SRE)

a. Taken en Use Cases

De SRE is de hoeder van de betrouwbaarheid, beschikbaarheid en prestaties van de productieve Generatieve AI-dienst.

Betrouwbaarheid en beschikbaarheid: Het waarborgen van de hoge beschikbaarheid en prestaties van de gehele GenAI-servicestack, inclusief zelf-gehoste modellen, vectordatabases en ondersteunende infrastructuur.43
Definiëren van SLO’s en error budgets: In samenwerking met stakeholders het definiëren en handhaven van Service Level Objectives (SLO’s) voor latency, beschikbaarheid en kwaliteit (bijv. hallucinatiegraad), en het beheren van het bijbehorende error budget.43
Capaciteitsplanning: Het plannen en provisioneren van de benodigde GPU-infrastructuur voor het zelf-hosten van modellen, rekening houdend met zowel trainings- als inferentieworkloads.
Incident management: Het leiden van het incidentresponsproces bij storingen of prestatiedegradatie van de GenAI-dienst.

b. Technische aanpak

Tooling: Kubernetes voor container-orchestratie, Prometheus/Grafana voor monitoring, OpenTelemetry voor tracing, en IaC (Terraform/Bicep) voor infrastructuurbeheer.44
Architectuur: Een high-availability setup voor zelf-gehoste modellen, verspreid over meerdere availability zones. Gebruik van GPU-geoptimaliseerde container-images en inferentieservers (bijv. NVIDIA Triton).
Automatisering: Het automatiseren van rollback-procedures, het schalen van inferentie-endpoints en incidentrespons-runbooks.45

c. Risico’s en mitigaties

Risico: Prestatieknelpunten in de inferentiepijplijn (bijv. GPU-verhongering, netwerklatentie) die leiden tot het schenden van SLO’s.
Mitigatie: Implementeer uitgebreide prestatiemonitoring om knelpunten te identificeren. Gebruik load balancing en auto-scaling om verkeerspieken op te vangen.
Risico: Kostenoverschrijdingen door inefficiënt resourcegebruik of onverwachte vraag.
Mitigatie: Implementeer kostenmonitoring en alerting. Gebruik waar mogelijk GPU-sharing en fractionalisatie. Stel harde limieten en quota in op de API-gateway.

d. Evals en KPI’s

Beschikbaarheid SLO: 99.9% (Error budget: 43.83 minuten/maand).
Latency SLO: p95 latency voor inferentie-requests ≤1200 ms.
MTTD (Mean Time to Detect): ≤2 minuten voor een P1-incident.
MTTR (Mean Time to Resolve): ≤15 minuten voor een P1-incident.

e. Runbook en SRE implicaties

Monitoring: Dashboards die SLO’s, error budgets, GPU-gebruik, geheugengebruik en kosten per model bijhouden.
Incidentrespons: Vooraf gedefinieerde runbooks voor veelvoorkomende storingen (bijv. crash van de modelserver, onbeschikbaarheid van de vectordatabase, latency-piek). Dit omvat escalatiepaden en communicatiesjablonen.
Rollback: Een geautomatiseerde procedure om terug te draaien naar een vorige stabiele modelversie als een nieuwe implementatie SLO-schendingen veroorzaakt.

f. Deliverables en Checklists

SLO/SLI-definitiedocument.
Incidentrespons-runbooks.
Capaciteitsplanningsrapport.
Post-mortem sjabloon.

3.5 Security specialist

a. Taken en Use Cases

De Security Specialist zorgt ervoor dat de GenAI-applicatie en de onderliggende infrastructuur voldoen aan de hoogste beveiligingsstandaarden en bestand zijn tegen zowel traditionele als AI-specifieke dreigingen.

Threat Modeling: Het uitvoeren van threat modeling-oefeningen voor de gehele GenAI-applicatiestack met behulp van frameworks als STRIDE (voor algemene dreigingen), LINDDUN (voor privacy-dreigingen) en MITRE ATLAS (voor AI-specifieke dreigingen).46
Supply Chain Security: Het implementeren en handhaven van beleid voor de beveiliging van de toeleveringsketen, inclusief het gebruik van Software Bill of Materials (SBOM) voor alle softwarecomponenten en Model BOMs voor AI-modellen. Het verplichten van artifact signing en herkomstcontroles.4
Red Teaming: Het uitvoeren van adversarial testing en red teaming-oefeningen om kwetsbaarheden zoals prompt-injectie, databesmetting en modelontwijking te identificeren.42
Security Architectuur Review: Het beoordelen en goedkeuren van de beveiligingsarchitectuur, inclusief sleutelbeheer, netwerkcontroles en toegangsbeleid.

b. Technische Aanpak

Tooling: SAST/DAST/SCA-scanners geïntegreerd in CI/CD-pijplijnen (bijv. Snyk, Checkmarx).44 Secrets management tools (bijv. HashiCorp Vault, Azure Key Vault). HSM’s voor sleutelopslag. Kwetsbaarheidsscanners.
Architectuur: Implementatie van een Zero Trust-architectuur met microsegmentatie, private networking (bijv. Azure Private Link, AWS PrivateLink) en strikte egress-controles.
Controls: Het afdwingen van het gebruik van BYOK/HYOK (Bring/Hold Your Own Key) voor alle data-encryptie. Implementatie van split-key encryptie voor zeer gevoelige data, waarbij de overheidsinstantie een deel van de sleutel bezit en de cloudprovider het andere.

c. Risico’s en Mitigaties

Risico: Prompt Injection (OWASP LLM01) die leidt tot data-exfiltratie of ongeautoriseerde acties.5
Mitigatie: Implementeer input-filtering en -sanering op de API-gateway. Gebruik gescheiden kanalen voor instructies (system prompt) en gebruikersdata. Dwing strikte, least-privilege toegangscontroles af op alle tools die het LLM kan aanroepen.
Risico: Supply Chain Vulnerabilities (OWASP LLM03) – het gebruik van een gecompromitteerd open-source model of afhankelijkheid.4
Mitigatie: Verplicht SBOMs en Model BOMs voor alle componenten. Scan alle artefacten op kwetsbaarheden. Gebruik vertrouwde model-hubs en verifieer model-signaturen.
Risico: Datalekkage via side-channels of door non-compliance met Schrems II bij gebruik van niet-EU clouddiensten.
Mitigatie: Dwing EU-dataresidentie af voor data en verwerking. Gebruik soevereine cloud-aanbiedingen.3 Implementeer sterke, end-to-end encryptie met door de klant beheerde sleutels die zijn opgeslagen in een EU-gebaseerde HSM. Blokkeer al het niet-essentiële egress-verkeer.

d. Evals en KPI’s

Jailbreak Succesratio: ≤0.5% op een suite van 1.000 adversarial prompts.
Tijd tot Herstel van Kritieke Kwetsbaarheden: <24 uur na detectie.
SBOM/Model BOM Dekking: 100% voor alle productiecomponenten.

e. Runbook en SRE Implicaties

Monitoring: SIEM-integratie voor alle beveiligingslogs. Alerts voor verdachte activiteitspatronen (bijv. hoog percentage afgewezen prompts, anomale API-aanroepen van een agent-tool).
Incidentrespons: Specifieke playbooks voor AI-gerelateerde incidenten, zoals een bevestigde prompt-injectieaanval of een lek van gevoelige data in de modeloutput.

f. Deliverables en Checklists

Threat model-document (STRIDE/LINDDUN/ATLAS).
Security referentiearchitectuur-diagram.
Inkoopchecklist voor externe AI-diensten.
Red team-rapportage.

3.6 Privacy Specialist / Functionaris Gegevensbescherming (FG)

a. Taken en Use Cases

De Privacy Specialist of FG waarborgt dat de GenAI-applicatie voldoet aan alle relevante privacywetgeving en de grondrechten van burgers respecteert.

DPIA en LIA: Het uitvoeren en goedkeuren van Gegevensbeschermingseffectbeoordelingen (DPIA’s) voor elk GenAI-systeem dat persoonsgegevens verwerkt, en Legitimate Interest Assessments (LIA’s) waar van toepassing.50
AVG-compliance: Het waarborgen dat de applicatie voldoet aan alle AVG-principes, met name rechtmatige grondslag (Art. 6), bijzondere categorieën (Art. 9), gegevensbescherming door ontwerp en door standaardinstellingen (Art. 25) 51, en verwerkersverplichtingen (Art. 28).
Data Transfer Assessments: Het uitvoeren van Data Transfer Impact Assessments (DTIA’s) voor elk gebruik van niet-EU-gebaseerde AI-diensten, rekening houdend met de Schrems II-jurisprudentie en risico’s van FISA 702 en de CLOUD Act.53
Rechten van Betrokkenen (DSR): Het ontwerpen en toezien op de implementatie van processen voor het afhandelen van DSR-verzoeken (inzage, rectificatie, wissing) voor data die in GenAI-systemen wordt gebruikt.

b. Technische Aanpak

Tooling: Privacy-enhancing technologies (PETs), tools voor data-ontdekking en -classificatie, consent management platforms.
Processen: Het opzetten van een duidelijk proces voor de beoordeling en goedkeuring van alle nieuwe GenAI-use cases. Het integreren van privacycontroles in de CI/CD-pijplijn (“Privacy as Code”).
Dataverwerking: Het verplichten van anonimisering of pseudonimisering voor alle persoonsgegevens die worden gebruikt bij training of fine-tuning. Het handhaven van strikte bewaartermijnen in lijn met de Archiefwet/Woo en de AVG.38

c. Risico’s en Mitigaties

Risico: Verwerking van persoonsgegevens zonder geldige wettelijke grondslag (AVG Art. 6) of verwerking van bijzondere categorieën data zonder te voldoen aan een voorwaarde uit Art. 9.31
Mitigatie: Een verplichte DPIA moet worden uitgevoerd om de wettelijke grondslag en noodzaak vast te stellen voordat een project start. Voor Art. 9-data (bijv. gezondheidsgegevens) moet expliciete toestemming of een andere geldige voorwaarde (bijv. zwaarwegend algemeen belang) gedocumenteerd en nageleefd worden.
Risico: Onvermogen om te voldoen aan het “recht op vergetelheid” omdat data diep verankerd is in een getraind model.
Mitigatie: Verbied waar mogelijk het gebruik van persoonsgegevens voor training/fine-tuning. Voor RAG-systemen is wissing eenvoudig: verwijder de data uit de bron en de vectorindex. Voor fine-tuned modellen, documenteer dat wissing uit het model zelf een volledige hertraining kan vereisen en beheer dit risico in de DPIA.
Risico: Onrechtmatige doorgifte van gegevens naar de VS via een cloudprovider die onderworpen is aan FISA 702.
Mitigatie: Verplicht het gebruik van EU Sovereign Cloud-oplossingen 3 of on-premise implementaties. Als een Amerikaanse provider onvermijdelijk is, implementeer dan aanvullende maatregelen: sterke, end-to-end encryptie met door de klant beheerde sleutels (BYOK/HYOK), en contractuele toezeggingen van de provider om dataverzoeken aan te vechten.

d. Evals en KPI’s

DPIA Voltooiing: 100% van de projecten die persoonsgegevens verwerken, heeft een goedgekeurde DPIA vóór de implementatie.
DSR Afhandeltijd: 95% van de DSR-verzoeken afgehandeld binnen de wettelijke termijn van 30 dagen.
PII in Logs: Nul gevallen van ongemaskeerde PII in applicatie- of systeemlogs.

e. Runbook en SRE Implicaties

Monitoring: Monitor en alarmeer op potentiële datalekken of privacy-incidenten.
Incidentrespons: Een specifiek datalek-responspan moet aanwezig zijn, in lijn met de 72-uurs meldingsplicht van de AVG.

f. Deliverables en Checklists

DPIA-sjabloon voor Generatieve AI-projecten.
Checklist voor AVG-compliance by design en by default.51
Verwerkersovereenkomst (DPA) sjabloon voor AI-dienstverleners.
DTIA-sjabloon voor niet-EU-diensten.

4. Technologieoverzicht per domein

Deze sectie biedt een gestructureerd overzicht van state-of-the-art Generatieve AI-oplossingen, gecategoriseerd per domein. De focus ligt op productierijpe, verifieerbare technologieën die relevant zijn voor de publieke sector. De markt voor Generatieve AI is duidelijk tweeledig. Voor tekst en code bestaat er een hiërarchie van zeer krachtige, propriëtaire modellen (zoals de GPT-serie van OpenAI 59, de Claude-serie van Anthropic 61, en Gemini van Google 63) naast steeds capabelere open-source alternatieven (zoals de Llama-serie van Meta 65 en modellen van Mistral 15). Voor andere modaliteiten zoals beeld en spraak is de markt meer gefragmenteerd, waarbij toonaangevende propriëtaire oplossingen (zoals Midjourney 66, DALL-E 3 67, en ElevenLabs 68) vaak nog een kwaliteitsvoordeel hebben. De keuze voor de publieke sector gaat daarom niet alleen over het selecteren van het ‘beste’ model, maar over het ‘meest compliante en geschikte’ model voor de specifieke use case en data-classificatie.

De volgende tabel biedt een geconsolideerd overzicht van het technologische landschap. Dit stelt besluitvormers in staat om de beschikbare opties te overzien en te begrijpen hoe deze componenten in een typische architectuur, zoals een RAG-pijplijn, samenkomen.

Tabel 4.1: Generatieve AI Technologielandschap

DomeinTop Oplossingen (Model)Provider/BronOpen/ClosedLicentieMaturityTypische Stack (RAG/Generatie)TekstGPT-4o, GPT-5OpenAIClosedProprietary APIProductionOpenAI API, Azure OpenAI ServiceClaude 3.5 SonnetAnthropicClosedProprietary APIProductionAnthropic API, Vertex AI, AWS BedrockGemini 2.5 ProGoogleClosedProprietary APIProductionVertex AI APILlama 3.1 (8B, 70B)MetaOpenLlama 3.1 Community 65ProductionSelf-hosted (vLLM), LangChain, WeaviateMistral Large, MixtralMistral AIOpen/ClosedApache 2.0 / ProprietaryProductionSelf-hosted/API, LangChain, PineconeBeeldDALL-E 3OpenAIClosedProprietary APIProductionOpenAI API, geïntegreerd in ChatGPT PlusMidjourney v6MidjourneyClosedProprietary ServiceProductionDiscord-gebaseerde serviceStable Diffusion 3.5Stability AIOpen (weights)Community/Enterprise 69ProductionSelf-hosted (ComfyUI), Replicate APIAdobe FireflyAdobeClosedProprietary (CC)ProductionGeïntegreerd in Adobe Creative CloudCodeGPT-4o, GPT-5OpenAIClosedProprietary APIProductionGitHub Copilot, OpenAI APIClaude 3.5 SonnetAnthropicClosedProprietary APIProductionAnthropic APIGemini Code AssistGoogleClosedProprietary ServiceProductionGoogle Cloud integratieCodestralMistral AIOpen (weights)Mistral AI Non-ProductionBetaSelf-hosted, Hugging FaceSpraak (TTS)Voice EngineOpenAIClosedProprietary APIProductionOpenAI TTS APIAmazon PollyAWSClosedProprietary APIProductionAWS SDKElevenLabs APIElevenLabsClosedProprietary APIProductionElevenLabs APICoqui TTS, XTTS-v2CoquiOpenMPL 2.0ProductionSelf-hosted, integratie met frameworksTabulairCTGAN, TabDDPMOpen SourceOpenMIT, Apache 2.0Research/Productionydata-synthetic library 25, IBM SDG 70Binary DiffusionNeurIPS 2024OpenN/AResearchResearch implementatie 71MultimodaalGPT-4oOpenAIClosedProprietary APIProductionOpenAI API 59Gemini 2.5 ProGoogleClosedProprietary APIProductionVertex AI API 64Claude 3.5 SonnetAnthropicClosedProprietary APIProductionAnthropic API 61

RAG architectuur en vector databases

Het RAG-framework is de meest kritische architectuurpatroon voor de publieke sector omdat het de antwoorden van een LLM verankert in externe, verifieerbare kennisbronnen. Dit reduceert hallucinaties en maakt het mogelijk om actuele informatie te gebruiken, in tegenstelling tot de statische kennis van een getraind model.1

De kerncomponenten van een RAG-systeem zijn:

Document Loader & Text Splitter: Deze componenten zijn verantwoordelijk voor het inlezen en opdelen van brondocumenten in behapbare ‘chunks’. Frameworks zoals LangChain en LlamaIndex bieden hiervoor gestandaardiseerde tools.29
Embedding Model: Dit model converteert de tekst-chunks naar numerieke vectoren die hun semantische betekenis representeren.
Vector Database: Een gespecialiseerde database die deze vectoren opslaat en indexeert voor efficiënte similariteitszoekopdrachten. Belangrijke opties zijn:
Pinecone: Een managed service, gericht op enterprise-gebruik met sterke prestaties.35
Weaviate: Een open-source optie die hybrid search (combinatie van vector- en keyword-search) ondersteunt en zowel self-hosted als managed beschikbaar is.36
Chroma: Een open-source (Apache 2.0) database met een focus op ontwikkelaarsvriendelijkheid, die lokaal of in de cloud kan draaien.37
Retriever: Deze component voert de zoekopdracht uit in de vectordatabase.
LLM: Het taalmodel dat de uiteindelijke, onderbouwde reactie genereert op basis van de vraag van de gebruiker en de opgehaalde context.

Evaluatie en observability

Continue evaluatie en monitoring zijn ononderhandelbaar voor productieve GenAI-systemen. LLMOps breidt traditionele MLOps uit met een specifieke focus op prompt management, het bijhouden van tokengebruik, en kwalitatieve metrieken die uniek zijn voor generatieve modellen.76

Essentiële tooling omvat:

Evaluatie Frameworks: Platformen zoals Vertex AI Evaluation Service 27, Galileo 33, en Arize AI 32 bieden metrieken voor het meten van hallucinaties, relevantie, toxiciteit en PII-lekkage.
Observability Platformen: Tools als Coralogix 28 en WhyLabs 34 zijn cruciaal voor het in real-time monitoren van latency, kosten, tokengebruik en modeldrift.

5. Closed versus Open Source

De keuze tussen propriëtaire (closed-source) en open-source modellen is geen eenvoudige technische of financiële afweging; het is een strategische beslissing over risicohouding, controle en lange-termijn onafhankelijkheid. Een closed-source SaaS-model besteedt de infrastructuur en het modelonderhoud uit, maar introduceert aanzienlijke risico’s op het gebied van datasoevereiniteit, vendor lock-in en gebrek aan transparantie.83 Een open-source, zelf-gehost model biedt maximale controle en soevereiniteit, maar legt de volledige last van beveiliging, betrouwbaarheid, compliance en operationele kosten (TCO) bij de publieke organisatie zelf.6

De volgende beslismatrix biedt een raamwerk om, afhankelijk van het scenario en de datagevoeligheid, een weloverwogen keuze te maken. De scores (0-5, waarbij 5 het meest wenselijk is) zijn gebaseerd op de analyse van de beschikbare bronnen en de specifieke context van de EU/NL publieke sector.

Tabel 5.1: Beslismatrix Generatieve AI Deployment Scenario’s

CriteriumSaaS (US Hyperscaler)SaaS (EU Sovereign Cloud)Private Cloud (Self-Hosted OS)On-Prem (Self-Hosted OS)Air-Gapped (Self-Hosted OS)Veiligheid34345Compliance (AVG/Schrems)13455TCO43211Performance (SotA)55333Wendbaarheid54321Leveranciersonafhankelijkheid12455Eindoordeel & Rationale****Niet aanbevolen voor persoonsgegevens. Hoge compliance-risico’s (CLOUD Act, FISA 702).3 Alleen geschikt voor niet-gevoelige, publieke data.Aanbevolen voor gereguleerde data. Biedt balans tussen performance en compliance, maar vereist diepgaande DTIA en validatie van soevereiniteitsclaims (e.g., Microsoft EU Data Boundary 87).Aanbevolen voor flexibiliteit. Goede balans tussen controle en beheersbaarheid. Vereist sterke MLOps/DevSecOps-capaciteiten. Compliance is hoog, maar afhankelijk van de implementatie.Aanbevolen voor zeer gevoelige data. Maximale controle en soevereiniteit. Hoogste TCO en operationele complexiteit.6 Vereist gespecialiseerd personeel.Niche voor staatsgeheimen. Alleen voor de hoogste classificatieniveaus. Biedt geen toegang tot updates of externe tools, wat de functionaliteit ernstig beperkt.

Total Cost of Ownership TCO

De Total Cost of Ownership (TCO) voor het zelf-hosten van een LLM wordt gedomineerd door de kosten voor gespecialiseerd personeel (MLOps/AI-engineers), die over een periode van 3 jaar de hardwarekosten aanzienlijk kunnen overstijgen.6 Een 8-GPU server kan een initiële investering van €400.000 vereisen, maar de jaarlijkse operationele kosten, inclusief personeel, kunnen oplopen tot meer dan €600.000. API-kosten, hoewel ogenschijnlijk laag per token (bijv. GPT-4o input kost circa $0.0025 per 1k tokens 89), kunnen exponentieel schalen bij intensief gebruik. Een vuistregel is dat bij een verwachte jaarlijkse API-uitgave van meer dan €500.000, een goed benutte, zelf-gehoste GPU-cluster bijna altijd kosteneffectiever is.86

Licentie impact

De keuze voor een open-source model vereist een zorgvuldige analyse van de licentievoorwaarden.

Permissieve licenties: Licenties zoals Apache 2.0 (gebruikt door Mistral) bieden grote flexibiliteit voor commercieel gebruik en aanpassingen, met minimale verplichtingen.90
Restrictieve ‘Community’ Licenties: De Llama 3.1 Community License, hoewel breed inzetbaar, bevat specifieke beperkingen. Zo is een aparte licentie van Meta vereist voor organisaties met meer dan 700 miljoen maandelijkse actieve gebruikers. Daarnaast zijn er strikte attributie-eisen, zoals het prominent vermelden van “Built with Llama” en het gebruik van “Llama” in de naam van afgeleide modellen.65
Propriëtaire Licenties: De gebruiksvoorwaarden van API-diensten moeten nauwgezet worden onderzocht op clausules met betrekking tot het gebruik van ingevoerde data voor modeltraining, intellectueel eigendom van de output, en beperkingen op het gebruik.92

6. Valkuilen en anti-patterns

Een succesvolle implementatie van Generatieve AI vereist proactieve herkenning en mitigatie van bekende faalmodi. Deze sectie beschrijft de meest voorkomende valkuilen en biedt concrete strategieën voor detectie en preventie.

Hallucinaties

Faalmodus: Het model genereert feitelijk onjuiste, misleidende of volledig verzonnen informatie, maar presenteert deze met een hoge mate van overtuiging. Binnen de publieke sector kan dit leiden tot incorrecte adviezen aan burgers, foutieve juridische analyses of gebrekkige beleidsbeslissingen.11
Detectie:
Metrieken: Gebruik van evaluatieplatformen (zoals Galileo of Arize) om de hallucinatiegraad te meten ten opzichte van een ‘ground truth’ dataset.32
Groundedness (RAG): Verifieer of de output van een RAG-systeem direct herleidbaar is tot de aangeleverde context. Dit wordt ook wel ‘context adherence’ of ‘chunk attribution’ genoemd.
Preventie:
RAG: De primaire strategie is het gebruik van Retrieval-Augmented Generation, wat het model dwingt zijn antwoorden te baseren op de verstrekte documenten in plaats van op zijn interne, statische kennis.1
Prompting: Implementeer strikte ‘system prompts’ die het model instrueren om expliciet aan te geven (“Ik weet het niet” of “De informatie is niet beschikbaar in de verstrekte bronnen”) wanneer een antwoord niet in de context te vinden is.

Prompt-Injectie (Jailbreaking)

Faalmodus: Een kwaadwillende gebruiker formuleert een input (prompt) die de ingebouwde veiligheidsmaatregelen van het model omzeilt. Dit kan het model dwingen om zijn oorspronkelijke instructies te negeren, wat kan leiden tot het genereren van schadelijke content, het onthullen van gevoelige systeeminformatie, of het uitvoeren van ongeautoriseerde acties via gekoppelde tools.5
Detectie:
Input Classificatie: Implementeer een ‘pre-flight check’ die inkomende prompts classificeert op de waarschijnlijkheid van een aanval.
Anomaliedetectie: Monitor de outputs en het gebruik van tools op afwijkende patronen die kunnen wijzen op een succesvolle injectie.
Preventie:
Security Gateway / Evals-sluis: Plaats een beveiligingsgateway voor het LLM die alle inputs valideert en saneert.
Scheiding van Instructie en Data: Gebruik geparametriseerde prompts of technieken die een strikte scheiding afdwingen tussen de (vertrouwde) systeeminstructies en de (onvertrouwde) gebruikersinput.
Least Privilege: Beperk de permissies van alle tools die het LLM kan aanroepen tot het absolute minimum dat nodig is voor hun functie.

Data lekken

Faalmodus: Het model neemt onbedoeld Persoonlijk Identificeerbare Informatie (PII) of andere gevoelige data op in zijn output. Deze data kan afkomstig zijn uit de trainingsdata (door ‘memorization’) of uit de context die in een RAG-systeem wordt aangeboden.
Detectie:
Output Scanning: Implementeer geautomatiseerde PII-scanners (bijv. gebaseerd op Named Entity Recognition-modellen) die alle modeloutputs controleren voordat deze aan de eindgebruiker worden getoond.
Preventie:
Input/Output Filtering: Pas PII-filtering toe op zowel de input als de output op het niveau van de API-gateway.
Data-anonimisering: Zorg ervoor dat alle brondata voor RAG-systemen of fine-tuning datasets adequaat zijn geanonimiseerd of gepseudonimiseerd.

Modeldrift

Faalmodus: De prestaties en betrouwbaarheid van het model nemen in de loop van de tijd af. Dit kan gebeuren omdat de distributie van de inputdata in de praktijk verandert (‘data drift’) of omdat de relatie tussen input en de gewenste output evolueert (‘concept drift’).
Detectie:
Continue Monitoring: Gebruik een observability-platform (zoals WhyLabs 34 of Coralogix) om de prestaties (nauwkeurigheid, latency, hallucinatiegraad) en de statistische eigenschappen van input- en outputdata continu te monitoren.
Preventie:
Periodieke Her-evaluatie: Evalueer het productiemodel periodiek opnieuw aan de hand van de ‘gold standard’ evaluatie-suite.
Hertraining/Fine-tuning: Implementeer een MLOps-strategie die het model periodiek her-traint of fine-tunet met nieuwe, representatieve data.
Kennisbank Updates (RAG): Zorg voor een continu proces om de kennisbank van RAG-systemen actueel te houden.

7. Security en privacy randvoorwaarden

De implementatie van Generatieve AI in de publieke sector vereist dat beveiliging en privacy niet als een toevoeging worden beschouwd, maar vanaf het begin in de architectuur worden verankerd. Dit moet gebeuren op basis van een Zero Trust-filosofie, waarbij geen enkele componentgebruiker, applicatie, model of data standaard wordt vertrouwd. Elke interactie moet expliciet worden geverifieerd, geautoriseerd en gemonitord. Traditionele perimeterbeveiliging is ontoereikend voor de complexe, API-gedreven en data-intensieve aard van GenAI-systemen.

Zero Trust referentiearchitectuur

De volgende architecturale principes zijn verplicht voor elke implementatie. Gedetailleerde diagrammen voor zowel een SaaS (via EU Sovereign Cloud) als een volledig soevereine (on-premise) opzet zijn opgenomen in Bijlage 1.

De kernpilaren van de architectuur zijn:

Identiteit: Sterke, op standaarden gebaseerde authenticatie voor alle gebruikers en services (OAuth2/OIDC).93 Machine-identiteiten voor AI-agents en microservices.
Endpoint: Beveiligde eindpunten voor gebruikers en volledig beheerde, geconfigureerde infrastructuur voor servers (afgedwongen via IaC).
Netwerk: Strikte microsegmentatie tussen componenten. Gebruik van private endpoints voor alle services (geen publieke IP-adressen). Egress-filtering met een ‘default-deny’ beleid om ongecontroleerde data-uitstroom te voorkomen.
Data: Data wordt bij de bron geclassificeerd. Encryptie is verplicht in alle stadia: at-rest (met BYOK/HYOK), in-transit (TLS 1.3+), en waar mogelijk in-use (via Confidential Computing).
Applicatie: Een beveiligde API-gateway fungeert als het enige toegangspunt. Deze gateway is verantwoordelijk voor authenticatie, autorisatie, inputvalidatie (tegen prompt-injectie) en output-scanning (voor PII-lekkage).
Zichtbaarheid & Analyse: Uitgebreide, onveranderlijke logging van alle requests, responses en tool-acties. Real-time monitoring op dreigingen en afwijkingen.

Dreigingsmodel (Threat Model)

Een systematische dreigingsanalyse is een verplichte stap in de ontwerpfase.

STRIDE/LINDDUN: Deze frameworks worden toegepast op de data-flow diagrammen van de RAG-architectuur om respectievelijk security- en privacy-dreigingen systematisch te identificeren.47
OWASP Top 10 for LLMs: Elk van de top 10 risico’s (bijv. Prompt Injection, Insecure Output Handling, Supply Chain Vulnerabilities) wordt expliciet gemapt op specifieke technische en procedurele controles in de referentiearchitectuur.5
MITRE ATLAS: Dit framework wordt gebruikt om de tactieken van tegenstanders specifiek gericht op AI-systemen te modelleren, zoals modelontwijking (evasion) of databesmetting (poisoning).46

Sleutelbeheer (Key Management)

Beleid: Alle encryptiesleutels die worden gebruikt voor het versleutelen van data van de publieke organisatie moeten onder de controle van die organisatie staan.
Implementatie: Gebruik van een dedicated Hardware Security Module (HSM), on-premise of cloud-gebaseerd (bijv. Azure Dedicated HSM), voor de opslag van root keys. Gebruik van een Key Management Service (KMS) (bijv. Azure Key Vault, AWS KMS) met een Bring Your Own Key (BYOK) model voor service-level sleutels. Implementeer een key escrow-beleid voor disaster recovery scenario’s.

Logging en Monitoring

Logplicht: In lijn met de Archiefwet, Woo en de EU AI Act moeten logs onveranderlijk (immutable), volledig en traceerbaar zijn en bewaard worden volgens de wettelijke termijnen.38 Voor hoog-risico AI-systemen onder de AI Act moeten logs minimaal de gebruiksperiode, de geraadpleegde referentiedata, de inputdata en de identiteit van de menselijke beoordelaar vastleggen.97
Implementatie: Gecentraliseerde logging naar een SIEM-systeem. Alle logs moeten correlatie-ID’s bevatten om een enkele gebruikersaanvraag door alle microservices heen te kunnen volgen.

De volgende tabel verbindt de belangrijkste juridische kaders direct met de vereiste technische controles in de referentiearchitectuur, wat essentieel is voor een auditeerbare implementatie.

Tabel 7.1: Mapping van Juridische Kaders naar Technische Controls

Kader & Artikel/ControlVereisteTechnische Control(s) in ReferentiearchitectuurAVG Art. 25Data Protection by Design & DefaultPII scanning gateway, dataminimalisatie in pijplijnen, RBAC/ABAC op datastores, standaard private instellingen. 51AVG Art. 32Beveiliging van de verwerkingEnd-to-end encryptie (BYOK in HSM), private networking, vulnerability scanning in CI/CD, immutable infrastructure.EU AI Act Art. 12Logging voor Hoog-Risico SystemenOnveranderlijke, gecorreleerde logging van gebruiker, query, opgehaalde context, respons en menselijke feedback naar een veilige, geauditeerde log-opslag. 97EU AI Act Art. 15Nauwkeurigheid, robuustheid, cybersecurityAdversarial testing (red teaming), evaluatie-suite met nauwkeurigheidsdrempels, sandboxing van agent-tools, veilige codeerpraktijken.NIS2 Art. 21Cybersecurity RisicobeheerThreat modeling (STRIDE/ATLAS), supply chain security (SBOM), incident response plan, regelmatige kwetsbaarheidsbeoordelingen. 98BIO (Baseline)Risicogebaseerde aanpak, ISMSImplementatie van een ISMS gebaseerd op ISO 27001, regelmatige risico-assessments, mapping van BIO-controls op cloud-security services. 99Schrems II / CLOUD ActBescherming tegen toegang door niet-EU overhedenEU Sovereign Cloud-implementatie, end-to-end encryptie met door de klant beheerde sleutels, contractuele clausules die dataverzoeken aanvechten. 3

8. Praktijkcases en Best Practices

Deze sectie presenteert vier gedetailleerde praktijkcases die relevant zijn voor de Nederlandse publieke sector. Ze illustreren de toepassing van de principes uit dit rapport en bieden overdraagbare patronen en lessen.

Case 1: Gemeente Amsterdam – Detectie van Bijstandsfraude (Lessons Learned)

Doel: Het ontwikkelen van een eerlijk, transparant en effectief systeem voor het detecteren van mogelijke bijstandsfraude, ter vervanging van of ondersteuning van menselijke casemanagers.
Aanpak: De gemeente Amsterdam investeerde in een project genaamd ‘Smart Check’. Conform de best practices voor ethische AI, werd gekozen voor een ‘explainable’ model (een Explainable Boosting Machine), werd de broncode gepubliceerd op GitHub, en werd uitgebreid onderzoek gedaan naar bias in samenwerking met academici en de gemeenschap.100
Resultaat/Lessons Learned: Het project werd uiteindelijk stopgezet. De audit onthulde een fundamentele paradox: het is wiskundig onmogelijk om tegelijkertijd aan alle verschillende definities van ‘eerlijkheid’ te voldoen. Een poging om de bias tegen migranten en mannen te corrigeren door de trainingsdata te herwegen, resulteerde in een nieuwe bias die nu Nederlandse staatsburgers en vrouwen onevenredig benadeelde. Deze case is een cruciale waarschuwing: technische transparantie en statistische ‘fairness fixes’ zijn onvoldoende als de onderliggende maatschappelijke aannames van een systeem (in dit geval de aanname dat bijstandsontvangers potentiële fraudeurs zijn) niet kritisch worden geëvalueerd. Het toont aan dat ‘ethische AI’ een socio-technische uitdaging is, geen puur algoritmische.100
Overdraagbare Patronen:
Begin met een ethische en maatschappelijke validatie van de use case alvorens de technische ontwikkeling te starten.
Erken de beperkingen van puur kwantitatieve fairness-metrieken en betrek diverse stakeholders bij het definiëren van wat ‘eerlijk’ betekent in een specifieke context.
Transparantie is een tweesnijdend zwaard: het bouwt vertrouwen op, maar legt ook onvermijdelijke tekortkomingen en trade-offs bloot.

Case 2: Rijksoverheid – Beleidssamenvatting en Analyse (RAG)

Doel: Het versnellen van beleidsanalyse en het opstellen van nota’s door rijksambtenaren een tool te bieden om snel grote hoeveelheden juridische en beleidsdocumenten te doorzoeken, te bevragen en samen te vatten.
Aanpak: Een RAG-systeem wordt geïmplementeerd op een soevereine cloud-omgeving (bijv. de T-Systems Sovereign Cloud powered by Google Cloud 49 of een vergelijkbare EU-gebaseerde oplossing). Er wordt gebruikgemaakt van een open-source SLM die is gefinetuned op Nederlandstalige overheidsdocumenten. De kennisbank wordt gevoed vanuit interne, gecontroleerde documentmanagementsystemen. De toegang is beperkt tot geautoriseerde medewerkers via de Zero Trust-architectuur.
KPI’s:
Tijd om een document van 100 pagina’s samen te vatten: <2 minuten.
Feitelijkheidsscore: ≥95%.
Citatiedekking: 100% (elk feit in de output is herleidbaar naar een bron).
Overdraagbare Patronen:
Demonstreert een laag-risico, hoogwaardige interne use case die de productiviteit direct verhoogt.
Benadrukt het cruciale belang van de datakwaliteit en actualiteit van de kennisbank.
Valideert de noodzaak van soevereine infrastructuur voor de verwerking van overheidsdata, zelfs als deze niet direct persoonsgegevens bevat.

Case 3: Zorgsector – AI-ondersteunde Diagnostiek (Hoog-Risico AI)

Doel: Het inzetten van een generatief AI-model voor de analyse van medische beelden (bijv. mammogrammen) om een voorlopig diagnostisch verslag te genereren dat vervolgens door een radioloog wordt gevalideerd.
Aanpak: Dit is een ‘hoog-risico’ AI-systeem onder de EU AI Act.101 De implementatie vereist een CE-gemarkeerd AI-model dat als medisch hulpmiddel is gecertificeerd. De dataverwerking betreft bijzondere categorieën persoonsgegevens (AVG Art. 9) 31, wat expliciete toestemming of een andere geldige wettelijke grondslag vereist. Het systeem moet voldoen aan strenge eisen:
Human Oversight: Elke AI-gegenereerde diagnose moet door een gekwalificeerde medisch specialist worden bevestigd. De AI is ondersteunend, niet-vervangend.
Logging: Een volledig, onveranderlijk audittrail van elke analyse moet worden vastgelegd conform AI Act Art. 12.97
Robuustheid: Het model moet extreem hoge nauwkeurigheid en robuustheid aantonen, gevalideerd door klinische studies.
KPI’s:
Diagnostische nauwkeurigheid vergelijkbaar met of beter dan menselijke experts.
False negative rate <0.1%.
Volledige audittrail beschikbaar voor elke analyse.
Overdraagbare Patronen:
Illustreert de stringente vereisten voor hoog-risico AI-toepassingen.
Toont de onvermijdelijke en wettelijk verplichte rol van menselijk toezicht.
Benadrukt de noodzaak om meerdere, overlappende regelgevingskaders (AI Act, AVG, Medical Device Regulation) te navigeren.

Case 4: Nationaal Archief – Handschriftherkenning (HTR)

Doel: Het doorzoekbaar maken van handgeschreven historische archieven door middel van geautomatiseerde transcriptie, waardoor deze waardevolle bronnen toegankelijk worden voor een breder publiek.102
Aanpak: Het Nationaal Archief gebruikt machine learning-modellen die getraind zijn op handmatig gemaakte transcripties om de handschriften te ‘lezen’. De resulterende transcripties en de trainingsdata worden als open data beschikbaar gesteld. Dit project integreert de transcriptiesoftware in de technische infrastructuur voor grootschalige toepassing.102
Resultaat/Lessons Learned: De AI-gegenereerde transcripties worden zelf archiefbescheiden en moeten als zodanig worden beheerd conform de Archiefwet. Dit betekent dat hun authenticiteit, integriteit en bruikbaarheid over lange termijn gewaarborgd moeten worden. De context van de creatie (welk model, welke parameters, welke bronscan) is cruciale metadata die samen met de transcriptie bewaard moet worden.38
Overdraagbare Patronen:
Een succesvol voorbeeld van het gebruik van AI voor cultureel erfgoed en het vergroten van de publieke toegankelijkheid van data.
Onderstreept de noodzaak om vanaf het begin rekening te houden met de principes van digitale duurzaamheid en archivering (Archiefwet) voor AI-gegenereerde outputs die een officiële of archiefwaardige status krijgen.

9. Roadmap en Besluitvorming

Deze sectie biedt een concreet, gefaseerd plan voor publieke organisaties om op een verantwoorde en gestructureerde wijze te beginnen met de adoptie van Generatieve AI.

Fasering

Een gefaseerde aanpak minimaliseert risico’s en maximaliseert de kans op een succesvolle, waardevolle implementatie.

Fase 0 (0-30 Dagen): Governance & Educatie

Acties:
Instellen AI Governance Committee: Richt een multidisciplinair comité op met vertegenwoordigers van Juridische Zaken, Security (CISO), Privacy (FG/DPO), IT/Architectuur en de relevante beleids- of operationele afdelingen.
Verplichte Training: Organiseer een verplichte training voor alle stakeholders gebaseerd op de bevindingen van dit rapport, met focus op de kansen, risico’s en wettelijke kaders.
Vaststellen Risicobereidheid: Definieer en documenteer de risicobereidheid (risk appetite) van de organisatie met betrekking tot het gebruik van AI.
Initiëren Quick Win: Start de voorbereidingen voor het eerste ‘Quick Win’-project (Intern Kennismanagement via RAG).

Fase 1 (30-90 Dagen): Pilot & Fundament

Acties:
Implementatie Pilot: Implementeer de interne RAG-pilot in een gecontroleerde omgeving.
Ontwikkeling Governance Artefacten: Ontwikkel en laat de kern-governance documenten goedkeuren: het DPIA-sjabloon, het risicoregister, en de inkoopchecklist.
Bouwen Technisch Fundament: Bouw het fundamentele, veilige platform gebaseerd op de Zero Trust-referentiearchitectuur, inclusief de IaC-scripts en basis CI/CD-pijplijnen.

Fase 2 (90-180 Dagen): Schalen & Standaardiseren

Acties:
Evaluatie Pilot: Evalueer de pilot aan de hand van de vastgestelde KPI’s en stel een business case op voor een bredere uitrol.
Standaardisatie: Selecteer en standaardiseer een set van goedgekeurde modellen, tools en architectuurpatronen voor de organisatie.
Verkenning Tweede Use Case: Begin met de verkenning van een tweede, laag-risico use case, zoals het genereren van code voor interne tools of het analyseren van geanonimiseerde data.

Fase 3 (180+ Dagen): Volwassenheid & Innovatie

Acties:
Uitbreiding naar Complexe Use Cases: Breid uit naar complexere use cases, inclusief potentieel burggergerichte diensten, na een rigoureus risico-assessment en DPIA-proces.
Continue Monitoring: Monitor continu het AI-landschap voor nieuwe modellen, dreigingen en veranderingen in regelgeving.

Investerings- en Risicoprofiel

De initiële investering moet het zwaarst leunen op mensen en processen (governance, training, security architectuur) in plaats van op dure modellicenties. Het risico wordt beheerst door te beginnen met interne, laag-risico, hoogwaardige use cases en stapsgewijs op te schalen naarmate de organisatorische en technische volwassenheid toeneemt.

Governance en RACI

Een gedetailleerde RACI-matrix (Responsible, Accountable, Consulted, Informed) is essentieel voor duidelijke besluitvorming en wordt verstrekt in Bijlage H. Deze matrix definieert de rollen en verantwoordelijkheden voor sleutelbeslissingen zoals de goedkeuring van een use case, modelselectie, risico-acceptatie en incidentrespons.

Beslispunten

Elke fase wordt afgesloten met formele beslispunten om een gecontroleerde voortgang te garanderen:

Go/No-Go voor pilot project: Gebaseerd op de initiële risico-inschatting en de business case.
Selectie van implementatiemodel: Keuze tussen SaaS (Sovereign Cloud), Private Cloud of On-Premise, gebaseerd op de Beslismatrix in Sectie 5.
Goedkeuring DPIA en risicoregister: Formele goedkeuring door de FG/DPO en CISO is een harde voorwaarde voor de start van de technische implementatie.
Go/No-Go voor productie-implementatie: Gebaseerd op de resultaten en KPI’s van de pilot en een finale evaluatie door het AI Governance Committee.

Geciteerd werk

What is Retrieval-Augmented Generation (RAG)? | Google Cloud, geopend op september 18, 2025, https://cloud.google.com/use-cases/retrieval-augmented-generation
Retrieval-augmented generation – Wikipedia, geopend op september 18, 2025, https://en.wikipedia.org/wiki/Retrieval-augmented_generation
EU Cloud Sovereignty – Four alternatives to public clouds – Unit8, geopend op september 18, 2025, https://unit8.com/resources/eu-cloud-sovereignty-four-alternatives-to-public-clouds/
LLM03:2025 Supply Chain – OWASP Gen AI Security Project, geopend op september 18, 2025, https://genai.owasp.org/llmrisk/llm032025-supply-chain/
What are the OWASP Top 10 risks for LLMs? – Cloudflare, geopend op september 18, 2025, https://www.cloudflare.com/learning/ai/owasp-top-10-risks-for-llms/
TCO Calculator LLM H100 GPT-OSS | Cost Analysis 2025 – BytePlus, geopend op september 18, 2025, https://www.byteplus.com/en/topic/577656
education.illinois.edu, geopend op september 18, 2025, https://education.illinois.edu/about/news-events/news/article/2024/11/11/what-is-generative-ai-vs-ai#:~:text=AI%20analyzes%20and%20interprets%20existing,models%20based%20on%20existing%20data.
Traditional AI vs. Generative AI: What’s the Difference? | Illinois, geopend op september 18, 2025, https://education.illinois.edu/about/news-events/news/article/2024/11/11/what-is-generative-ai-vs-ai
Generative AI versus Different Types of AI – Microsoft, geopend op september 18, 2025, https://www.microsoft.com/en-us/ai/ai-101/generative-ai-vs-other-types-of-ai
Agentic AI vs. Generative AI – IBM, geopend op september 18, 2025, https://www.ibm.com/think/topics/agentic-ai-vs-generative-ai
Governance of Generative AI | Policy and Society – Oxford Academic, geopend op september 18, 2025, https://academic.oup.com/policyandsociety/article/44/1/1/7997395
Generative AI and the AI Act – European Parliament, geopend op september 18, 2025, https://www.europarl.europa.eu/cmsdata/277774/02.YordankaIvanova.pdf
Large Language Models vs. Foundation Models | Teradata, geopend op september 18, 2025, https://www.teradata.com/insights/ai-and-machine-learning/large-language-models-vs-foundation-models
LLMs vs. SLMs: The Differences in Large & Small Language Models …, geopend op september 18, 2025, https://www.splunk.com/en_us/blog/learn/language-models-slm-vs-llm.html
SLMs vs LLMs: What are small language models? – Red Hat, geopend op september 18, 2025, https://www.redhat.com/en/topics/ai/llm-vs-slm
What are Small Language Models (SLM)? – IBM, geopend op september 18, 2025, https://www.ibm.com/think/topics/small-language-models
Agentic AI governance and compliance: Managing autonomous AI risk – Okta, geopend op september 18, 2025, https://www.okta.com/identity-101/agentic-ai-governance-and-compliance/
Top 5 governance considerations for Agentic AI – Monitaur, geopend op september 18, 2025, https://www.monitaur.ai/blog-posts/top-5-governance-considerations-for-agentic-ai
The Risks and Governance Requirements of Agentic AI – Dataiku blog, geopend op september 18, 2025, https://blog.dataiku.com/the-risks-and-governance-requirements-of-agentic-ai
Agentic AI: A Promising Evolution, But Not Without Limits – Blueprint, geopend op september 18, 2025, https://www.blueprintsys.com/blog/agentic-ai-a-promising-evolution-but-not-without-limits
Generative AI Data Scientist: A Booming New Job Role – Analytics Vidhya, geopend op september 18, 2025, https://www.analyticsvidhya.com/blog/2025/04/generative-ai-data-scientist/
What Does a Data Scientist Do? – Role & Responsibilities, geopend op september 18, 2025, https://graduate.northeastern.edu/knowledge-hub/what-does-a-data-scientist-do/
Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class, geopend op september 18, 2025, https://ojs.aaai.org/index.php/AAAI/article/view/33771/35926
Generative AI for Tabular Data Synthesis | Request PDF – ResearchGate, geopend op september 18, 2025, https://www.researchgate.net/publication/392852072_Generative_AI_for_Tabular_Data_Synthesis
Generative AI for Tabular Data – Ydata.ai, geopend op september 18, 2025, https://ydata.ai/resources/generative-ai-for-tabular-data.html
A Survey on Data-Centric AI: Tabular Learning from Reinforcement Learning and Generative AI Perspective – arXiv, geopend op september 18, 2025, https://arxiv.org/html/2502.08828v2
Gen AI evaluation service overview | Generative AI on Vertex AI – Google Cloud, geopend op september 18, 2025, https://cloud.google.com/vertex-ai/generative-ai/docs/models/evaluation-overview
The Best AI Observability Tools in 2025 | Coralogix, geopend op september 18, 2025, https://coralogix.com/ai-blog/the-best-ai-observability-tools-in-2025/
10 Useful LangChain Components for Your Next RAG System …, geopend op september 18, 2025, https://machinelearningmastery.com/10-useful-langchain-components-rag-system/
Build a RAG Pipeline With the LLama Index – Analytics Vidhya, geopend op september 18, 2025, https://www.analyticsvidhya.com/blog/2023/10/rag-pipeline-with-the-llama-index/
AI in healthcare: legal and ethical considerations at the new frontier – A&O Shearman, geopend op september 18, 2025, https://www.aoshearman.com/en/insights/ao-shearman-on-life-sciences/ai-in-healthcare-legal-and-ethical-considerations-at-the-new-frontier
The Definitive Guide to LLM Evaluation – Arize AI, geopend op september 18, 2025, https://arize.com/llm-evaluation/
Overview of Galileo Evaluate – Galileo, geopend op september 18, 2025, https://docs.galileo.ai/galileo/gen-ai-studio-products/galileo-evaluate
WhyLabs – Python LangChain, geopend op september 18, 2025, https://python.langchain.com/docs/integrations/providers/whylabs_profiling/
Pinecone – Marketplace – Google Cloud Console, geopend op september 18, 2025, https://console.cloud.google.com/marketplace/product/pinecone-public/pinecone?hl=en-GB
Open Source Vector Database | Weaviate, geopend op september 18, 2025, https://weaviate.io/platform
Chroma – Docs by LangChain, geopend op september 18, 2025, https://docs.langchain.com/oss/javascript/integrations/vectorstores/chroma
Information management for records created using Artificial …, geopend op september 18, 2025, https://www.naa.gov.au/information-management/manage-information-assets/types-information/information-management-records-created-using-artificial-intelligence-ai-technologies
What is RAG (Retrieval Augmented Generation)? | IBM, geopend op september 18, 2025, https://www.ibm.com/think/topics/retrieval-augmented-generation
Conceptual guide – Python LangChain, geopend op september 18, 2025, https://python.langchain.com/docs/concepts/
Build powerful RAG pipelines with LlamaIndex and Amazon Bedrock | Artificial Intelligence, geopend op september 18, 2025, https://aws.amazon.com/blogs/machine-learning/build-powerful-rag-pipelines-with-llamaindex-and-amazon-bedrock/
OWASP Top 10 LLM Applications 2025 | Indusface Blog, geopend op september 18, 2025, https://www.indusface.com/blog/owasp-top-10-llm/
What is Site Reliability Engineering? – SRE Explained – AWS – Updated 2025, geopend op september 18, 2025, https://aws.amazon.com/what-is/sre/
DevSecOps Best Practices: How to Build a Modern, Automated, Scalable Workflow, geopend op september 18, 2025, https://duplocloud.com/blog/devsecops-best-practices/
Optimizing SRE Practices with Large Language Models (LLMs) – Wipro, geopend op september 18, 2025, https://www.wipro.com/engineering/optimizing-site-reliability-engineering-with-large-language-models/
MITRE ATLAS Framework 2025 – Guide to Securing AI Systems, geopend op september 18, 2025, https://www.practical-devsecops.com/mitre-atlas-framework-guide-securing-ai-systems/
Comparing STRIDE vs LINDDUN vs PASTA: Which Threat Modeling …, geopend op september 18, 2025, https://www.securitycompass.com/blog/comparing-stride-linddun-pasta-threat-modeling/
A shared G7 vision on software bill of materials for AI – BSI, geopend op september 18, 2025, https://www.bsi.bund.de/SharedDocs/Downloads/EN/BSI/KI/SBOM-for-AI_Food-for-thoughts.pdf?__blob=publicationFile&v=6
T-Systems Sovereign Cloud powered by Google Cloud, geopend op september 18, 2025, https://www.t-systems.com/de/en/sovereign-cloud/solutions/sovereign-cloud-powered-by-google-cloud
Balancing Innovation and Privacy: LLMs under GDPR – Dynamiq, geopend op september 18, 2025, https://www.getdynamiq.ai/post/balancing-innovation-and-privacy-llms-under-gdpr
Art. 25 GDPR – Data protection by design and by default – General …, geopend op september 18, 2025, https://gdpr-info.eu/art-25-gdpr/
GDPR Article 25 – Imperva, geopend op september 18, 2025, https://www.imperva.com/learn/data-security/gdpr-article-25/
EU Data Protection – GDPR Europe – Amazon Web Services, geopend op september 18, 2025, https://aws.amazon.com/compliance/eu-data-protection/
General Data Protection Regulation (GDPR) Center – AWS, geopend op september 18, 2025, https://aws.amazon.com/compliance/gdpr-center/
Requesting information from the government (WOO request) – Business.gov.nl, geopend op september 18, 2025, https://business.gov.nl/regulation/freedom-of-information/
Regulations and considerations needed to legally use patient data for artificial intelligence (AI) – Oral Health Group, geopend op september 18, 2025, https://www.oralhealthgroup.com/features/regulations-and-considerations-needed-to-legally-use-patient-data-for-artificial-intelligence-ai-and-to-align-with-data-protection-laws-in-u-s-and-internationally/
What Are EU Sovereign Clouds & How Do They Protect Data – Usercentrics, geopend op september 18, 2025, https://usercentrics.com/knowledge-hub/eu-sovereign-cloud-data-protection/
Data protection by design and default | ICO – Information Commissioner’s Office, geopend op september 18, 2025, https://ico.org.uk/for-organisations/uk-gdpr-guidance-and-resources/accountability-and-governance/guide-to-accountability-and-governance/data-protection-by-design-and-default/
GPT-4o System Card, geopend op september 18, 2025, https://arxiv.org/abs/2410.21276
GPT-4 – Wikipedia, geopend op september 18, 2025, https://en.wikipedia.org/wiki/GPT-4
Claude 3.5 Sonnet Model Card Addendum | Anthropic, geopend op september 18, 2025, https://www-cdn.anthropic.com/fed9cc193a14b84131812372d8d5857f8f304c52/Model_Card_Claude_3_Addendum.pdf
Claude 3.5 Sonnet – Marketplace – Google Cloud console, geopend op september 18, 2025, https://console.cloud.google.com/marketplace/product/anthropic/claude-3-5-sonnet.endpoints.mp-anthropic.cloud.goog
AI Code Generation | Google Cloud, geopend op september 18, 2025, https://cloud.google.com/use-cases/ai-code-generation
What Is Multimodal AI? Top 5 Models for Businesses in 2024 | DaveAI, geopend op september 18, 2025, https://www.iamdave.ai/blog/what-is-multimodal-ai-top-5-multimodal-ai-models-for-businesses-in-2024/
meta-llama/Llama-3.1-8B-Instruct · Hugging Face, geopend op september 18, 2025, https://huggingface.co/meta-llama/Llama-3.1-8B-Instruct
Using Images & Videos Commercially – Midjourney, geopend op september 18, 2025, https://docs.midjourney.com/hc/en-us/articles/27870375276557-Using-Images-Videos-Commercially
Best AI Image Generators of 2025 – CNET, geopend op september 18, 2025, https://www.cnet.com/tech/services-and-software/best-ai-image-generators/
Best Text-to-Speech APIs in 2025 – Eden AI, geopend op september 18, 2025, https://www.edenai.co/post/best-text-to-speech-apis
Stability AI License, geopend op september 18, 2025, https://stability.ai/license
Quick start: Generate synthetic tabular data Docs | IBM watsonx, geopend op september 18, 2025, https://dataplatform.cloud.ibm.com/docs/content/wsj/getting-started/get-started-generate-data.html?context=wx
Tabular Data Generation using Binary Diffusion – NeurIPS 2025, geopend op september 18, 2025, https://neurips.cc/virtual/2024/103129
6 Best Multimodal AI Models in 2025 – Times Of AI, geopend op september 18, 2025, https://www.timesofai.com/industry-insights/top-multimodal-ai-models/
AWS Marketplace: Pinecone Vector Database – Pay As You Go Pricing – Amazon.com, geopend op september 18, 2025, https://aws.amazon.com/marketplace/pp/prodview-xhgyscinlz4jk
AWS Marketplace: Weaviate Enterprise Cloud – Amazon.com, geopend op september 18, 2025, https://aws.amazon.com/marketplace/pp/prodview-27nbweprm7hha
Chroma Docs: Introduction, geopend op september 18, 2025, https://docs.trychroma.com/
MLOps & LLMOps | Key Differences & Best Practices | Xorbix, geopend op september 18, 2025, https://xorbix.com/insights/from-mlops-to-llmops-managing-the-lifecycle-of-advanced-ai-models/
LLMOps vs MLOps: Comparison Table + 30 FAQs Answered – Azilen Technologies, geopend op september 18, 2025, https://www.azilen.com/blog/llmops-vs-mlops/
What is LLMOps, and how is it different from MLOps? – Pluralsight, geopend op september 18, 2025, https://www.pluralsight.com/resources/blog/ai-and-data/what-is-llmops
Galileo LLM Studio – Marketplace – Google Cloud Console, geopend op september 18, 2025, https://console.cloud.google.com/marketplace/product/galileo-public/galileo-llm-studio
ML Infra Monitoring Platform | Arize AI Model Observability Solution, geopend op september 18, 2025, https://arize.com/platform-overview/
AI Observability: Key Components, Challenges & Best Practices – Coralogix, geopend op september 18, 2025, https://coralogix.com/guides/aiops/ai-observability/
AI observability – Coralogix, geopend op september 18, 2025, https://coralogix.com/platform/ai-observability/
Everything you need to evaluate open-source (vs. closed-source) LLMs, geopend op september 18, 2025, https://atelier.net/insights/evaluating-open-source-large-language-models
The Benefits of Open-Source vs. Closed-Source LLMs | by ODSC …, geopend op september 18, 2025, https://odsc.medium.com/the-benefits-of-open-source-vs-closed-source-llms-71201e049bc7
Open-Source vs. Closed-Source LLMs: Weighing the Pros and Cons – Lydonia, geopend op september 18, 2025, https://lydonia.ai/open-source-vs-closed-source-llms-weighing-the-pros-and-cons/
LLM Total Cost of Ownership 2025: Build vs Buy Math – Ptolemay, geopend op september 18, 2025, https://www.ptolemay.com/post/llm-total-cost-of-ownership
EU Data Boundary – Microsoft for Sovereignty, geopend op september 18, 2025, https://learn.microsoft.com/en-us/industry/sovereignty/eu-data-boundary
What is the EU Data Boundary? – Microsoft Privacy, geopend op september 18, 2025, https://learn.microsoft.com/en-us/privacy/eudb/eu-data-boundary-learn
OpenAI gpt-4o Pricing Calculator | API Cost Estimation – Helicone, geopend op september 18, 2025, https://www.helicone.ai/llm-cost/provider/openai/model/gpt-4o
Understanding AI Licenses: Key Types and Considerations, geopend op september 18, 2025, https://viso.ai/deep-learning/ai-licenses/
Llama 3.1 Community License is not a free software license, geopend op september 18, 2025, https://www.fsf.org/blogs/licensing/llama-3-1-community-license-is-not-a-free-software-license
A seven-step checklist to get your generative AI application security-ready – AWS Startups, geopend op september 18, 2025, https://aws.amazon.com/startups/learn/a-seven-step-checklist-to-get-your-generative-ai-application-security-ready
OWASP AI Security Project: Top 10 LLM Vulnerabilities Guide | Kong Inc., geopend op september 18, 2025, https://konghq.com/blog/engineering/owasp-top-10-ai-and-llm-guide
Segmentation and Filtering Are Still the Gold Standard for Privacy in IoT An In-Depth STRIDE and LINDDUN Analysis of Smart Homes – MDPI, geopend op september 18, 2025, https://www.mdpi.com/1999-5903/17/2/77
Guide to the OWASP Top 10 for LLMs: Vulnerability mitigation with Elastic, geopend op september 18, 2025, https://www.elastic.co/blog/owasp-top-10-for-llms-guide
A COLLABORATION ACROSS INDUSTRY, ACADEMIA, AND GOVERNMENT – MITRE ATLAS™, geopend op september 18, 2025, https://atlas.mitre.org/pdf-files/MITRE_ATLAS_Fact_Sheet.pdf
Article 12: Record-Keeping | EU Artificial Intelligence Act, geopend op september 18, 2025, https://artificialintelligenceact.eu/article/12/
The NIS 2 Directive | Updates, Compliance, Training, geopend op september 18, 2025, https://www.nis-2-directive.com/
What is Baseline Informatiebeveiliging Overheid (BIO …, geopend op september 18, 2025, https://www.networking4all.com/en/support/faq/what-is-baseline-government-information-security
Amsterdam Built the ‘Perfect’ Ethical AI System. It Still Failed. Here’s Why. – Medium, geopend op september 18, 2025, https://medium.com/@elliotJL/amsterdam-built-the-perfect-ethical-ai-system-it-still-failed-here-s-why-8dc8072beea3
AI Act | Shaping Europe’s digital future, geopend op september 18, 2025, https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai
Handschriftherkenning – Nationaal Archief, geopend op september 18, 2025, https://www.nationaalarchief.nl/onderzoeken/datalab-nationaal-archief/handschriftherkenning