Ik krijg 'm elke week: "Dennis, wat is het beste lokale model voor coding?" En elke week zeg ik hetzelfde: bestaat niet. Het hangt van je rol, je hardware en je workflow af. Een SRE die Terraform schrijft heeft een heel ander profiel nodig dan een security engineer die OWASP-reviews draait, en een MacBook Air M2 trekt nu eenmaal niet wat een RTX 4090 trekt. Dus praktisch houden.

Het actuele landschap

Dit zijn de modellen die er in mei 2026 echt toe doen, gerangschikt naar VRAM-verbruik (Q4_K_M, via Ollama):

Model	VRAM nodig	Actieve params	Sweet spot hardware	Beste voor
Gemma 3 12B	~8 GB	12B	MacBook Air, 12 GB GPU	Lichtgewicht, snel, boilerplate, simpele refactors
Phi-4 14B	~9 GB	14B	12-16 GB GPU	Beste onder 16 GB VRAM, verrassend sterk in logisch redeneren
Codestral 22B	~14 GB	22B	MacBook Pro M4, RTX 3080	Beste latency/kwaliteit-ratio, de daily driver
Qwen 3.6 Coder 27B	~16 GB	27B	RTX 4090, Mac Studio	De benchmark-koning, breedste taalondersteuning
Qwen 3.6 Coder 35B-A3B (MoE)	~20 GB	3B actief / 35B totaal	RTX 4090, multi-GPU	Snelste iteratie, Mixture of Experts, 3B actief per token
DeepSeek Coder V4 Flash	~16 GB	16B (MoE)	RTX 4090, werkstation	Lange context, complexe refactoring over vele bestanden

Wat is MoE? Modellen zoals Qwen 35B-A3B en DeepSeek V4 Flash gebruiken per token maar een fractie van hun parameters. De 35B-A3B heeft 35 miljard parameters in totaal, maar slechts 3 miljard actief per token. Dat betekent: de snelheid van een 3B-model met de kennis van een 35B-model. Voor interactieve coding waar elke milliseconde telt is dat goud waard.

Per rol: wat past bij jou?

Developer

Jij schrijft code, refactort, reviewt PR's in TypeScript, Python, Go en Rust. Je hebt brede taalondersteuning, FIM en minimaal 8K context nodig.

MacBook Air of 12 GB GPU → Phi-4 14B: beste onder 16 GB, sterke logica. MacBook Pro M4 of RTX 3080 (16 GB) → Codestral 22B: de workhorse, beste prijs/kwaliteit. RTX 4090 of Mac Studio (24 GB) → Qwen 3.6 Coder 27B: 90+ talen, sterke code review. Werkstation 24+ GB → Qwen 3.6 Coder 35B-A3B (MoE): 3B actief per token, razendsnel.

SRE / DevOps Engineer

Jij leeft in Terraform, Kubernetes, CI/CD-pipelines, Ansible, incident scripts. Je hebt een model nodig dat YAML, HCL, JSON feilloos snapt, valide output genereert en sterk is in shell-scripting.

MacBook Pro 16 GB → Codestral 22B: uitstekend in YAML/HCL, lage latency. RTX 4090 → Qwen 3.6 Coder 27B: sterker in shell-scripting en multi-file refactoring. Multi-GPU → DeepSeek Coder V4 Flash: 128K context voor complete Terraform-codebase reviews.

SRE-tip: "Review deze Terraform-module op security misconfiguraties, ontbrekende depends_on, en hardcoded values. Geef gecorrigeerde code."

Test Automation Engineer

Jij genereert testscripts (Cypress, Playwright, pytest, JUnit), fabriceert testdata en identificeert edge cases. Je hebt een model nodig dat frameworks kent, "wat als?"-denken doet en realistische mock-data genereert.

MacBook Air / 12 GB GPU → Gemma 3 12B: snel, lichtgewicht voor simpele scripts. MacBook Pro 16 GB → Phi-4 14B: sterker in logisch redeneren = betere edge case-detectie. RTX 4090 → Qwen 3.6 Coder 27B: begrijpt Cypress, Playwright én pytest, genereert volledige spec-bestanden.

Security Engineer

Jij doet security code reviews, SAST/DAST-regels, vulnerability scanning en compliance (BIO2, NIS2, ISO 27001). Je kijkt niet of code werkt, maar of 'ie misbruikt kan worden. False negatives zijn erger dan traagheid.

MacBook Pro 16 GB → Codestral 22B: goede patroonherkenning, lage false-positive rate. RTX 4090 / werkstation → DeepSeek Coder V4 Flash: lange context voor volledige codebase scan op secrets en kwetsbaarheden. Werkstation / cloud → DeepSeek V4 Pro (cloud) voor kritische audits, alleen air-gapped.

Netwerk Engineer

Jij genereert configuraties voor Cisco IOS, Juniper JunOS, VyOS, firewall-regels (iptables, Palo Alto, FortiGate) en BGP/OSPF-routering. Vendor-specifieke syntax, protocol-kennis en IP-berekeningen zijn vereist.

Elke hardware 16+ GB → Codestral 22B: beste vendor-syntax, begrijpt Cisco én Juniper, sterk in ACL-logica. RTX 4090 / werkstation → Qwen 3.6 Coder 27B: breedste protocol-kennis, valideert BGP-route-maps en OSPF-areas, goede Netmiko/NAPALM-ondersteuning.

De hardware-tiers

Tier	VRAM	Hardware	Aanbevolen model
Instap	8-12 GB	MacBook Air, RTX 3060, gaming-laptop	Phi-4 14B of Gemma 3 12B
Midden	16-24 GB	MacBook Pro M4, RTX 3080/4080, Mac Studio	Codestral 22B (daily driver) of Qwen 3.6 Coder 27B (max kwaliteit)
High-end	24-48+ GB	RTX 4090, Mac Studio M2 Ultra, multi-GPU werkstation	Qwen 3.6 Coder 35B-A3B (MoE) (snelste) of DeepSeek Coder V4 Flash (lange context)

Lokaal ≠ tweederangs

Het gat tussen lokaal en cloud is kleiner dan ooit. Qwen 3.6 Coder 27B (16 GB VRAM) scoort op LiveCodeBench binnen 5-10% van Claude Sonnet 4.5. Voor 80% van de dagelijkse coding-taken, refactoren, testen schrijven, configuraties genereren, security reviews, is het verschil niet merkbaar.

En je krijgt er volledige privacy, geen vendor lock-in, geen API-kosten, geen rate limits, en geen code die ooit je machine verlaat. Voor security engineers en netwerk-engineers is dat geen luxe, het is een compliance-eis.

Aan de slag

Alles is gratis en open-source. Dit heb je nodig:

# Ollama installeren
curl -fsSL https://ollama.ai/install.sh | sh

# Model pullen op basis van je tier
ollama pull codestral:22b        # Midden-tier daily driver
ollama pull qwen3-coder:27b      # High-tier benchmark-koning
ollama pull phi-4:14b            # Instap-tier

# OpenCode installeren en starten
pip install opencode
opencode --model ollama/qwen3-coder:27b

Dit artikel is gebaseerd op het actuele modellenlandschap van mei 2026, praktijktests op het DjimIT-werkstation (RTX, 125 GB RAM), en benchmark-analyses van LiveCodeBench, Aider Polyglot en het Data Science Collective. Modellen veranderen snel, DjimIT publiceert elk kwartaal een update. Neem contact op voor advies op maat over jouw specifieke setup.

Het actuele landschap

Dit zijn de modellen die er in mei 2026 echt toe doen, gerangschikt naar VRAM-verbruik (Q4_K_M, via Ollama):

Model	VRAM nodig	Actieve params	Sweet spot hardware	Beste voor
Gemma 3 12B	~8 GB	12B	MacBook Air, 12 GB GPU	Lichtgewicht, snel, boilerplate, simpele refactors
Phi-4 14B	~9 GB	14B	12-16 GB GPU	Beste onder 16 GB VRAM, verrassend sterk in logisch redeneren
Codestral 22B	~14 GB	22B	MacBook Pro M4, RTX 3080	Beste latency/kwaliteit-ratio, de daily driver
Qwen 3.6 Coder 27B	~16 GB	27B	RTX 4090, Mac Studio	De benchmark-koning, breedste taalondersteuning
Qwen 3.6 Coder 35B-A3B (MoE)	~20 GB	3B actief / 35B totaal	RTX 4090, multi-GPU	Snelste iteratie, Mixture of Experts, 3B actief per token
DeepSeek Coder V4 Flash	~16 GB	16B (MoE)	RTX 4090, werkstation	Lange context, complexe refactoring over vele bestanden

Per rol: wat past bij jou?

Developer

Jij schrijft code, refactort, reviewt PR's in TypeScript, Python, Go en Rust. Je hebt brede taalondersteuning, FIM en minimaal 8K context nodig.

SRE / DevOps Engineer

Jij leeft in Terraform, Kubernetes, CI/CD-pipelines, Ansible, incident scripts. Je hebt een model nodig dat YAML, HCL, JSON feilloos snapt, valide output genereert en sterk is in shell-scripting.

SRE-tip: "Review deze Terraform-module op security misconfiguraties, ontbrekende depends_on, en hardcoded values. Geef gecorrigeerde code."

Test Automation Engineer

Security Engineer

Netwerk Engineer

De hardware-tiers

Tier	VRAM	Hardware	Aanbevolen model
Instap	8-12 GB	MacBook Air, RTX 3060, gaming-laptop	Phi-4 14B of Gemma 3 12B
Midden	16-24 GB	MacBook Pro M4, RTX 3080/4080, Mac Studio	Codestral 22B (daily driver) of Qwen 3.6 Coder 27B (max kwaliteit)
High-end	24-48+ GB	RTX 4090, Mac Studio M2 Ultra, multi-GPU werkstation	Qwen 3.6 Coder 35B-A3B (MoE) (snelste) of DeepSeek Coder V4 Flash (lange context)

Lokaal ≠ tweederangs

Aan de slag

Alles is gratis en open-source. Dit heb je nodig:

# Ollama installeren
curl -fsSL https://ollama.ai/install.sh | sh

# Model pullen op basis van je tier
ollama pull codestral:22b        # Midden-tier daily driver
ollama pull qwen3-coder:27b      # High-tier benchmark-koning
ollama pull phi-4:14b            # Instap-tier

# OpenCode installeren en starten
pip install opencode
opencode --model ollama/qwen3-coder:27b

Welk lokaal AI-model is het beste voor coding in 2026? Praktische gids voor developers, SRE's, testers, security- en netwerk-engineers

Het actuele landschap

Per rol: wat past bij jou?

Developer

SRE / DevOps Engineer

Test Automation Engineer

Security Engineer

Netwerk Engineer

De hardware-tiers

Lokaal ≠ tweederangs

Aan de slag