9Router: waarom je AI-agenten wél moet routeren, maar nooit zonder governance
AI Infrastructuur9Router: waarom je AI-agenten wél moet routeren, maar nooit zonder governance
De AI-gemeenschap heeft een nieuwe lieveling: 9Router. 14.200 sterren op GitHub, 2.100 forks, 650 commits in een paar maanden tijd. De pitch is verleidelijk: "Unlimited FREE AI coding. Never stop coding." Maar na een grondige technische analyse blijkt 9Router iets anders te zijn dan de hype suggereert — en precies dát maakt het interessant voor serieuze AI-infrastructuur.
Wat 9Router wél is (en wat niet)
9Router positioneert zich als "verbind al je AI-tools aan 40+ providers." De belofte: Claude Code, Codex, OpenCode, Cursor, Cline — allemaal via één lokaal endpoint (http://localhost:20128/v1). Met automatische fallback van subscription → cheap → free, zodat je nooit zonder AI komt te zitten.
Maar de echte waarde zit niet in het aantal providers. Die heeft LiteLLM ook. De waarde zit in drie dingen die LiteLLM níet primair doet:
-
RTK Token Saver — comprimeert tool-outputs (
git diff,grep,ls, logs) vóór ze naar de LLM gaan. Bespaart 20-40% input tokens per request. Voor intensieve coding-sessies met Claude Code of Codex is dat duizenden tokens per dag. -
OAuth auto-refresh — houdt je Claude Code-, Codex-, Copilot- en Cursor-subscriptions actief zonder handmatig her-authenticeren. Geen "your session expired" mid-sprint.
-
Free-tier aggregatie — Kiro AI (Claude 4.5 onbeperkt gratis), OpenCode Free, Vertex AI ($300 credits) — providers die je met LiteLLM niet zomaar aanspreekt.
Dit is geen enterprise gateway. Dit is een developer-first agent router.
De architectuurfout die iedereen maakt
De natuurlijke reflex bij een tool als 9Router is: "Kan dit LiteLLM vervangen?" Die vraag is verkeerd.
| Vraag | LiteLLM | 9Router | |-------|---------|---------| | Centrale enterprise LLM gateway | ✅ Sterk | ❌ Beperkt | | Developer/coding-agent routing | ✅ Goed | ✅ Sterk | | Virtual keys + tenant governance | ✅ Sterk | ❌ Beperkt | | Budgetten, rate limits, chargeback | ✅ Sterk | 🟡 Middel | | Fallback + provider routing | ✅ Sterk | ✅ Sterk | | Tokenreductie voor CLI-output | ❌ Niet primair | ✅ Kernfunctie | | Geschikt voor regulated workloads | ✅ Met hardening | ⚠️ Alleen na wrapper |
9Router is geen LiteLLM-killer. Het is een bovenlaag — een agent-router die vóór de governance-gateway zit.
De juiste architectuur: stapelen, niet kiezen
┌─────────────────────────────────────────────┐
│ Claude Code / Codex / OpenCode / Kilo │
│ Cursor / Cline / Continue / Roo │
└──────────────────┬──────────────────────────┘
│
▼
┌─────────────────────────────────────────────┐
│ 9Router (Agent Router) │
│ • RTK Token Saver (20-40% besparing) │
│ • OAuth auto-refresh │
│ • Free-tier aggregatie │
│ • Format translation │
└──────────────────┬──────────────────────────┘
│
▼
┌─────────────────────────────────────────────┐
│ LiteLLM (Governance Gateway) │
│ • Virtual keys + tenant isolatie │
│ • Budgetten + rate limits │
│ • Spend tracking + chargeback │
│ • Guardrails + logging hooks │
│ • Admin dashboard + SSO │
└──────────────────┬──────────────────────────┘
│
▼
┌─────────────────────────────────────────────┐
│ Approved Providers │
│ • Local Ollama / vLLM (soeverein) │
│ • Azure OpenAI / Anthropic / Gemini │
│ • NVIDIA endpoint │
│ • OpenRouter (alleen waar toegestaan) │
└─────────────────────────────────────────────┘
Dit geeft het beste van beide werelden: 9Router optimaliseert de developer experience. LiteLLM bewaakt de governance. En policy bepaalt welke route welke workload mag nemen.
Drie routes, drie risicoprofielen
Voor een productie-architectuur definieer je drie gescheiden routes:
🟢 Local-Only
Gevoelige code, security analyses, architectuurdocumenten, interne repositories. Routeert uitsluitend naar lokale modellen: Ollama, vLLM, llama.cpp. Nooit via 9Router naar externe providers.
# Direct naar LiteLLM → Ollama, géén 9Router
export ANTHROPIC_BASE_URL=http://localhost:4000/v1
🟡 Approved-Cloud
Niet-gevoelige maar serieuze engineeringtaken. Route: 9Router → LiteLLM → goedgekeurde cloudproviders. Met logging, budgetten en policies intact.
# 9Router voor token saving + fallback vóór LiteLLM
export ANTHROPIC_BASE_URL=http://localhost:20128/v1
# 9Router config: upstream = LiteLLM
🔴 Experimental-Free
Disposable tests, benchmarks, prompt-experimenten, open-source demo's. Hier mag 9Router direct schakelen tussen free-tier providers, maar nooit met secrets, credentials of klantdata.
# 9Router standalone — alleen voor experimenten
export ANTHROPIC_BASE_URL=http://localhost:20128/v1
RTK Token Saver: de stille motor
RTK is 9Routers meest ondergewaardeerde feature. Het detecteert tool-outputs — git diff, grep, find, ls, tree, log dumps — en past lossless compressie toe vóór de request naar de LLM gaat:
| Scenario | Zonder RTK | Met RTK | Besparing |
|----------|-----------|---------|-----------|
| git diff (500 regels) | 47K tokens | 28K tokens | 40% |
| grep door codebase | 12K tokens | 8K tokens | 33% |
| ls -la van /node_modules | 35K tokens | 20K tokens | 43% |
Het mechanisme is elegant: RTK peekt de eerste 1KB van elke tool_result, herkent het formaat, en kiest het juiste compressiefilter. Faalt een filter? Dan wordt de originele output doorgestuurd — errors breken nooit je request. Het werkt vóór elke format translation, dus het is universeel toepasbaar.
Voor een intensieve Claude Code-sessie met >100 tool-calls: duizenden tokens per dag bespaard. Dat is directe kostenreductie op elke paid API.
Waar 9Router níet thuishoort
Publieke sector, enterprise, gereguleerde omgevingen. De reden is simpel: 9Routers free-tier providers (Kiro, OpenCode Free) zijn Vietnamese/Aziatische services. Je prompts, code-snippets, en tool-outputs verlaten het LAN. Dat is onacceptabel voor:
- Overheidsinstellingen (BIO2, BBN-classificatie)
- Zorg (NEN 7510)
- Financiële instellingen (AVG art. 32)
- Elke organisatie met dataclassificatie boven "openbaar"
Daarnaast concentreert 9Router credentials, OAuth-tokens, providerconfiguratie en logs in één lokale service — zonder de governance-laag die LiteLLM wél biedt (virtual keys, tenant isolatie, audit logging). In een NSA MCP-security lens: 9Router is een MCP-achtige proxy met dezelfde kwetsbaarheden — token lifecycle, message integrity, audit trail — maar zonder protocol-level hardening.
Deployment voor het Agentic OS Lab
Voor ontwikkelaars die lokaal experimenteren met Claude Code, Codex, OpenCode of Kilo Code is de setup triviaal:
# Installatie
npm install -g 9router
9router
# Dashboard opent op http://localhost:20128
# Endpoint: http://localhost:20128/v1
# API key: kopiëren uit dashboard
# Claude Code config
export ANTHROPIC_BASE_URL=http://localhost:20128/v1
export ANTHROPIC_API_KEY=<9router-api-key>
# Codex config
export CODEX_BASE_URL=http://localhost:20128/v1
export CODEX_API_KEY=<9router-api-key>
Voor LAN-gedeeld gebruik is er een Docker image, maar dat raden we af voor productie — de free-tier providers exfiltreren data, en zonder LiteLLM als governance-laag heb je geen zicht op wat er met je prompts gebeurt.
Conclusie
9Router is geen enterprise-alternatief voor LiteLLM. Het is een developer-first agent-router die excelleert in tokenbesparing, provider-flexibiliteit en free-tier aggregatie. De juiste architectuur is niet kiezen, maar stapelen: 9Router als optimaliserende bovenlaag vóór LiteLLM als governance-gateway.
Voor persoonlijke R&D, Agentic OS-experimenten en coding-workflows: een uitstekende toevoeging. Voor regulated workloads: alleen met een stevige governance-wrapper.
De les is breder dan 9Router alleen. In het AI-infrastructuurlandschap van 2026 is de reflex "kan X Y vervangen?" zelden de juiste. De betere vraag is: "op welke laag in de stack levert X de meeste waarde, en welke laag moet eronder om het veilig te houden?"
Dit artikel is onderdeel van DjimIT's doorlopende analyse van AI-infrastructuur. Eerder bespraken we MCP-security volgens de NSA en CUSP's bevindingen over AI-forecasting.
AI & Security Intelligence
Wekelijkse nieuwsbrief met AI updates, security alerts en compliance inzichten — direct in uw inbox.
Doorlopend Advies
Wilt u structurele begeleiding op AI, security & compliance?
Met een Advisory Subscription heeft u een externe sparringpartner die meedenkt op strategisch en technisch niveau — zonder de overhead van een fulltime dienstverband. Vanaf €1.500 per maand, maandelijks opzegbaar.
Ontdek Advisory Subscription →