Waarom jouw AI-platform geen echte ontologie heeft
Vijf producten van vier van de grootste dataplatforms claimen in 2026 het woord "ontology": Databricks Genie Ontology, Palantir Foundry, Microsoft Fabric IQ, Snowflake Cortex Analyst en Snowflake's Open Semantic Interchange. De marketing belooft soevereiniteit, kennisinfrastructuur en betekenis. Maar Jessica Talisman, information architect en semantic engineer met 25 jaar ervaring bij Adobe en Amazon, trekt in haar Substack Intentional Arrangement één vernietigende conclusie:
"Against all claims, not one of these ontologies reasons."
Wat een ontologie wél is
Een ontologie is geen bestandsformaat. De term werd gedefinieerd door Thomas Gruber in 1993, vóór RDF bestond, als "een expliciete specificatie van een conceptualisatie, gemaakt in logica." De logica is het deel dat feiten en conclusies afleidt via reasoning en inference. Een ontologie zonder reasoning is een woordenlijst met een duur label.
Drie trends convergeren in 2026 op dit idee:
- Data sovereignty, organisaties willen zeggenschap over hun data én de betekenis ervan, niet alleen over waar de bytes staan
- Knowledge infrastructure, een persistente kennislaag die langer meegaat dan een dashboard, implementatie of product
- Meaning, betekenis die expliciet genoeg is voor een machine om er betrouwbaar op te handelen
Elke trend wijst naar de waarde die een echte ontologie levert. De vijf producten claimen die waarde te bieden. Maar wat leveren ze echt?
De vijf producten, claim vs realiteit
| Product | Claim | Wat het écht doet | Wat ontbreekt |
|---|---|---|---|
| Databricks Genie Ontology | "Living context graph" | OntoRank, een PageRank-variant die snippets rankt op autoriteit en versheid | Geen reasoning. "A popularity score is knowledge infrastructure the way a library's checkout counts are a thesaurus." |
| Palantir Foundry | "Ontology as operational model" | Objecten, properties, links + acties. Logica zit per actie, niet in het datamodel | Geen reasoner. "Asserting a new fact doesn't trigger consequences elsewhere." |
| Microsoft Fabric IQ | "Rule-driven inference" | Property graph traversal + event-condition-action regels. Geen inheritance. RDF niet ondersteund | "What Fabric IQ calls inference is graph traversal." Documentatie verwijst naar andere platforms voor Semantic Web. |
| Snowflake Cortex Analyst | "Semantic view" | YAML-model → SQL-generatie. Alleen joins die in het model staan | Geen inference. "Captured in a lightweight YAML file" = metadata, geen ontologie. |
| Snowflake OSI | "Open Semantic Interchange" | Open standaard voor datasets, fields, foreign keys, SQL aggregaties. Apache 2.0 | Eerlijkst: claimt géén ontologie te zijn. "OSI holds no axioms and no reasoner." |
Het patroon is consistent: retrieval wordt context genoemd, context wordt reasoning genoemd, maar de engine blijft een opslaglaag met traversal. De enige capability die soevereiniteit, kennisinfrastructuur én betekenis zou leveren, inference, ontbreekt in alle vijf.
De uitzondering die de regel bevestigt
Google's Open Knowledge Format (OKF), gepubliceerd in juni 2026 onder Apache 2.0, is een directory van markdown-bestanden met YAML frontmatter. Het claimt géén ontologie te zijn. Talisman: "Perhaps Google knows better than to inflate such a claim, given Google's contributions to the W3C and ontologies, ahem, Schema.org."
OKF is geen van de vijf producten onder review, maar staat als contrast: een open formaat dat zichzelf accuraat benoemt. De andere vier vragen een organisatie om het woord "ontology" te vertrouwen zonder de onderliggende architectuur om het waar te maken.
Waarom dit een soevereiniteitsprobleem is
Talisman legt de vinger op de zere plek: soevereiniteit over data begint bij structuren die een organisatie kan exporteren en waarover ze zelf kan redeneren. RDF, OWL en SPARQL zijn W3C-standaarden, open, niet eigendom van een vendor. Een model dat deze standaarden gebruikt, kan tussen tools bewegen met behoud van semantiek.
Een proprietary object model, een vendor's property graph of een self-assembling context graph biedt die portabiliteit niet. En zonder portabiliteit is er geen datasoevereiniteit.
De juridische context maakt dit urgent. De US CLOUD Act reikt naar data die wordt vastgehouden door een Amerikaanse provider, waar die data zich ook bevindt. FISA Section 702 autoriseert verzameling tegen niet-Amerikaanse personen. Talisman: "Legal control follows the company that holds the data, not the country where the server lives. The hard reality is that renting the building your data occupies leaves the meaning of that data inside someone else's system."
Gartner voorspelt wereldwijde sovereign cloud-uitgaven van bijna $80 miljard in 2026, een stijging van 36% in één jaar, met Europese uitgaven die nog sneller stijgen. Maar soevereiniteit over bytes is niet genoeg, het gaat om soevereiniteit over betekenis.
EU AI Act: traceerbaarheid vereist reasoning
De EU AI Act verplicht high-risk AI-systemen tot data governance (Art. 10), technische documentatie (Art. 11), automatische logging (Art. 12), transparantie (Art. 13) en menselijk toezicht (Art. 14). Deze verplichtingen vereisen dat een systeem kan verantwoorden hoe het tot een output kwam, niet alleen dát het een output produceerde.
Een proprietary "ontology" die niet redeneert, kan niet uitleggen wáárom een conclusie volgt uit de data. De inference-stap, het afleiden van nieuwe feiten uit bestaande axioma's, is precies wat een auditor nodig heeft om te verifiëren dat een AI-systeem compliant is.
De Digital Omnibus, die momenteel door de EU-instellingen beweegt, zou de standalone high-risk verplichtingen uitstellen tot december 2027. Dat geeft Nederlandse organisaties een window om hun kennisinfrastructuur op orde te brengen vóórdat de verplichtingen ingaan.
BIO2/NIS2: vendor lock-in als supply-chain risico
Voor Nederlandse overheidsorganisaties die Databricks, Palantir, Microsoft of Snowflake gebruiken, is Talismans analyse een compliance-waarschuwing:
BIO2. De Baseline vereist een actueel overzicht van assets, risico's en beheersmaatregelen. Als je betekenis niet kunt exporteren in een open standaard, heb je een vendor lock-in die je niet kunt auditen. Een proprietary "ontology" is een black box in je BIO2-landschap.
NIS2 / Cyberbeveiligingswet. Artikel 21 vereist supply-chain security. Een vendor die je data én de betekenis van je data in een proprietary formaat vasthoudt, is een supply-chain risico. Je kunt niet overstappen zonder semantiek te verliezen.
EU AI Act. Art. 12 vereist automatic logging voor traceerbaarheid. Zonder reasoning is er geen traceerbare keten van data naar conclusie. De inference-stap is het audit trail.
De neurosymbolische consensus
Talisman wijst op een groeiende body van peer-reviewed werk die aantoont dat symbolische structuren, taxonomieën, ontologieën, kennisgrafen, de stabiliteit, nauwkeurigheid en het geheugen leveren die statistische modellen op zichzelf missen. Google Research groundt zijn modellen in een gestructureerde kennisgraaf om factuality en reasoning te verbeteren en hallucinatie te verminderen.
De conclusie is helder: betrouwbare AI combineert neurale en symbolische methoden. De vijf producten beschrijven betekenis maar stoppen vóór de derivatie. Ze slaan de inference over, precies de capability die soevereiniteit, kennisinfrastructuur en betekenis zou leveren.
De kernboodschap
Vijf van de grootste dataplatforms verkopen je het woord "ontology" zonder de reasoning die een ontologie definieert. Wat je krijgt is retrieval, ranking, traversal of materialized lookup, geen inference. Voor datasoevereiniteit, EU AI Act-compliance en BIO2/NIS2-audits is dat het verschil tussen een certificaat aan de muur en daadwerkelijke controle over je kennisinfrastructuur.
Bron: Talisman, J. (2026). Not an Ontology: On data sovereignty, knowledge infrastructure and meaning. Intentional Arrangement (Substack), 25 juni 2026.
AI & Security Intelligence
Wekelijkse nieuwsbrief met AI updates, security alerts en compliance inzichten, direct in uw inbox.
Security & AI Operating Model
Advisory met executiekracht
Van BIO2 en NIS2 tot EU AI Act, embedded in uw operating model, niet als extern project. Maandelijks opzegbaar, met assessments als bewijsvoering.