AI-Nieuws 21 april 2025

By Dennis Landman

1. OpenAI’s nieuwe reasoning-modellen hebben hogere hallucinatiegraad

Bron: TechCrunch (18 april 2025)

**Samenvatting:**OpenAI’s recent gelanceerde o3 en o4-mini AI-modellen, ontworpen voor complexe redeneertaken, blijken aanzienlijk vaker te “hallucineren” (incorrecte informatie genereren) dan hun voorgangers. In interne tests hallucineert o3 in 33% van de gevallen op de PersonQA-benchmark, terwijl o4-mini zelfs in 48% van de gevallen onnauwkeurige informatie produceert – fors hoger dan de 14,8% bij eerdere modellen.

**Strategische impact:**De toenemende hallucinatie bij schaalvergroting van reasoning-modellen stelt fundamentele vragen over de huidige ontwikkelingsrichting van AI. Voor organisaties die vertrouwen op nauwkeurigheid (juridisch, medisch, financieel) vormt dit een belemmering voor implementatie. Het suggereert dat de huidige trainingsbenadering mogelijk fundamentele beperkingen heeft en dat nieuwe benaderingen, zoals het integreren van betrouwbare zoekmogelijkheden, noodzakelijk kunnen zijn.TechCrunch

2. Google DeepMind presenteert doorbraak in AI-veiligheid met CaMeL-framework

Bron: Ars Technica (16 april 2025)

**Samenvatting:**Google DeepMind heeft CaMeL (CApabilities for MachinE Learning) ontwikkeld, een fundamenteel nieuwe aanpak om prompt-injectie-aanvallen bij AI-systemen te voorkomen. In tegenstelling tot eerdere oplossingen die op detectie vertrouwden, behandelt CaMeL taalmodellen als inherent onbetrouwbare componenten binnen een veiliger softwarekader, waarbij duidelijke grenzen worden gesteld tussen gebruikersopdrachten en potentieel kwaadaardige content.

**Strategische impact:**CaMeL introduceert bewezen beveiligingsprincipes uit de softwareontwikkeling in het AI-domein, wat een radicale verschuiving betekent van detectiestrategieën naar architecturele beveiligingscontroles. Dit kan de inzet van AI in bedrijfskritische processen zoals e-mailsystemen, bankwezen en documentverwerking aanzienlijk versnellen door het inherente risico van prompt-injectieaanvallen te beperken.Ars Technica

3. Stanford AI Index 2025 toont transformatie van AI-landschap

Bron: Stanford HAI (7 april 2025)

**Samenvatting:**Het Stanford AI Index-rapport 2025 toont een drastische verbetering in de efficiëntie van AI-modellen: kleinere modellen behalen nu resultaten die in 2022 alleen met 142 keer grotere modellen mogelijk waren. Daarnaast zijn de kosten voor het gebruik van AI-modellen tot 280 keer gedaald in 18 maanden. Tegelijkertijd is het aantal gerapporteerde AI-incidenten met 56,4% gestegen tot 233 in 2024.

**Strategische impact:**De kleinere, efficiëntere modellen democratiseren toegang tot geavanceerde AI, terwijl drastisch lagere kosten de economische barrières verlagen. Dit versnelt de adoptie, vooral in markten met beperkte resources. Tegelijkertijd onderstreept de toename in AI-incidenten de noodzaak voor verbeterde governance- en monitoringkaders. Opvallend is ook de verschuiving van federale naar statelijke regulering in de VS, wat implicaties heeft voor internationale harmonisatie van AI-wetgeving.Stanford HAI

4. China versnelt “belichaamde AI” met robotica en drones

Bron: The Guardian (21 april 2025)

**Samenvatting:**China intensiveert investeringen in “embodied AI” (belichaamde kunstmatige intelligentie) – de toepassing van AI in fysieke systemen zoals drones, robots en zelfrijdende voertuigen. De provinciale overheid van Guangdong heeft recent 60 miljoen yuan (6,4 miljoen pond) uitgetrokken voor innovatiecentra, waarbij Shenzhen als China’s dronehoofdstad fungeert. Daarnaast stimuleert de Chinese overheid bedrijven zoals DeepSeek, die met hun R1-model prestaties leveren vergelijkbaar met westerse concurrenten maar tegen een fractie van de kosten.

**Strategische impact:**China’s focus op belichaamde AI en open-source strategieën vormt een belangrijke verschuiving in het mondiale AI-landschap. Door AI te koppelen aan robotica en drones creëert China oplossingen voor demografische uitdagingen (vergrijzing/krimpende beroepsbevolking) en militaire capaciteiten. De snelle vooruitgang ondanks westerse exportbeperkingen op geavanceerde chips toont de effectiviteit van China’s strategie om efficiëntere AI-systemen te ontwikkelen die minder rekenkracht vereisen.The Guardian

5. OpenAI: “We staan op de drempel van systemen die nieuwe wetenschap kunnen doen”

Bron: RD World Online (16 april 2025)

**Samenvatting:**In haar bijgewerkte “Preparedness Framework” (versie 2) waarschuwt OpenAI dat AI-systemen op het punt staan om zelfstandig nieuwe wetenschappelijke ontdekkingen te doen. Het document beschrijft ook het risico van “recursieve zelfverbetering” van AI, waarbij het tempo van AI-onderzoek en -ontwikkeling zodanig zou kunnen versnellen dat menselijke controle in gevaar komt. OpenAI CFO Sarah Friar suggereerde tijdens een recent Goldman Sachs-evenement dat we mogelijk al in de buurt van Artificial General Intelligence (AGI) komen.

**Strategische impact:**De mogelijkheid dat AI zelfstandig wetenschappelijke doorbraken kan realiseren vormt een paradigmaverschuiving voor R&D-ecosystemen. Nationale laboratoria en onderzoeksinstellingen experimenteren al met ‘autonome onderzoekslabs’, waarbij AI hypotheses genereert, experimenten ontwerpt en resultaten analyseert. Deze transitie van AI als onderzoeksassistent naar AI als primaire onderzoeker heeft ingrijpende implicaties voor wetenschappelijk onderzoek, innovatiemodellen en intellectueel eigendom.RD World Online

Insight of the Day

“Kleine modellen worden beter, grote modellen hallucineren meer, en regulering verschuift van federaal naar statelijk niveau” – een paradoxale trend die wijst op de toenemende complexiteit van het AI-ecosysteem, zoals blijkt uit het Stanford AI Index 2025-rapport.

Dit overzicht illustreert hoe het AI-landschap in 2025 wordt gekenmerkt door tegenstrijdige trends: enerzijds worden modellen efficiënter en toegankelijker, anderzijds kampen de meest geavanceerde systemen met fundamentele nauwkeurigheidsproblemen. De concurrentie tussen de VS en China intensiveert, terwijl beide landen verschillende strategieën hanteren – met China’s focus op efficiency en embodied AI versus de Amerikaanse schaalvoordelen. Voor besluitvormers in de AI-sector onderstreept dit de noodzaak om zowel technische vooruitgang als de bijbehorende risico’s en regelgevende kaders in balans te houden.