← Terug naar nieuwsbrief

AI Nieuws 18 april 2025

Nieuwsbrief

By Dennis Landman Djimit.

1. OpenAI introduceert o3 en o4-mini: Een nieuwe generatie redenerende AI-modellen

Bron: OpenAI, 16 april 2025Link: Introducing OpenAI o3 and o4-mini

OpenAI heeft gisteren o3 en o4-mini aangekondigd, de nieuwste AI-modellen in hun o-serie die zijn getraind om langer na te denken voordat ze reageren. Deze modellen kunnen voor het eerst alle beschikbare tools binnen ChatGPT combineren (web zoeken, Python voor data-analyse, visuele input verwerken en beelden genereren). In professionele evaluaties maakt o3 20% minder grote fouten dan zijn voorganger op complexe taken, met vooral sterke prestaties in programmeren, bedrijfsanalyse en creatief denken. OpenAI o4-mini is een kleiner, kostenefficiënt model dat opmerkelijke prestaties levert in wiskunde, codering en visuele taken – het behaalt 99,5% pass@1 op AIME 2025-wiskundeproblemen en overtreft concurrerende modellen.

De belangrijkste innovatie is dat beide modellen zijn getraind om ’te denken met beelden’, waardoor ze complexe visuele informatie direct in hun redeneringen kunnen verwerken. Dit maakt ze bijzonder effectief voor bedrijfstoepassingen die een combinatie van visuele en tekstuele gegevens omvatten, zoals het analyseren van diagrammen of whiteboard-schetsen.

Strategische impact: Deze technologie zet een nieuwe standaard voor AI-mogelijkheden in zakelijke omgevingen, met name voor organisaties die complexe visuele en tekstuele data moeten analyseren. De combinatie van geavanceerd redeneren met volledige tool-integratie biedt mogelijkheden voor autonomere AI-assistenten die complexere taken kunnen uitvoeren met minimale menselijke tussenkomst.OpenAI

2. Google introduceert Gemini 2.5 Flash: Eerste hybride redenerende AI-model

Bron: Google DeepMind, 17 april 2025Link: Developers can now start building with Gemini 2.5 Flash

Google heeft gisteren Gemini 2.5 Flash uitgebracht, hun eerste volledig hybride redenerende AI-model. De belangrijkste innovatie is de mogelijkheid om “denken” aan of uit te zetten en zelfs “denkbudgetten” in te stellen om de balans tussen kwaliteit, kosten en snelheid te optimaliseren. Met deze techniek kan het model tot 600% kostenefficiënter werken wanneer het niet voor alle taken op volle kracht hoeft te redeneren.

Zelfs wanneer het denkproces is uitgeschakeld, behoudt het model de snelheid van zijn voorganger (2.0 Flash) terwijl het betere prestaties levert. Dit maakt het bijzonder geschikt voor grootschalige implementaties waar kostenefficiëntie van belang is. Het model is nu beschikbaar via de Gemini API in Google AI Studio en Vertex AI, naast de consumentengerichte Gemini-app.

Strategische impact: De mogelijkheid om “denkbudgetten” in te stellen vertegenwoordigt een belangrijke doorbraak in het beheer van AI-redeneerkosten, waardoor ondernemingen fijnmaziger controle krijgen over de inzet van AI-resources. Deze flexibiliteit stelt organisaties in staat om de balans te vinden tussen prestaties en kosten, waardoor geavanceerde AI-functionaliteit toegankelijker wordt voor meer toepassingen.Google Blog

3. Huawei’s CloudMatrix 384 Supernode daagt Nvidia’s AI-dominantie uit

Bron: AI News, 17 april 2025Link: Huawei’s AI hardware breakthrough challenges Nvidia’s dominance

Huawei heeft de CloudMatrix 384 Supernode geïntroduceerd, een revolutionair AI-computersysteem dat volgens Chinese media maar liefst 300 petaflops rekenkracht levert – aanzienlijk meer dan de 180 petaflops van Nvidia’s NVL72-systeem. Het systeem is specifiek ontworpen om rekenproblemen op te lossen die ontstaan bij steeds grotere en complexere AI-modellen, en kan een doorvoer van 1.920 tokens per seconde bereiken met vergelijkbare nauwkeurigheid als Nvidia’s H100-chips.

Wat deze doorbraak bijzonder opmerkelijk maakt, is dat ze is bereikt ondanks de strenge Amerikaanse technologische beperkingen waarmee Huawei wordt geconfronteerd sinds het bedrijf op de Amerikaanse entiteitslijst werd geplaatst. De kern van de technologische vooruitgang lijkt Huawei’s antwoord te zijn op Nvidia’s NVLink – een hoge-snelheidsverbindingstechnologie die meerdere GPUs efficiënt laat communiceren.

Strategische impact: Voor de mondiale AI-gemeenschap zou de opkomst van levensvatbare alternatieven voor Nvidia’s hardware uiteindelijk de rekenproblemen kunnen aanpakken die de AI-vooruitgang hebben beperkt. Concurrentie in deze ruimte kan de beschikbare rekencapaciteit potentieel vergroten en ontwikkelaars meer opties bieden voor het trainen en implementeren van hun modellen. De ontwikkeling geeft ook aan dat China, ondanks sancties, significante vooruitgang boekt in het nastreven van technologische zelfvoorziening in kritieke AI-infrastructuur.AI News

4. SANS Institute presenteert risicogebaseerde aanpak voor AI-beveiliging

Bron: SANS Institute, 15 april 2025Link: Securing AI in 2025: A Risk-Based Approach to AI Controls and Governance

Het SANS Institute heeft zijn “Draft Critical AI Security Guidelines v1.1” gepubliceerd, waarin wordt beschreven hoe organisaties AI veilig en effectief kunnen implementeren met behulp van een risicogebaseerde aanpak. Het rapport identificeert zes kritieke controlegebieden waarop organisaties zich moeten richten om risico’s te beperken en veilige AI-implementatie te waarborgen:

Strategische impact: De richtlijnen bieden een praktisch kader voor organisaties om AI veilig te implementeren, rekening houdend met zowel technische beveiliging als governance. Het benadrukt dat AI-beveiliging een continu proces is dat voortdurende aanpassing vereist naarmate AI evolueert. Voor besluitvormers onderstreept het de noodzaak van een geleidelijke, risico-gebaseerde benadering van AI-adoptie, beginnend met niet-kritieke systemen voordat wordt uitgebreid naar kritieke toepassingen.SANS Institute

5. MLOps in 2025: Nieuwe trends en tools voor schaalbare AI-operaties

Bron: InfoWorld & DataCamp, februari-april 2025Link: Key strategies for MLops success in 2025 & 25 Top MLOps Tools You Need to Know in 2025

In 2025 evolueert MLOps naar een meer gestroomlijnde, schaalbare benadering van AI-implementatie met nieuwe opkomende trends:

Strategische impact: De evolutie van MLOps-tools in 2025 legt de nadruk op het overbruggen van de kloof tussen AI-ontwikkeling en operationele implementatie. Voor organisaties betekent dit dat de complexiteit van het beheren van AI-levenscycli wordt verminderd, waardoor snellere time-to-market en betrouwbaardere AI-systemen mogelijk worden. De focus verschuift van alleen het bouwen van modellen naar het creëren van duurzame, schaalbare infrastructuur die AI-innovatie ondersteunt.InfoWorld

Insight of the Day

“Nu generatieve AI zich in de onderneming beweegt van experimentele fase naar productie-implementaties, wordt de rol van MLOps cruciaal. De beste bedrijven investeren niet alleen in geavanceerde modellen, maar ook in robuuste operationele kaders die prestaties waarborgen, kosten beheersen en compliance verzekeren.” – Uit het onderzoek naar MLOps Maturity van McKinsey, april 2025.

Bronnen

DjimIT Nieuwsbrief

AI updates, praktijkcases en tool reviews — tweewekelijks, direct in uw inbox.