Wat is 'agentic AI' eigenlijk?
Agentic AI verwijst naar AI-systemen die niet alleen output genereren op een enkele prompt, maar actief taken uitvoeren in meerdere stappen — informatie ophalen, beslissingen nemen, handelingen verrichten in andere systemen, en zichzelf bijsturen op basis van de uitkomst. In tegenstelling tot een chatbot die antwoordt op een vraag, kan een AI-agent een stuk werk 'doen'.
In de zorg betekent dat bijvoorbeeld: een agent die intake-vragenlijsten doorneemt, relevante informatie uit een EPD haalt, een conceptzorgplan voorstelt en het ter accordering naar de behandelaar stuurt. Of een agent die een terugbelafspraak inplant, het ECD bijwerkt en een SMS-herinnering aan de cliënt stuurt — allemaal vanuit één instructie van een professional.
De technologische vooruitgang sinds 2023 maakt agentic AI mogelijk in een schaal die eerder ondenkbaar was. Tegelijkertijd geldt: hoe groter de actieruimte van een AI-systeem, hoe groter de mogelijke gevolgen van een fout. Dat is waarom in de zorg vier principes onderhandelbaar zijn — en niet meer.
1. Mens altijd in de lus
Klinische beslissingen worden door mensen genomen. AI stelt voor, contextualiseert, schrijft eerste versies. Accorderen, aanpassen en beslissen is en blijft mensenwerk. Dit is geen ontwerpkeuze die je later weer kunt uitschakelen voor 'efficiëntie' — het is een architectuurprincipe.
Concreet betekent dit: AI mag een conceptbrief schrijven, maar de behandelaar verstuurt hem. AI mag een planningsvoorstel doen, maar de planner accordeert. AI mag een risicoflag plaatsen, maar de zorgverantwoordelijke acteert (of besluit niet te acteren, met verantwoording). De AI is een instrument; de professional is de actor.
Onder de Europese AI Act vallen AI-systemen in de zorg in de hoog-risico-categorie, met expliciete eisen aan menselijk toezicht. 'Mens in de lus' is daarmee niet alleen een ethische keuze maar een wettelijke vereiste. Een AI-systeem dat zonder menselijke tussenkomst medische beslissingen autonoom doorvoert, is in Europa per definitie non-compliant in een klinische context.
Dit principe heeft consequenties voor hoe je AI inzet. Het werkt het best in workflows waar al een menselijke goedkeuring zit (de behandelaar leest de brief alvorens te versturen). Het werkt slechter waar je 'volledige automatisering' verwachtte. Veel AI-projecten in de zorg falen niet op de techniek maar op de verkeerde verwachting van wat AI mag autonoom doen.
2. Verklaarbaarheid boven prestatie
Een model dat niet kan uitleggen waarom, mag niet. Eenvoudiger maar inzichtelijker wint het in de zorg bijna altijd van spectaculair maar opaak. Dat klinkt als een conservatieve keuze. Het is in werkelijkheid een keuze die op de lange termijn meer waarde oplevert.
Onuitlegbare AI is voor zorgprofessionals onbruikbaar. De plicht tot informeren van de cliënt (AVG art. 13–15), de eis tot toelichten van geautomatiseerde beslissingen (art. 22) en de tuchtrechtelijke verantwoordelijkheid voor klinische besluiten maken transparantie geen feature maar een randvoorwaarde.
Verklaarbaarheid betekent niet altijd technisch 'explainable AI' in de academische zin. Het betekent praktisch: de AI laat zien welke data zij heeft gebruikt, welke regels zij heeft gevolgd, en — bij data-driven modellen — welke factoren het zwaarst hebben meegewogen. Een retrieval-augmented model dat broninformatie citeert is vaak transparanter en bruikbaarder dan een black-box-classifier die alleen een score geeft.
In de praktijk zien we dat verklaarbaarheid de adoptie versnelt. Professionals gebruiken AI vaker als ze haar werk kunnen volgen — en gebruiken haar uitkomsten vaker terecht. Een 'intelligenter' model dat onbruikbaar is, levert minder waarde dan een eenvoudiger model dat iedere dag wordt gebruikt.
3. Data blijft binnen de muren
Zorgdata verlaat de EU niet. Private deployment of on-premise-vriendelijke modellen zijn de enige optie voor klinische data-verwerking. Dit is geen voorkeur — het is kader. AVG, NEN 7510 en de aanstaande EHDS-verordening leggen voor gezondheidsgegevens harde eisen op aan dataresidency, encryptie, toegangsbeheer en doelbinding.
In praktijk betekent dit: de modellen worden gedraaid in EU-cloud-regio's of on-premise; data wordt niet gebruikt voor het trainen van modellen die ook aan andere klanten worden geleverd; en API's naar AI-providers buiten de EU worden alleen gebruikt voor data die expliciet ge-pseudonimiseerd of de-identificeerd is, met DPIA en juridische grondslag.
Dat sluit niet alle moderne AI uit — maar het maakt wel verschil welke AI-architecturen geschikt zijn. Hosted SaaS-modellen die alle prompts loggen, zijn voor klinische data zelden compliant. Modellen die je in eigen omgeving kunt deployen — of via partners die EU-residency en data-isolatie garanderen — zijn de werkbare route. Dit is iets wat AI-leveranciers snappen of niet snappen; bij twijfel is het 'niet'.
4. Registreer de AI zelf
Elke AI-actie is audit-logged. Wat stelde de AI voor, wat werd goedgekeurd, wat werd afgewezen? Dit is hoe je over twee jaar kunt uitleggen wat er is gebeurd. Het is ook hoe je leert wat werkt en wat niet — want zonder log heb je geen empirische basis voor verbetering.
De audit-log van een zorg-AI moet minimaal bevatten: het tijdstip, de actor (welke gebruiker, welke AI-versie), de input, de gegenereerde uitvoer, de menselijke beslissing en de datatoegangen die zijn gebruikt om tot de uitvoer te komen. Onveranderbaar (immutable) opgeslagen, lang genoeg bewaard om aan retentie-eisen te voldoen, en ontkoppeld van de klinische data zelf voor toegangscontrole.
Dit principe heeft een tweede effect dat vaak wordt onderschat: het maakt continue evaluatie mogelijk. Wanneer je weet welke AI-suggesties zijn afgewezen, kun je de signaalwaarde meten van wat de AI doet. Welke type voorstellen worden vaak overgenomen? Welke niet? Daar zit de echte product-leerlus — die zonder audit-log onmogelijk is.
Voor de toezichthouders (AP, IGJ) en voor de patiënt zelf maakt audit-logging de inzet van AI uitlegbaar achteraf. Voor de organisatie maakt het de inzet van AI verbeterbaar over tijd. Beide zijn voorwaarden voor schaal — niet pas wanneer je groot bent, maar vanaf de eerste production-deploy.
Wat dit betekent in de praktijk
Deze vier principes klinken streng. In praktijk zijn ze meer een filter dan een blokkade. Ze sluiten een aantal AI-toepassingen uit (volledig autonoom besluitende systemen, opake modellen, hosted niet-EU-AI op klinische data, AI zonder logging) en wijzen je richting de toepassingen die wel werken en duurzaam waarde leveren.
Concreet zien we drie type use-cases die binnen deze principes goed werken. Eén: documentatie-assistentie — automatische conceptverslagen, brieven, indicaties die de professional valideert. Twee: workflow-orkestratie — automatische routering, planning, herinneringen, met menselijke goedkeuring op kritische punten. Drie: signalering — risicoflags, vroege waarschuwingen, anomalie-detectie, waarbij het systeem alleen attendeert maar niet ingrijpt.
Wat we niet doen: AI inzetten voor diagnostische conclusies zonder klinische validatie, of AI gebruiken voor automatische triage-beslissingen zonder dat een mens kan terugfallen. De principes zijn niet bedoeld om AI klein te houden. Ze zijn bedoeld om AI groot te kunnen laten worden zonder dat het stuk gaat op het eerste incident.


