Insights

Agentic RAG 101: De intelligente beslissingsstroom achter betrouwbare agentic RAG-systemen

Retrieval-Augmented Generation (RAG) is de afgelopen jaren uitgegroeid tot een populaire techniek om grote taalmodellen te onderbouwen met betrouwbare, domeinspecifieke informatie. Maar de AI-spotlight verschuift: van generatieve AI naar autonome agents en data-orkestratie. Systemen gaan niet langer gewoonweg vragen beantwoorden, maar gaan actief nadenken hoe ze het beste antwoord kunnen genereren. Het is in deze context dat Agentic RAG de kop opsteekt: een evolutie van de klassieke RAG-pipeline naar een adaptief, zelfcorrigerend en contextbewust systeem.

26/8/2025
5 min. leestijd
Yannick Bontemps
Solution Architect & Technology Strategist

Traditionele RAG-pipelines gaan rechtlijnig te werk: ze halen documenten op en genereren een antwoord. Maar een zoekopdracht is niet altijd nodig, en de input is niet altijd voldoende om een correct antwoord te geven. Wat als je systeem zelf kon beslissen wanneer het moet zoeken, de opgehaalde informatie beoordeelt en de query herschrijft wanneer de eerste poging niet voldoet?

Dat is de belofte van agentic RAG: een intelligentere generatie waarbij autonome agents het retrieval- en generatieproces sturen van begin tot eind. Zie het als een upgrade van een basistool naar een slimme, zelfbewuste assistent die kan nadenken over zijn eigen prestaties en zich onmiddellijk kan aanpassen.

In deze blog nemen we je mee door ons agentic RAG systeem. We tonen stap voor stap hoe ons systeem denkt en beslist. Benieuwd naar de code die daarachter schuilt? Onze collega's bij Studio Fledge duiken in hun Medium-blog in de code en leren je hoe je zelf een agentic RAG-systeem kan bouwen.

Wat maakt dit RAG-systeem “agentic”?

Eén van de meest significante verschillen tussen klassieke RAG en agentic RAG zit in het beslissingproces. Waar traditionele RAG een vast retrieval-en generatiepad volgt, werkt agentic RAG met checkpoints. Op verschillende momenten beslist het systeem wat de volgende stap moet zijn, afhankelijk van de kwaliteit van de informatie. Dat ziet er ongeveer zo uit:

  • Slimme zoekopdrachten: Een supervisor-agent beoordeelt eerst de vraag: is retrieval nodig of volstaat de bestaande kennis? Basisvragen zoals "Wat is Python?" krijgen meteen een antwoord, terwijl technische of domeinspecifieke vragen een gerichte zoekactie activeren.  
  • Zelfcorrigerende queries: Levert de eerste zoekopdracht geen bruikbare resultaten op, dan herformuleert het systeem de query of test het een andere invalshoek. Ons systeem blijft zoeken tot het een relevant antwoord kan formuleren, of het eerlijk moet toegeven dat het antwoord niet in de kennisbank zit. Ons systeem beperkt zich tot drie pogingen om betere resultaten te behalen zonder efficiëntie te verliezen. 
  • Kwaliteitscontrole: Het kwaliteitscontroleproces bestaat uit twee niveaus: eerst controleert het systeem of de opgehaalde passages echt relevant zijn, vervolgens verifieert het of het gegenereerde antwoord gebaseerd is op die passages en de oorspronkelijke vraag ook daadwerkelijk beantwoordt. Wanneer het systeem niet zeker is of onvoldoende informatie heeft, zal het dat ook erkennen in plaats van te improviseren. Eerlijkheid is een feature, geen fout.

Kortom: ons agentic RAG combineert intelligent zoeken met zelfcorrectie en transparantie. Dat maakt het betrouwbaarder dan klassieke RAG.

Architectuuroverzicht: de intelligente beslissingsflow

In tegenstelling tot traditionele RAG-beslissingsstromen volgt ons agentic RAG-systeem een verfijnd beslissingsproces dat zich kan aanpassen op basis van kwaliteitsbeoordelingen in elke fase:

Supervise → Documenten ophalen → Documenten beoordelen → Genereren → Antwoord beoordelen → Afronden

Elke stap kan de stroom bijsturen.

Hoe het systeem werkt: stap-voor-stap deep-dive

  1. Supervise

Het systeem start dus met een simpele, maar cruciale vraag: moeten we überhaupt zoeken? De meeste vragen zijn basisinformatie of algemeen bekend bij het model. In zo'n gevallen slaat het systeem de retrieval over, wat kosten, latency en ruis vermindert. Voor specifieke vragen, zoals procedures, beperkingen en productversies, activeert de supervisor retrieval en geeft de query door.

  1. Retrieve

Het systeem doorzoekt documenten om de juiste antwoorden te vinden, waarbij semantische relevantie centraal staat. De meest relevante resultaten worden geordend en samengevat tot een compacte, informatieve context.

  1. Documenten beoordelen

Nog voor het systeem een antwoord genereert, beoordeelt een 'grader' of de opgehaalde documenten echt relevant zijn voor de vraag. Off-topic of misleidende passages worden genegeerd, terwijl nuttige context behouden blijft. Voldoet de kwaliteit niet, dan gaat het systeem niet door, maar stuurt het de query terug voor verbetering.

  1. Query herschrijven

Is de relevantie laag? Dan past het systeem de zoekopdracht aan. Denk aan nieuwe termen, synoniemen, andere scope en een frisse invalshoek. Daarbij onthoudt het eerdere pogingen om herhaling te vermijden en beperkt het de pogingen (bijvoorbeeld tot drie) zodat volharding en pragmatisme in balans blijven.

  1. Genereren

Het systeem genereert pas een antwoord als de context aan de kwaliteitsnorm voldoet. Dat antwoord moet specifiek, bruikbaar en goed onderbouwd zijn. Is die context onvoldoende, dan meldt het systeem dit eerlijk.

  1. Antwoord beoordelen

Een tweede 'grader' controleert twee zaken:
- Is het antwoord onderbouwd met de juiste feiten of geeft het voldoende duidelijk onzekerheid aan?
- Beantwoordt het antwoord de vraag volledig en met voldoende detail?
Schiet het antwoord op één van beide punten tekort, dan start het systeem een nieuwe ronde: het verbetert de zoekactie, scherpt de vraag aan of geeft expliciet aan wanneer het onzeker is.

  1. Afronden of onzekerheid toegeven

Agentic RAG geeft alleen antwoorden wanneer het zeker is van zijn stuk. Bij twijfel of onvoldoende resultaten deelt het eerlijk de best beschikbare informatie. Zo vermijdt ons agentic RAG-systeem misleidende zekerheid en verdient het meer vertrouwen van de gebruiker. Want die laatste verkiest natuurlijk duidelijke grenzen boven overtuigde hallucinaties.

Agentic RAG transformeert een fragiele pipeline tot een doordachte lus. Het beslist zelf wanneer het moet zoeken, beoordeelt de gevonden informatie, verfijnt zijn zoekstrategie en is eerlijk over wat het wel en niet weet. Het resultaat is een betrouwbare, doordachte partner die minder tot niet hallucineert, snel handelt waar mogelijk, voorzichtig is waar nodig en altijd streeft naar een nuttig, goed onderbouwd antwoord.

Wil je de volledige code en alle implementatiedetails van deze architectuur zien? Bekijk dan Studio Fledge’s stapsgewijze coding guide en onze GitHub-repo. Dit artikel richt zich vooral op het waarom en hoe op systeemniveau, zodat je eerst kunt bepalen waar agentic RAG in jouw stack past, nog vóór je een dependencylijst opent.

Relevante insights

Ook interessant

29/7/2025

Conversion Design: strategie vermomd als eenvoud

23/6/2025

Het fiscale en juridische landschap in beweging: wat moet je weten als ondernemer over de wetswijzigingen van Q2 2025

15/5/2025

Rijk gevuld maar toch licht verteerbaar – dit was onze eerste Rise & Shine sessie