Insights

Agentic RAG 101: De intelligente beslissingsboom achter betrouwbare agentic RAG-systemen

Retrieval-Augmented Generation (RAG) was jarenlang het fundament om Large Language Models, zoals ChatGPT, betrouwbaar en domeinspecifieker te maken. Maar ondertussen klopt de toekomst al aan de deur. Door de komst van autonome AI-agents en data-orchestratie verschuift de focus van louter antwoorden geven naar actief nadenken over hoe die antwoorden tot stand komen. Het resultaat: 'agentic RAG', een adaptief en zelfcorrigerend systeem dat de klassieke RAG-pipeline overstijgt.

26/8/2025
5 min. leestijd
Yannick Bontemps
Solution Architect & Technology Strategist

De RAG-pipelines zoals we die vandaag kennen, doen één ding: ze halen documenten op en genereren een antwoord. Maar dat gebeurt blind, zonder dat het systeem beslist wanneer of hoe het moet zoeken. En de input die ze verzamelen? Die leidt lang niet altijd tot het juiste antwoord.

Dus, wat als je model meer kon? Wat als het zelf kon bepalen of er extra zoekacties nodig zijn, het de resultaten kritisch kon beoordelen en zelfs de query zou herschrijven als de eerste poging mislukt? Dat is de belofte van agentic RAG: een intelligentere generatie waarbij autonome agents het retrieval- en generatieproces sturen van begin tot eind.

In deze blog tonen we stap voor stap hoe zo'n systeem denkt en beslist. Benieuwd naar de code die daarachter schuilt? Ons Studio Fledge tech-team gidst je op Medium door de technische kant van agentic RAG.

Wat maakt dit RAG-systeem “agentic”?

Eén van de meest significante verschillen tussen klassieke RAG en agentic RAG zit in het beslissingproces. Waar traditionele RAG een vast retrieval-en generatiepad volgt, werkt agentic RAG met checkpoints. Momenten waarop het systeem beslist wat de volgende stap moet zijn, afhankelijk van de kwaliteit van de informatie. Dat ziet er ongeveer zo uit:

  • Slimme zoekopdrachten: Een supervisor-agent beoordeelt eerst de vraag: is retrieval nodig of volstaat de bestaande kennis? Basisvragen zoals "Wat is Python?" worden meteen beantwoord, terwijl technische of domeinspecifieke vragen een gerichte zoekactie activeren.  
  • Zelfcorrigerende queries: Levert de eerste zoekopdracht geen bruikbare resultaten op, dan herformuleert het systeem de query of test het een andere invalshoek. Dit systeem blijft zoeken tot er een relevant antwoord ontstaat, of het eerlijk toegeeft dat het antwoord niet in de kennisbank zit.
  • Kwaliteitscontrole: Agentic RAG controleert zowel de opgehaalde passages als het uiteindelijke antwoord. Zijn de documenten relevant? En is het gegenereerde antwoord een direct antwoord op de vraag en is het gebaseerd op die bronnen?

Kortom: agentic RAG combineert intelligent zoeken met zelfcorrectie en transparantie. Dat maakt het betrouwbaarder dan klassieke RAG.

Architectuuroverzicht: de intelligente beslisflow

In tegenstelling tot traditionele RAG-werkstromen volgt agentic RAG een verfijnd beslissingsproces dat zich kan aanpassen op basis van kwaliteitsbeoordelingen in elke stap:

Supervise → Documenten ophalen → Documenten beoordelen → Genereren → Antwoord beoordelen → Afronden

Het systeem kan bij elke stap die volgorde bijsturen. Vindt de documentbeoordeling bijvoorbeeld weinig relevantie informatie, dan wordt de query herschreven en opnieuw uitgevoerd. Is het gegenereerde antwoord onvoldoende onderbouwd of niet bruikbaar, dan wordt de input verbeterd in plaats van een middelmatig antwoord te genereren. Zo blijft agentic RAG intelligent, zelfcorrigerend en betrouwbaar.

Hoe het systeem werkt: stap-voor-stap deep-dive

  1. Supervise

Het systeem start dus met een simpele, maar cruciale vraag: moeten we überhaupt zoeken? De meeste vragen zijn basisinformatie of algemeen bekend bij het model. In zo'n gevallen slaat het systeem de retrieval over, wat kosten, latency en ruis vermindert. Voor specifieke vragen, zoals procedures, beperkingen en productversies, activeert de supervisor retrieval en geeft de query door.

  1. Retrieve

Het systeem doorzoekt documenten om de juiste antwoorden te vinden, waarbij semantische relevantie centraal staat. De meest relevante resultaten worden geordend en samengevat tot een compacte, informatieve context.

  1. Documenten beoordelen

Nog voor het systeem een antwoord genereert, beoordeelt een 'grader' of de opgehaalde documenten echt relevant zijn voor de vraag. Off-topic of misleidende passages worden genegeerd, terwijl nuttige context behouden blijft. Voldoet de kwaliteit niet, dan gaat het systeem niet door, maar stuurt het de query terug voor verbetering.

  1. Query herschrijven

Is de relevantie laag? Dan past het systeem de zoekopdracht aan. Denk aan nieuwe termen, synoniemen, andere scope en een frisse invalshoek. Daarbij onthoudt het eerdere pogingen om herhaling te vermijden en beperkt het aantal pogingen (bijvoorbeeld drie) zodat doorzettingsvermogen en pragmatisme in balans blijven.

  1. Genereren

Een antwoord wordt pas gegenereerd wanneer de context aan de kwaliteitsnorm voldoet. Dat antwoord moet specifiek, bruikbaar en goed onderbouwd zijn. Is die context onvoldoende, dan meldt het systeem dit eerlijk.

  1. Antwoord beoordelen

Een tweede 'grader' controleert twee zaken:

  • Is het antwoord onderbouwd met de juiste feiten of wordt onzekerheid duidelijk aangegeven?
  • Beantwoordt het antwoord de vraag volledig en met voldoende detail?

Schiet het antwoord op één van beide punten tekort, dan start het systeem een nieuwe ronde: het verbetert de zoekactie, scherpt de vraag aan of geeft expliciet aan wanneer het onzeker is.

  1. Afronden of onzekerheid toegeven

Agentic RAG geeft alleen antwoorden wanneer het zeker is van de juistheid. Bij twijfel of onvoldoende resultaten deelt het eerlijk de best beschikbare informatie, waardoor misleidende zekerheid wordt vermeden en het vertrouwen van de gebruiker groeit. In plaats van een rechte, kwetsbare lijn werkt het systeem via een slimmere cyclus: het beslist zelf wanneer het moet zoeken, beoordeelt de gevonden informatie, verfijnt zijn zoekstrategie en is transparant over wat het wel en niet weet. Het resultaat is een betrouwbare, doordachte partner die snel handelt waar mogelijk, voorzichtig is waar nodig en altijd streeft naar een nuttig, goed onderbouwd antwoord.

Wil je de volledige code en alle implementatiedetails van deze architectuur zien? Bekijk dan Studio Fledge’s stapsgewijze coding guide en onze GitHub-repo. Dit artikel richt zich vooral op het waarom en hoe op systeemniveau, zodat je eerst kunt bepalen waar agentic RAG in jouw stack past, nog vóór je een dependencylijst opent.

Relevante insights

Ook interessant

29/7/2025

Conversion Design: strategie vermomd als eenvoud

23/6/2025

Het fiscale en juridische landschap in beweging: wat moet je weten als ondernemer over de wetswijzigingen van Q2 2025

15/5/2025

Rijk gevuld maar toch licht verteerbaar – dit was onze eerste Rise & Shine sessie