Retrieval-Augmented Generation (RAG): De Zoekgestuurde AI-Revolutie in Chatbots en Bedrijfsapplicaties

RAG staat voor Retrieval-Augmented Generation, een hybride AI-benadering die een groot taalmodel combineert met een zoekmachine of database om externe kennis op te halen voor onderbouwde, actuele antwoorden.
In 2025 is RAG uitgegroeid tot een strategisch speerpunt voor moderne AI en drijft het intelligente chatbots, bedrijfsassistenten en andere contextbewuste toepassingen aan.
In de praktijk haalt een RAG-systeem eerst relevante documenten op uit een kennisbron, waarna de belangrijkste fragmenten aan de gebruikersvraag worden toegevoegd voordat het LLM het uiteindelijke antwoord genereert.
Patrick Lewis, die het team leidde dat de term “RAG” introduceerde in een Facebook AI-paper uit 2020, beschrijft RAG als een groeiende familie van methoden die de toekomst van generatieve AI vertegenwoordigen.
Zoals Patrick Lewis het verwoordt, kun je de retrieval-augmented aanpak implementeren met slechts vijf regels code.
Veel RAG-systemen geven de bronnen samen met het antwoord terug, waarbij documenttitels of URL’s worden verstrekt om verificatie en vertrouwen mogelijk te maken.
RAG maakt actuele antwoorden mogelijk door bij het opvragen verse informatie op te halen, waardoor nauwkeurige antwoorden over recente gebeurtenissen of nieuw beleid mogelijk zijn.
Het verlaagt de doorlopende kosten door volledige hertraining te vermijden; in plaats daarvan onderhouden organisaties een doorzoekbare index van data en laat het model deze raadplegen wanneer nodig.
Een opvallend gebruiksvoorbeeld is de AI-assistent voor clinici van de Mayo Clinic, die RAG gebruikt om GPT-gebaseerde dialogen te verbinden met actuele medische literatuur en patiëntgegevens, met bronvermeldingen.
In 2025 bieden grote technologiebedrijven RAG-oplossingen aan (de overname van Rockset door OpenAI in 2024, Microsoft Azure OpenAI, Google Vertex AI Search, Amazon Bedrock) en is er een bloeiend ecosysteem van tools zoals LangChain en Pinecone.

Generatieve AI heeft de verbeelding gevangen, maar retrieval-augmented generation – beter bekend als RAG – levert meetbare, onderbouwde impact op in verschillende sectoren ^[1]. Simpel gezegd is RAG een hybride AI-benadering die een groot taalmodel (LLM) combineert met een zoekmachine of database. Het resultaat is alsof je een superslimme chatbot toegang geeft tot een aangepaste bibliotheek of het web: hij kan “feiten opzoeken” wanneer nodig en die informatie gebruiken om nauwkeurigere, actuele antwoorden te geven. Deze combinatie van ophalen en genereren helpt hallucinaties te beperken, AI-antwoorden te verankeren aan echte bronnen, en de noodzaak voor dure modelhertraining te verminderen ^[2], ^[3]. In 2025 is RAG uitgegroeid tot een strategisch speerpunt voor moderne AI – het drijft intelligente chatbots, bedrijfsassistenten en andere toepassingen aan die betrouwbare, contextbewuste kennis vereisen.

Wat is RAG en hoe werkt het?

Retrieval-Augmented Generation (RAG) is een AI-framework dat een tekstgenererend model baseert op externe kennisbronnen ^[4]. Met andere woorden, het verrijkt een LLM (zoals GPT-4 of vergelijkbaar) door een retrieval-stap toe te voegen: wanneer de AI een vraag krijgt, zoekt het eerst in een verzameling documenten of een database naar relevante informatie, en gebruikt dat materiaal vervolgens om het antwoord te genereren ^[5]. Deze aanpak vult een cruciale leemte in de werking van standaard LLM’s op. Een op zichzelf staande LLM is als een zeer beleerd persoon die een gesloten-boekexamen aflegt – hij vertrouwt alleen op wat in zijn geheugen zit (zijn getrainde parameters). Daarentegen is een RAG-systeem als het afleggen van een open-boekexamen: het model kan externe tekst “on the fly” raadplegen voordat het antwoordt ^[6].

Hoe RAG in de praktijk werkt is eenvoudig. Eerst stelt een gebruiker een vraag of geeft een prompt. Vervolgens haalt het systeem relevante informatie op uit een kennisbron – dit kan een webzoekindex zijn, een vectordatabase met bedrijfsdocumenten, wiki-artikelen of een andere tekstcorpus. Stel bijvoorbeeld dat je een klantenservice-chatbot een gedetailleerde vraag stelt, dan kan het RAG-systeem interne beleidsbestanden, handleidingen of een support-kennisbank doorzoeken op trefwoorden en gerelateerde inhoud. Daarna worden de meest relevante fragmenten of documenten in de prompt gevoegd die aan de LLM wordt gegeven (vaak door ze aan de gebruikersvraag toe te voegen). Tot slot genereert de LLM een antwoord dat de opgehaalde feiten integreert met zijn eigen taalbegrip ^[7], ^[8]. In wezen “leest” de LLM het opgehaalde materiaal en stelt een samengesteld antwoord op, net als een student die verwijzingen in een essay opneemt. Dit proces zorgt ervoor dat de output gebaseerd is op echte data in plaats van alleen het parametrisch geheugen van het model ^[9]. Veel RAG-systemen geven ook de bronnen terug (bijvoorbeeld documenttitels of URL’s) naast het antwoord, zodat gebruikers de informatie kunnen verifiëren en erop kunnen vertrouwen ^[10].

Ter illustratie geeft Rick Merritt van NVIDIA een handige analogie: een rechter kan een grote algemene kennis van de wet hebben, maar voor een specifieke zaak stuurt de rechter een griffier naar de rechtsbibliotheek om relevante zaken en precedenten op te halen ^[11]. Hier is het LLM de rechter en RAG de ijverige griffier die de precieze benodigde feiten aanlevert. Patrick Lewis – de onderzoeker die het team leidde dat de term “RAG” bedacht in een Facebook AI-paper uit 2020 – beschrijft RAG als een “groeiende familie van methoden” waarvan hij gelooft dat het de toekomst van generatieve AI vertegenwoordigt ^[12]. Door krachtige generatieve modellen te koppelen aan externe kennis, stelt RAG AI in staat om verder te gaan dan het herhalen van trainingsdata en in plaats daarvan dynamisch nieuwe informatie op te halen op aanvraag ^[13]. Kortom, RAG verandert een LLM van een allesweter met een gesloten boek in een open-boek expert die bronnen kan citeren en op de hoogte kan blijven van de laatste informatie.

Waarom is RAG belangrijk?

RAG is belangrijk geworden omdat het direct enkele van de grootste beperkingen van op zichzelf staande AI-taalmodellen aanpakt. Hallucinaties – de neiging van LLM’s om aannemelijk klinkende maar onjuiste antwoorden te verzinnen – worden beperkt wanneer het model echte documenten heeft om naar te verwijzen. Door antwoorden te baseren op feiten, verhoogt RAG de nauwkeurigheid en betrouwbaarheid. “De twee belangrijkste dingen die RAG doet, met betrekking tot het bedrijfsleven, zijn dat het ons in staat stelt de antwoorden te herleiden en dat dit traceerbaar is,” zegt Dennis Perpetua, Global CTO bij Kyndryl ^[14]. Met andere woorden, een goed geïmplementeerd RAG-systeem kan niet alleen het juiste antwoord vinden, maar ook de bron tonen waar het vandaan komt – waardoor gebruikers vertrouwen krijgen dat het antwoord gecontroleerd en vertrouwd kan worden ^[15]. Luis Lastras, directeur taaltechnologieën bij IBM Research, vergelijkt het op een vergelijkbare manier met een open-boekbenadering: “In een RAG-systeem vraag je het model om te antwoorden op een vraag door de inhoud in een boek door te nemen, in plaats van te proberen feiten uit het geheugen te herinneren.” ^[16] Dit betekent dat gebruikers (en ontwikkelaars) transparantie krijgen in waarom de AI zei wat hij zei, een cruciale factor voor het opbouwen van vertrouwen in AI-uitvoer.

Een ander groot voordeel is dat RAG AI up-to-date houdt. Traditionele LLM’s worden getraind op een vaste dataset die verouderd kan raken – ze zijn als encyclopedieën die zichzelf na publicatie niet meer kunnen bijwerken ^[17]. RAG lost dit op door het model verse informatie uit betrouwbare bronnen te laten ophalen op het moment van de vraag ^[18]. Deze mogelijkheid is van onschatbare waarde in snel veranderende domeinen. Zo kan een RAG-gestuurde assistent vragen beantwoorden over recente gebeurtenissen, nieuw onderzoek of bijgewerkte bedrijfsbeleid met 95–99% nauwkeurigheid, omdat hij verwijst naar actuele, geverifieerde informatie in plaats van verouderde trainingsdata ^[19]. De antwoorden zijn contextueel relevant voor het moment, wat een doorbraak is voor toepassingen zoals nieuwsqueries, live klantvragen of realtime beslissingsondersteuning.

Kosten en efficiëntie zijn ook belangrijke redenen waarom RAG ertoe doet. In plaats van een gigantische LLM moeizaam te moeten fine-tunen op elk nieuw document of domein (wat duur en tijdrovend is), maakt RAG een veel lichtere aanpak mogelijk: houd een doorzoekbare index van je data bij, en laat het model deze raadplegen wanneer nodig. “We kunnen het proces implementeren met slechts vijf regels code,” merkt Patrick Lewis op, waarmee hij benadrukt dat het uitbreiden van een bestaand model met retrieval vaak sneller en goedkoper is dan het model opnieuw trainen op nieuwe data ^[20]. Dit betekent dat organisaties “on-the-fly” nieuwe kennisbronnen kunnen toevoegen ^[21]. Zo kan een fintechbedrijf de marktdata van vorige week in de retrieval-pool van zijn chatbot stoppen en direct vragen laten beantwoorden over de laatste beursontwikkelingen – zonder het model opnieuw te trainen. RAG verlaagt zo de doorlopende onderhoudskosten van LLM-implementaties en maakt ze veel beter aanpasbaar aan veranderende informatie ^[22].

Even belangrijk voor bedrijven is dat RAG een manier biedt om eigen data veilig te ontsluiten. Bedrijfsspecifieke en vertrouwelijke informatie kan vaak om privacyredenen niet worden gebruikt om publieke modellen te trainen. Met RAG hoeft het model de vertrouwelijke data niet te absorberen in zijn gewichten; het haalt deze simpelweg op wanneer dat nodig is. Zo kunnen bedrijven interne kennis (uit wiki’s, databases, pdf’s, enz.) benutten om op maat gemaakte AI-antwoorden te krijgen zonder die data bloot te stellen of over te dragen aan een extern model ^[23]. Sterker nog, een van de belangrijkste uitdagingen bij het toepassen van LLM’s op zakelijke behoeften was het leveren van relevante, nauwkeurige kennis uit enorme bedrijfsdatabases aan het model zonder het LLM zelf te hoeven fine-tunen ^[24]. RAG lost dit elegant op: door domeinspecifieke data op te halen op het moment van gebruik, zorgt het ervoor dat de AI-antwoorden precies zijn afgestemd op jouw context (bijvoorbeeld je productcatalogus of beleidsmanual), terwijl het basismodel algemeen blijft ^[25]. Het bedrijf behoudt volledige controle over zijn eigen data en kan compliance, beveiliging en toegangscontrole afdwingen aan de retrieval-kant. Zoals Squirro’s CTO Jan Overney het zegt: “In 2025 is retrieval augmented generation niet alleen een oplossing; het is de strategische noodzaak die deze kernuitdagingen voor bedrijven direct aanpakt,” en zo de kloof overbrugt tussen krachtige LLM’s en de steeds groeiende kennis van een organisatie ^[26].

Samengevat, waarom RAG belangrijk is: het maakt AI nauwkeuriger, betrouwbaarder, actueler en flexibeler. Gebruikers krijgen betere antwoorden (met bewijs ter ondersteuning), en organisaties kunnen AI-assistenten inzetten die hun eigen kennis echt begrijpen zonder de bank te breken of de regels te overtreden. Het is een win-winaanpak die generatieve AI van een leuke truc naar een betrouwbaar hulpmiddel voor echte taken brengt.

Belangrijkste use cases en toepassingen

RAG’s vermogen om domeinkennis en realtime data te injecteren heeft een breed scala aan impactvolle use cases voor AI-systemen mogelijk gemaakt. Enkele van de belangrijkste toepassingen zijn:

Intelligente Chatbots & Virtuele Assistenten: Door RAG aangedreven chatbots kunnen veel geavanceerdere vragen aan dan standaardbots. Ze halen antwoorden in real time uit kennisbanken, documentatie of het web, waardoor klantenservicemedewerkers, IT-helpdesk-bots en virtuele assistenten zeer nauwkeurige, contextbewuste antwoorden kunnen geven. Zo kan een interne HR-chatbot met RAG direct het meest recente beleidsdocument ophalen om een vraag van een medewerker over voordelen te beantwoorden, in plaats van een algemeen antwoord te geven. Evenzo kan een klantgerichte chatbot voor een e-commercesite productspecificaties of voorraadgegevens opzoeken om een specifieke productvraag te beantwoorden. Deze chatbots “praten” effectief met de data van het bedrijf om relevante antwoorden te geven, wat leidt tot een hogere gebruikerstevredenheid. In de praktijk hebben op RAG gebaseerde AI-chatbots meetbare voordelen laten zien – zoals het verhogen van klantbetrokkenheid en conversie in de detailhandel, en het aanzienlijk verbeteren van de responstijden op HR-vragen van medewerkers ^[27].
Enterprise Knowledge Management: Bedrijven gebruiken RAG om AI-systemen te bouwen die fungeren als slimme interne consultants. Een RAG-ondersteunde assistent kan worden gekoppeld aan enorme bedrijfsdocumentenrepositories – wiki’s, handleidingen, rapporten, e-mails – en laat medewerkers deze in natuurlijke taal bevragen. Dit heeft grote gevolgen voor productiviteit en besluitvorming. Ingenieurs kunnen een systeemontwerp-chatbot vragen naar eisen uit eerdere projectdocumenten; juristen kunnen een AI raadplegen die getraind is op eerdere zaken en regelgeving; nieuwe medewerkers kunnen snel ingewerkt worden door een interne wiki-bot gedetailleerde vragen te stellen. In wezen verandert RAG organisatiedata in een doorzoekbare AI-kennisbank, waarmee informatiesilo’s worden doorbroken. Tegen 2025 melden veel bedrijven dat RAG de ruggengraat wordt van toegang tot bedrijfskennis – zodat medewerkers precieze, actuele antwoorden krijgen uit de enorme hoeveelheid bedrijfsdata, met inachtneming van toegangsrechten en compliance ^[28].
Klantenservice en Technische Helpdesks: RAG transformeert supportworkflows. Stel je een technische supportmedewerker voor die via chat een complex softwareprobleem oplost – met RAG kan de assistent in real time zoeken in handleidingen, FAQ’s en zelfs actuele bugrapporten ^[29]. De AI kan een relevante probleemoplossingsgids of een intern ticket met dezelfde foutcode ophalen en vervolgens stap voor stap een oplossing voorstellen. Dit verkort de oplostijd aanzienlijk, omdat zowel de AI als de menselijke medewerker direct over de juiste informatie beschikken. Het zorgt er ook voor dat het gegeven advies consistent en correct is (gebaseerd op de officiële documentatie). Daarom zetten bedrijven als banken, telecombedrijven en softwarefirma’s RAG-ondersteunde supportbots in om de klantervaring te verbeteren en de druk op callcenters te verlichten. Deze systemen blinken uit in het afhandelen van zeldzame vragen en complexe, meerstapsproblemen omdat ze indien nodig specialistische informatie kunnen ophalen.
Onderzoek en Contentcreatie: Een ander domein is elke taak die diepgaand onderzoek of inhoudssynthese vereist. RAG-systemen kunnen worden ingezet om schrijvers, analisten of studenten te ondersteunen door feiten en referenties op te halen uit grote tekstverzamelingen. Zo kunnen juridische onderzoeksassistenten op basis van RAG relevante jurisprudentie en wetgeving ophalen om te helpen bij het opstellen van een juridisch betoog. Medische AI-assistenten kunnen de nieuwste tijdschriftartikelen of patiëntendossiers ophalen wanneer een arts een diagnostische vraag stelt, wat helpt bij het nemen van klinische beslissingen. Financiële analisten kunnen marktgegevens of rapporten opvragen en een door AI gegenereerde samenvatting krijgen die op die bronnen is gebaseerd. Belangrijk is dat de AI bronnen vermeldt, zodat professionals de informatie kunnen verifiëren. Dit gebruik van RAG als onderzoeksassistent versnelt werkprocessen waarbij grote hoeveelheden tekst moeten worden doorzocht op specifieke antwoorden of inzichten.
Persoonlijke Aanbevelingen en Dataqueries: Sommige toepassingen combineren RAG met gebruikersspecifieke data om gepersonaliseerde output te leveren. Zo kan een persoonlijke AI-e-mailassistent details uit je agenda, eerdere e-mails of bestanden ophalen bij het opstellen van een samenvatting of antwoord. Of een sales-AI-tool kan bedrijfsinformatie en recent nieuws over een prospect ophalen om een verkoper te helpen een op maat gemaakt voorstel te schrijven. Dit zijn in wezen gespecialiseerde gevallen van RAG: de informatie wordt opgehaald uit persoonlijke of contextspecifieke databronnen, en de gegenereerde output is op maat (zoals een persoonlijke aanbeveling of samenvatting). Dit patroon breidt zich zelfs uit naar agentische AI-systemen – meerstaps AI-“agenten” die RAG gebruiken als een vorm van geheugen. In 2025 gebruiken veel experimentele AI-agenten een RAG-mechanisme om informatie op te slaan en terug te halen gedurende een lange taak of conversatie (bijvoorbeeld het onthouden van voorkeuren of eerdere instructies van een gebruiker) ^[30]. Deze synergie tussen RAG en AI-agenten maakt complexere, meer-ronde interacties mogelijk die coherent en geïnformeerd blijven door de tijd heen.
Domeinspecifieke Expertsystemen: Bedrijven integreren steeds vaker LLM’s met hun eigen data om expert-AI te creëren voor specifieke sectoren. Goldman Sachs CIO Marco Argenti merkt op dat bedrijven AI zullen koppelen aan hun privé-datasets met RAG (of fine-tuning) om “grote expertmodellen” te produceren – AI-specialisten in geneeskunde, financiën, recht, enz., die de nieuwste domeinkennis bezitten ^[31]. Zo kan een farmaceutisch bedrijf een RAG-model inzetten dat toegang heeft tot interne onderzoeksrapporten en experimentele resultaten, waardoor het een expertassistent wordt voor wetenschappers die nieuwe medicijnen ontwikkelen. Dit concept van LLM’s als experts leunt sterk op retrieval: het model blijft algemeen inzetbaar, maar wordt aangevuld met een diepe bron van domeinspecifieke informatie bij het beantwoorden. Het resultaat is een AI die de vaktaal en feiten van het veld vloeiend spreekt. We zien dit nu al bij gespecialiseerde chatbots zoals BloombergGPT voor financiën of klinische assistenten in de gezondheidszorg, die RAG-technieken gebruiken om eigen data (marktdata, medische literatuur, enz.) te integreren en zeer nauwkeurige, relevante antwoorden te geven.

Deze voorbeelden zijn slechts het topje van de ijsberg. Vrijwel elke AI-toepassing die feitelijke nauwkeurigheid, up-to-date kennis of aanpassing aan een specifiek gegevensbestand vereist, kan profiteren van RAG ^[32]. Van interactieve zoekmachines (bijv. de nieuwe golf van zoekbots zoals Bing Chat, YouChat of Brave’s Summarizer die vragen beantwoorden met geciteerde webresultaten) tot creatieve tools (zoals code-assistenten die API-documentatie ophalen terwijl ze code genereren), RAG blijkt een veelzijdig framework te zijn. Het stelt AI in staat om niet alleen content te genereren, maar ook om te ophalen, redeneren en vervolgens te reageren, wat meervoudig meer toepassingen mogelijk maakt dan het gebruik van een geïsoleerd model ^[33]. Zoals een NVIDIA-artikel het verwoordde, met RAG “kunnen gebruikers in wezen gesprekken voeren met gegevensopslagplaatsen,” wat betekent dat de potentiële use-cases net zo breed zijn als de gegevensbronnen die je aansluit ^[34].

Voordelen van de RAG-aanpak

De snelle adoptie van retrieval-augmented generation wordt gedreven door een aantal duidelijke voordelen ten opzichte van het gebruik van alleen LLM’s:

Betere nauwkeurigheid & minder hallucinaties: Door zijn antwoorden te baseren op opgehaalde bewijzen, is een RAG-systeem veel minder geneigd om dingen te verzinnen. Het model vergelijkt zijn gegenereerde output met echte data, wat resulteert in feitelijk correcte en relevante antwoorden. Studies en branche-rapporten tonen dramatische dalingen in hallucinatiepercentages – sommige enterprise RAG-chatbots behalen een nauwkeurigheid van 95–99% bij domeinspecifieke vragen, waar een standaardmodel vaak de mist in zou gaan ^[35]. Gebruikers kunnen erop vertrouwen dat antwoorden gebaseerd zijn op iets echts, niet alleen op de verbeelding van de AI ^[36].
Actuele informatie: RAG stelt AI in staat om up-to-date te blijven met nieuwe informatie. Het systeem kan de meest recente beschikbare data ophalen (of het nu het nieuws van vandaag is, een database die vanmorgen is bijgewerkt, of een document dat enkele minuten geleden is toegevoegd), en zo de verouderde kennislimiet van veel LLM’s omzeilen. Dit is cruciaal voor domeinen als financiën, nieuws, regelgeving of technologie, waar informatie vaak verandert. Geen in de tijd bevroren AI meer – een RAG-bot die is verbonden met een live index kan net zo goed vragen beantwoorden over gisteren als over historische gebeurtenissen.
Domeinexpertise op aanvraag: RAG maakt mogelijk wat je directe specialisatie zou kunnen noemen. Je hebt geen op maat getraind model nodig voor elk onderwerp – één LLM kan worden aangepast aan elke domein door het juiste referentiemateriaal te leveren op het moment van de vraag. Dit betekent dat een AI-dienst meerdere kennisdomeinen kan ondersteunen (bijvoorbeeld een verzekeringskennisbank en een medische kennisbank) door de retrieval-context te wisselen, in plaats van aparte modellen te onderhouden. Het betekent ook dat een onderneming krachtige AI-assistenten kan inzetten zonder een model te trainen op gevoelige interne data – het model leert in realtime van de opgehaalde documenten. De antwoorden zijn nauwkeurig afgestemd op de context die door die documenten wordt geboden ^[37], waardoor de AI feitelijk net zo goed is als de gecombineerde kennis in de databron.
Transparantie en traceerbaarheid: In tegenstelling tot een black-box model dat alleen een antwoord geeft, tonen RAG-systemen vaak de bron van de waarheid achter een antwoord. Veel implementaties tonen citaties of referenties (net zoals dit artikel doet). Dit wekt enorm veel vertrouwen bij gebruikers en is een groot pluspunt voor compliance en controleerbaarheid ^[38]. Als een virtuele agent zegt “de garantie duurt 2 jaar,” kan het ook een link geven naar het exacte beleidsdocument en de sectie die die uitspraak ondersteunt. Voor gereguleerde sectoren of elke situatie waarin je het werk van AI moet dubbelchecken, is deze traceerbaarheid van onschatbare waarde. Het maakt van de AI effectief een behulpzame gids die je wijst op waar een antwoord vandaan komt, in plaats van een orakel dat we blindelings moeten geloven.
Geen noodzaak voor constante hertraining: Omdat nieuwe data op elk moment aan de retrieval-index kan worden toegevoegd, hoef je het basis-LLM niet te hertrainen telkens als je kennis verandert. Dit verlaagt het onderhoud aanzienlijk. Het fijn afstemmen van een groot model bij elke data-update is niet alleen kostbaar – het kan nieuwe fouten introduceren of downtime vereisen. RAG voorkomt dat. Zoals IBM-onderzoekers opmerken, vermindert het verankeren van het model in externe feiten “de noodzaak om het model continu te trainen op nieuwe data”, waardoor zowel de computationele als financiële kosten dalen ^[39]. Het upgraden van de kennis van je AI wordt zo eenvoudig als het bijwerken van een zoekindex of het uploaden van nieuwe documenten naar een database.
Efficiëntie en schaalbaarheid: RAG kan ook efficiënter zijn qua runtime. Het zware werk van het doorzoeken van een database kan geoptimaliseerd worden met speciale zoekinfrastructuur (zoals vectordatabases, caching, enz.), wat vaak goedkoper en sneller is dan alles zomaar in de context van een LLM te stoppen. En omdat de LLM alleen een gerichte samenvatting van relevante info ziet (in plaats van te proberen alle mogelijke kennis in zijn prompt of parameters te proppen), kan hij zijn contextvenster effectiever gebruiken. Dit maakt het haalbaar om grote kennisbanken te verwerken – je kunt miljoenen documenten geïndexeerd hebben, maar alleen de top 5 of 10 fragmenten worden aan het model gevoerd voor een bepaalde vraag. De aanpak is van nature schaalbaar: als je data groeit, werk je de index bij, niet het model. Techbedrijven hebben zelfs complete vectorzoekmachines en -platforms (Pinecone, Weaviate, FAISS, enz.) gebouwd om als retrieval-backbone voor RAG-systemen te dienen, zodat zelfs met miljarden stukjes data de juiste snel gevonden kunnen worden.
Gecontroleerde kennis & beveiliging: Met RAG, vooral in een zakelijke omgeving, kun je expliciet bepalen tot welke informatie de AI toegang heeft. Als bepaalde documenten vertrouwelijk zijn of sommige bronnen onbetrouwbaar, neem je ze gewoon niet op in de retrieval-corpus. Dit staat in schril contrast met een gigantisch voorgetraind model dat allerlei onbekende internetteksten kan hebben ingeslikt (en die kan herhalen). Met RAG kunnen organisaties datagovernance afdwingen: bijvoorbeeld de AI offline houden behalve voor het raadplegen van een goedgekeurde interne repository. Het verkleint ook de kans dat het model per ongeluk trainingsdata “lekt”, omdat het model niet vertrouwt op gememoriseerde inhoud maar ophaalt uit een gecontroleerde bron. Zoals IBM-experts aangeven, door antwoorden te baseren op verifieerbare externe data, heeft een RAG-systeem minder kans om gevoelige of ongepaste informatie uit zijn interne parameters te halen ^[40]. In wezen zegt de AI alleen wat hij mag vinden.

Deze voordelen maken RAG een aantrekkelijke oplossing wanneer nauwkeurigheid, actualiteit van informatie en vertrouwen topprioriteit zijn – daarom omarmen zoveel organisaties het. Het combineert de sterke punten van grote LLM’s (vloeiende taal en redeneren) en versterkt ze met de sterke punten van zoekmachines (precisie en feitelijke onderbouwing). Het resultaat is een AI die zowel slim als betrouwbaar is.

Beperkingen en uitdagingen

Hoewel RAG krachtig is, is het geen wondermiddel. Het integreren van retrieval met generatie brengt eigen uitdagingen en afwegingen met zich mee waar gebruikers zich bewust van moeten zijn:

Kwaliteit van Opvragen is Belangrijk: Een RAG-systeem is slechts zo goed als de informatie die het ophaalt. Als de zoekcomponent faalt – bijvoorbeeld door een relevant document te missen of iets niet-relevants op te halen – zal het antwoord van het model hieronder lijden. In sommige gevallen zal de AI zelfs proberen om “gaten op te vullen”, wat tot fouten kan leiden. Zorgen dat de retriever zeer relevante, correcte resultaten teruggeeft (en genoeg daarvan) is een actief aandachtsgebied. Dit hangt af van goede embeddings, up-to-date indexen en soms slimme queryverwerking. Moeilijke “niche” zoekopdrachten of dubbelzinnige vragen kunnen RAG nog steeds in de war brengen als er niet genoeg context wordt gevonden. Kortom, rommel erin, rommel eruit: de gegenereerde output is slechts zo feitelijk als de documenten die het krijgt.
Brondata Biases en Fouten: RAG erft de sterke en zwakke punten van zijn brondata. Als je kennisbank verouderde of bevooroordeelde informatie bevat, kan de AI dat als waarheid presenteren. Bijvoorbeeld, als de interne wiki van een bedrijf niet is bijgewerkt of een foutieve vermelding bevat, kan de RAG-assistent die fout in zijn antwoord overnemen. In tegenstelling tot een puur LLM die een evenwichtiger, generiek beeld kan geven, kan een RAG-systeem te veel vertrouwen op één enkele bron. Om dit te beperken, moeten organisaties hoogwaardige, gecontroleerde kennisbronnen onderhouden. Bias in de documenten (bijvoorbeeld historische data die sociale vooroordelen weerspiegelt) kan ook de antwoorden beïnvloeden. Curatie van het corpus en diversiteit van bronnen zijn belangrijk om deze uitdaging aan te pakken ^[41].
Latentie en Complexiteit: Het toevoegen van een retrieval-stap kan wat latentie aan de antwoorden toevoegen. Een typische RAG-pijplijn kan een embedding lookup of zoek-API-aanroep omvatten die enkele honderden milliseconden of meer duurt, vooral bij zeer grote corpora of als er meerdere zoekopdrachten worden uitgevoerd (voor multi-hop vragen). Dit is over het algemeen acceptabel voor de meeste chatbottoepassingen, maar kan een probleem zijn bij ultra lage-latentie eisen. Daarnaast brengt het bouwen en onderhouden van de infrastructuur – indexen, vector databases, pijplijnen – extra systeemcomplexiteit met zich mee vergeleken met een zelfvoorzienend model. Er zijn meer bewegende onderdelen die gecoördineerd moeten worden (hoewel frameworks als LangChain of LlamaIndex hierbij helpen). Het opschalen van deze architectuur (om veel gelijktijdige queries of zeer grote data aan te kunnen) vereist technische inspanning. Cloudproviders en nieuwe tools maken het echter steeds makkelijker om RAG grootschalig te implementeren.
Top-K en contextvensterlimieten: Het model kan maar een beperkte hoeveelheid opgehaalde tekst verwerken. Bepalen hoeveel documenten (en welke delen daarvan) je aan het LLM aanbiedt is geen triviaal probleem. Geef je te weinig, dan mist het antwoord mogelijk belangrijke details; geef je te veel, dan loop je het risico het contextvenster te overladen of de relevantie te verwateren (om nog maar te zwijgen van hogere tokenkosten). Er is vaak een afweging tussen voldoende context bieden en binnen de modelgrenzen blijven. Technieken zoals chunking (documenten opdelen in stukken) helpen, maar als een enkel antwoord echt informatie uit bijvoorbeeld 50 pagina’s tekst vereist, kunnen huidige modellen moeite hebben om dat allemaal tegelijk te verwerken. Modellen met een lang contextvenster (met tienduizenden tokens) komen op, wat dit probleem vermindert, maar ze brengen hogere rekenkosten met zich mee. Het bepalen van het optimale aantal “top-K” documenten om op te halen per vraag blijft een optimalisatiepunt ^[42].
Integratie- en onderhoudsinspanning: Het toepassen van RAG vereist meer plumbing dan het gebruik van een kant-en-klare chatbot. Teams moeten zorgen voor data-inname (alle relevante content in het systeem krijgen), vectorisatie (documenten embedden), indexeren en het regelmatig updaten van de kennisbank. Elk van die stappen – evenals de uiteindelijke antwoordkwaliteit – moet mogelijk worden gemonitord en bijgesteld. Je moet bijvoorbeeld embeddings updaten als je veel nieuwe data toevoegt, of je zoekalgoritme aanpassen als je merkt dat het resultaten mist. Er is ook de uitdaging van het orkestreren van de workflow tussen de retriever en het LLM, vooral in complexe gevallen of bij het gebruik van agent-achtig gedrag (iteratieve retrieval). Het debuggen van een RAG-systeem kan soms ook lastiger zijn – je moet nagaan of een probleem aan de retrieval- of de generatiek kant ligt. Dit alles betekent dat het implementeren van RAG een leercurve heeft, en kleine teams moeten afwegen of ze een beheerde dienst gebruiken of investeren in de expertise om het goed te bouwen.
Privacy- en beveiligingszorgen: Als de retrieval externe bronnen raadpleegt (zoals een webzoekopdracht) of een externe cloud vector-DB gebruikt, kunnen er beveiligingsproblemen ontstaan. Voor zakelijke toepassingen is het cruciaal om te zorgen dat vertrouwelijke zoekopdrachten of data niet uitlekken. Zelfs binnen een organisatie kan een RAG-assistent per ongeluk informatie tonen aan een gebruiker die daar geen toegang toe zou mogen hebben (als de toegangscontrole op de documenten niet goed geregeld is). Daarom moeten er extra waarborgen en toestemmingscontroles zijn. Sommige bedrijven lossen dit op door de hele RAG-pijplijn on-premises of in hun eigen private cloud te houden. Privacy is minder een probleem als RAG een gesloten repository gebruikt, maar het is iets om rekening mee te houden als het ontwerp internetzoekopdrachten of gedeelde infrastructuur omvat ^[43].
Resthallucinaties of Synthesefouten: Hoewel RAG hallucinaties sterk vermindert, elimineert het deze niet volledig. Het model kan de opgehaalde tekst verkeerd interpreteren of deze onjuist combineren. Bijvoorbeeld, als twee documenten licht tegenstrijdige informatie bevatten, kan het LLM deze samenvoegen tot een verward antwoord. Of het model kan een bron citeren, maar toch een onjuiste conclusie trekken. Zorgen dat het gegenereerde antwoord trouw blijft aan het bronmateriaal blijft een voortdurende uitdaging. Technieken zoals het model instrueren om alleen de gegeven informatie te gebruiken, of zelfs fine-tunen op een retrieval-augmented trainingsset, kunnen helpen. Sommige geavanceerde RAG-implementaties bevatten een laatste verificatiestap, waarbij het antwoord wordt gecontroleerd aan de hand van de bronnen (soms door een andere AI of via expliciete regels) om niet-onderbouwde uitspraken te onderscheppen. Toch moeten gebruikers voorzichtig blijven en RAG-antwoorden beschouwen als ondersteunde output, niet als absolute waarheid.

Ondanks deze uitdagingen is de consensus in de industrie en het onderzoek dat de voordelen van RAG in de meeste scenario’s ruimschoots opwegen tegen de moeilijkheden. Veel van de beperkingen worden actief aangepakt door nieuw onderzoek (bijv. betere retrieval-algoritmen, hybride zoekmethoden die keywords+vectoren gebruiken, grotere contextvensters, enz.) ^[44]. Zo wordt er bijvoorbeeld geëxperimenteerd met Graph-augmented RAG (waarbij kennisgrafen worden gebruikt om de retrieval-context te verbeteren) en “adaptieve” retrieval waarbij het LLM kan besluiten vervolgvragen te stellen indien nodig ^[45]. Deze inspanningen zijn erop gericht RAG robuuster te maken, zelfs voor complexe, multi-hop vragen. Het is ook vermeldenswaard dat sommige critici beweren dat toekomstige LLM’s mogelijk zoveel kennis of on-the-fly redenering bevatten dat expliciete retrieval minder noodzakelijk wordt (“RAG is een anti-patroon,” zoals een provocerende blogtitel het stelde ^[46]). Toch blijft RAG anno 2025 de meest praktische methode om te zorgen dat AI-systemen zowel intelligentie als actuele kennis hebben. De extra complexiteit is een kleine prijs voor AI die zijn beweringen kan onderbouwen en echte informatiebehoeften aankan.

Ontwikkelingen en trends in de industrie (stand van zaken 2025)

De afgelopen twee jaar is er sprake van een explosieve groei van RAG-gebaseerde systemen in de tech-industrie. Wat begon als een onderzoeksconcept in 2020 is in 2025 mainstream, met grote bedrijven en startups die wedijveren om retrieval-augmented generation in hun AI-aanbod te integreren. Hier zijn enkele opvallende ontwikkelingen en huidige trends:

Big Tech Omarming: Alle grote AI- en cloudspelers bieden nu RAG-oplossingen aan. OpenAI introduceerde functies voor kennisopvraging (waardoor ChatGPT kan worden gekoppeld aan bedrijfsdata of het web), Microsoft bouwde RAG in bij zijn Azure Cognitive Search en Azure OpenAI-diensten, Google lanceerde Vertex AI Search voor bedrijven, en het Bedrock-platform van Amazon bevat beheerde Knowledge Bases – allemaal gericht op het eenvoudig maken voor bedrijven om retrieval toe te voegen aan generatieve AI ^[47]. Microsoft’s Bing Chat, uitgebracht begin 2023, was een van de eerste bekende chatbots op basis van RAG, die GPT-4 combineerde met live websearch met groot succes. Google volgde met Bard en daarna met zijn Search Generative Experience (SGE), dat ook LLM’s gebruikt bovenop Google Search-resultaten. Deze producten hebben zoekmachines feitelijk veranderd in AI-chatbots die RAG gebruiken om vragen te beantwoorden met bronvermeldingen. Zoals een artikel het verwoordde: “Je ziet het tegenwoordig in allerlei AI-producten” – inderdaad, van zoek- tot productiviteitsapps, RAG is overal ^[48] ^[49].
Enterprise Platforms en Diensten: Er is een groeiend ecosysteem van op bedrijven gerichte RAG-platforms. Bijvoorbeeld, Microsoft Azure AI Search (in combinatie met Azure OpenAI) biedt een sjabloon voor RAG: je wijst het naar je data (SharePoint, databases, enz.), en het regelt de indexering en retrieval zodat een LLM antwoorden kan genereren ^[50]. IBM’s Watsonx-platform promoot op vergelijkbare wijze RAG-mogelijkheden, en IBM Research publiceerde handleidingen voor het bouwen van RAG-pijplijnen voor bedrijven ^[51]. Startups zoals Glean (enterprise search), Elastic en Lucidworks hebben LLM-antwoordgeneratie geïntegreerd bovenop hun zoektechnologie. Zelfs databasebedrijven doen mee: Pinecone (een vector database startup) werd een belangrijke facilitator voor RAG, en traditionele databases zoals Redis, Postgres (met pgvector) en OpenSearch voegden vector search-functies toe om deze workloads te ondersteunen. De industrie convergeert naar het idee dat elke onderneming een chatbot wil die met hun eigen data kan praten, en meerdere leveranciers strijden om de toolkit daarvoor te leveren.
Opmerkelijke fusies en investeringen: Het belang van retrieval-technologie wordt onderstreept door enkele grote stappen – zo nam OpenAI (het bedrijf achter ChatGPT) in midden 2024 Rockset over, een realtime analytics- en zoekdatabase ^[52]. Dit werd algemeen gezien als een zet om de retrieval-infrastructuur van OpenAI te versterken voor zijn modellen (waardoor snellere en krachtigere RAG-mogelijkheden mogelijk worden voor producten zoals ChatGPT Enterprise). In 2025 investeerde OpenAI ook in Supabase, een open-source database-backend, wat aangeeft dat zelfs AI-modelbedrijven dataopslag/-opvraging als strategisch zien ^[53]. We zagen ook enorme financieringsrondes voor vector database-bedrijven (Pinecone, Weaviate, Chroma, enz.) in 2023-2024, die in feite de “geheugenlaag” van AI aandrijven. De overnames en investeringen onderstrepen een trend: LLM-aanbieders bewegen zich naar beneden in de stack om de retrieval-laag in handen te krijgen, en dataplatforms bewegen omhoog in de stack om LLM’s te integreren – allemaal samenkomend in het midden bij RAG.
Proliferatie van tools en frameworks: Open-source gemeenschappen hebben veel tools ontwikkeld om het bouwen van RAG-toepassingen te vereenvoudigen. LangChain, een open-source framework, werd erg populair om LLM’s te koppelen aan retrieval en andere acties. LlamaIndex (GPT Index) is een andere die specifiek helpt om LLM’s te verbinden met je databronnen door indices te maken. Meta (Facebook) bracht LLM.nsys / Retrieval Augmentation Toolkit en andere uit in open source. Ondertussen publiceerde NVIDIA een complete RAG-referentiearchitectuur (de “RAG AI Blueprint”) om bedrijven te helpen deze systemen efficiënt te implementeren ^[54]. Er zijn zelfs kant-en-klare “RAG-as-a-Service”-aanbiedingen in opkomst – bijvoorbeeld, sommige consultancybedrijven en startups bieden diensten aan om de data van een klant te nemen en snel een RAG-chatbot voor hen op te zetten ^[55]. Dit alles betekent dat er voor een bedrijf dat in 2025 RAG wil adopteren, een rijk aanbod aan opties is: van doe-het-zelf met open source, tot cloud-API’s, tot kant-en-klare oplossingen, afhankelijk van hoeveel maatwerk versus gemak gewenst is ^[56].
Geavanceerd RAG-onderzoek: Op het gebied van onderzoek zijn in 2024 en 2025 de RAG-technieken verder verfijnd. Enkele opvallende richtingen zijn Graph RAG (het integreren van kennisgrafen in retrieval om relaties tussen feiten te behouden) ^[57], hybride zoekopdrachten (het combineren van zoekwoorden en vectorzoekopdrachten voor een beter begrip van de query), en modulaire RAG-pijplijnen die complexe vragen met meerdere stappen afhandelen ^[58]. Onderzoekers kijken ook naar dynamische retrieval, waarbij het LLM iteratief om meer informatie kan vragen indien nodig (waardoor RAG verandert in een conversatiële zoekopdracht). Een andere spannende ontwikkeling is een nauwere integratie tussen retrieval en generatie op architectuurniveau – bijvoorbeeld benaderingen waarbij retrieval plaatsvindt tijdens de inferentie van het model (zoals Retro, Retriever-augmented attention, enz.), waardoor de grens tussen waar de zoekopdracht eindigt en de generatie begint vervaagt ^[59]. Hoewel dit nu vooral experimenteel is, beloven ze nog efficiëntere en intelligentere systemen. Multi-modale RAG is een ander grensgebied – waarbij afbeeldingen of andere data worden gebruikt in het retrievalproces (stel je een AI voor die naast tekst ook een diagram of een audioclips kan “opzoeken”). En tot slot zijn discussies rond RAG vaak verweven met de opkomst van AI-agenten: zoals genoemd, is er in 2025 veel te doen over systemen die taken plannen en tools gebruiken. Deze agenten gebruiken RAG vaak als hun geheugen om informatie tussen stappen op te slaan ^[60]. Een agent die bijvoorbeeld een complex probleem oplost, kan documenten ophalen, tussentijdse resultaten noteren (in een vector store), en die notities later weer ophalen. Deze synergie suggereert dat RAG een fundamenteel onderdeel zal zijn, niet alleen voor Q&A-bots, maar ook voor de meer autonome AI-systemen die worden voorzien.
Succesverhalen uit de praktijk: Halverwege 2025 hebben we RAG-implementaties in veel sectoren gezien. In de gezondheidszorg heeft de Mayo Clinic bijvoorbeeld een “AI-assistent voor clinici” getest die RAG gebruikt om GPT-gebaseerde dialogen te koppelen aan actuele medische literatuur en patiëntgegevens, zodat artsen antwoorden krijgen met bronvermeldingen. Legal tech-startups bieden AI-advocaten aan die relevante jurisprudentie ophalen voor elke gestelde vraag. Banken hebben RAG gebruikt voor interne risicobeoordelingstools die beleids- en compliance-teksten ophalen om te zorgen dat antwoorden aan de regelgeving voldoen. Aan de consumentenkant werden apps zoals Perplexity.ai populair door een “Google + ChatGPT”-ervaring te bieden, waarbij elke vraag een conversatie-antwoord met bronvermelding oplevert, dankzij RAG achter de schermen ^[61]. Zelfs sociale media deden mee – eind 2023 kondigde X (Twitter) Grok aan, een AI-chatbot geïntegreerd met realtime Twitter-trends en kennis (Elon Musk prees het als “zeer accurate” up-to-the-minute info via een multi-agent RAG-aanpak) ^[62]. Deze voorbeelden laten zien hoe RAG van theorie naar praktijk is gegaan: vrijwel alle “AI-copiloten” die specifieke kennis nodig hebben, maken er gebruik van. Zoals een expert het kernachtig verwoordde: RAG “verbetert de precisie van AI-modellen door relevante informatie uit meerdere externe bronnen op te halen”, en het bewijst zijn waarde in alles van reclame tot financiën tot klantenservice ^[63].

Als we in augustus 2025 naar het landschap kijken, is het duidelijk dat RAG “volwassen is geworden.” Het is allang geen nichetrucje meer, maar een kernarchitectuur voor AI-implementaties. Bedrijven die betrouwbare, domeinspecifieke AI willen, komen steeds vaker tot de conclusie dat retrieval + generation de manier is om daar te komen ^[64]. Hierdoor groeien kennisbanken en LLM’s naar elkaar toe: zoekmachines voegen generatieve mogelijkheden toe, en generatieve modellen worden gekoppeld aan zoekmogelijkheden. Deze hybride aanpak drijft de volgende generatie chatbots, virtuele assistenten en AI-agenten aan waarmee we dagelijks interageren.

Conclusie

Retrieval-Augmented Generation vertegenwoordigt een krachtige fusie van zoektechnologie met geavanceerde AI-taalmodellen. Door AI-systemen te leren om “het boek open te slaan” en precies de kennis op te halen die ze nodig hebben, maakt RAG die systemen veel nuttiger en betrouwbaarder. Het overbrugt de kloof tussen pure AI-briljantheid en echte informatie uit de praktijk, zodat onze chatbots en assistenten niet alleen slim klinken – ze zijn slim, met feitelijke antwoorden ter onderbouwing. Van bedrijven die interne GPT-adviseurs inzetten tot consumenten die zoekbots complexe vragen stellen: RAG is het verborgen werkpaard dat de nodige feiten en context levert. Zoals we hebben gezien, biedt deze aanpak aanzienlijke voordelen op het gebied van nauwkeurigheid, relevantie en aanpasbaarheid, al brengt het ook nieuwe technische uitdagingen met zich mee.

In 2025 staat RAG centraal in een verschuiving naar AI die diep geïntegreerd is met kennis. Experts zien het als een hoeksteen voor het bouwen van “expert AI”-systemen die zijn afgestemd op elk vakgebied ^[65]. En met voortdurende innovaties kunnen we verwachten dat RAG nog naadlozer wordt – mogelijk zal het op een dag gewoon aangenomen worden dat elke sterke AI-assistent ingebouwde retrieval-mogelijkheden heeft. Voor nu zou iedereen die AI wil inzetten voor betrouwbare, geïnformeerde antwoorden sterk het RAG-paradigma moeten overwegen. Het is een uitstekend voorbeeld van hoe het combineren van twee technologieën – zoeken en genereren – iets kan opleveren dat groter is dan de som der delen. Zoals Patrick Lewis en anderen hebben gesuggereerd, zou retrieval-augmented generation heel goed de toekomst van generatieve AI kunnen zijn, een toekomst waarin onze AI-modellen niet alleen kennis hebben, maar precies weten waar ze het kunnen vinden wanneer we het nodig hebben ^[66].

Bronnen:

InfoWorld – “Retrieval-augmented generation refined and reinforced” ^[67]
NVIDIA Blog – “What Is Retrieval-Augmented Generation, aka RAG?” ^[68]
Squirro Blog – “The State of RAG in 2025: Bridging Knowledge and Generative AI” ^[69]
Forbes Tech Council via BestOfAI – “The Rise Of Retrieval-Augmented Generation” ^[70]
Ken Yeung, The AI Economy nieuwsbrief – Interview met Dennis Perpetua ^[71]
IBM Research Blog – “What is retrieval-augmented generation?” ^[72]
Signity Solutions – “Top RAG Chatbot AI Systems… in 2025” ^[73]
Goldman Sachs (Marco Argenti) – “Wat te verwachten van AI in 2025” ^[74]

How RAG Turns AI Chatbots Into Something Practical

Bekijk deze video op YouTube.

References

1. medium.com, 2. medium.com, 3. blogs.nvidia.com, 4. research.ibm.com, 5. www.elumenotion.com, 6. research.ibm.com, 7. squirro.com, 8. learn.microsoft.com, 9. www.elumenotion.com, 10. blogs.nvidia.com, 11. blogs.nvidia.com, 12. blogs.nvidia.com, 13. blogs.nvidia.com, 14. thelettertwo.com, 15. thelettertwo.com, 16. research.ibm.com, 17. dataforest.ai, 18. dataforest.ai, 19. www.signitysolutions.com, 20. blogs.nvidia.com, 21. blogs.nvidia.com, 22. research.ibm.com, 23. www.infoworld.com, 24. www.infoworld.com, 25. www.infoworld.com, 26. squirro.com, 27. bestofai.com, 28. squirro.com, 29. dataforest.ai, 30. ragflow.io, 31. www.goldmansachs.com, 32. bestofai.com, 33. blogs.nvidia.com, 34. blogs.nvidia.com, 35. www.signitysolutions.com, 36. blogs.nvidia.com, 37. www.infoworld.com, 38. www.signitysolutions.com, 39. research.ibm.com, 40. research.ibm.com, 41. bestofai.com, 42. www.infoworld.com, 43. bestofai.com, 44. www.infoworld.com, 45. medium.com, 46. www.elumenotion.com, 47. www.infoworld.com, 48. dev.to, 49. github.blog, 50. learn.microsoft.com, 51. research.ibm.com, 52. ragflow.io, 53. ragflow.io, 54. blogs.nvidia.com, 55. www.prismetric.com, 56. www.infoworld.com, 57. medium.com, 58. www.infoworld.com, 59. ragflow.io, 60. ragflow.io, 61. www.signitysolutions.com, 62. www.signitysolutions.com, 63. bestofai.com, 64. squirro.com, 65. www.goldmansachs.com, 66. blogs.nvidia.com, 67. www.infoworld.com, 68. blogs.nvidia.com, 69. squirro.com, 70. bestofai.com, 71. thelettertwo.com, 72. research.ibm.com, 73. www.signitysolutions.com, 74. www.goldmansachs.com