Die Entwicklungen rund um Generative KI (GenAI) überschlagen sich, doch Retrieval-Augmented Generation (RAG) ist gekommen, um zu bleiben. Erst vor viereinhalb Jahren wurde RAG als Architekturkonzept erstmals von Facebook AI Research (FAIR) in einem wissenschaftlichen Paper vorgestellt: "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" von Patrick Lewis, Ethan Perez, Aleksandra Piktus et al. Heute ist RAG die bevorzugte Methode zur Entwicklung von Anwendungen, die Large Language Models (LLMs) einbinden.
RAG löst die Probleme, die durch die Abhängigkeit von LLMs von veralteten, statischen Trainingsdaten entstehen – etwa obsolete Informationen, falsche Antworten oder die Unfähigkeit, auf neuere, externe wie unternehmenseigene, Daten und Informationen zuzugreifen.
Was ist Retrieval Augmented Generation?
Retrieval Augmented Generation, kurz RAG, ist eine Methode, die die Funktionalität von Large Language Models (LLMs) mit relevanten Informationen aus internen und externen Quellen kombiniert, die nicht bereits zum Training des Modells verwendet wurden. Anwendungen, die RAG nutzen, greifen also auf Informationen zu, welche über das hinausgehen, was bereits im LLM enthalten ist, wie z. B. interne Unternehmensdatenbanken oder andere Informationsquellen, bevor sie eine Antwort generieren.
Dieser Prozess hilft, die Genauigkeit und Relevanz der Ausgabe zu verbessern, indem er aktuelle und kontextbezogene Daten abruft und miteinbezieht. Gleichzeitig reduziert er Halluzinationen und ungenaue Antworten, da das Modell darauf beschränkt wird, ausschließlich vom Anwendungsentwickler ausgewählte Daten zu verwenden, um kontextuell relevantere Ergebnisse zu erzeugen.
InterSystems IRIS mit integrierter Vektorsuche für RAG
InterSystems führte bereits vor über einem Jahr den
Support für RAG ein und war damit einer der ersten Anbieter von Datenmanagement-
Software, der Vector Search-Funktionen in eine integrierte Datenplattform einbettete.
Mit InterSystems IRIS sind Vektor-Embeddings und Vektorsuchfunktionen direkt in die Plattform integriert – das unterscheidet sich von einer eigenständigen Vektordatenbank und ist dieser in vielen Fällen überlegen. Das bedeutet, dass GenAI- und Vektorsuchfunktionen herkömmliche Analysen wie Business Intelligence und maschinelles Lernen ergänzen können. Dies liefert genauere Ergebnisse als die einer einzelnen analytischen Methode allein.
Betrachten wir zum Beispiel eine Analyse zur Identifikation abwanderungsgefährdeter Kunden: Traditionelles Machine Learning kann gute Ergebnisse liefern, etwa durch prädiktive Modelle auf Basis von logistischer Regression, Entscheidungsbäumen, GBM oder anderen Verfahren. Ebenso kann RAG gute Resultate erzielen, indem das LLM mit allen relevanten Informationen zu Kunden versorgt wird – darunter nicht nur strukturierte Daten, sondern auch große Mengen unstrukturierter Informationen wie Freitextnotizen aus CRM- oder Callcenter-Systemen.
Der Vorteil eines kombinierten Ansatzes, der sowohl Machine Learning als auch GenAI nutzt, besteht darin, dass typischerweise mehr – und oft auch bessere – Ergebnisse generiert werden als mit einer der Methoden allein.

Kürzlich stellte InterSystems seine GenAI- und RAG-Funktionen auf der North East Database Day (NEDB) Konferenz in den USA vor, wo sich spannende Gespräche mit führenden Forschenden auf dem Gebiet über unseren Ansatz ergaben, welcher als innovativ und führend wahrgenommen wurde. (Interesse? Hier geht es zu den Folien der Präsentation, welche ich auf dieser Veranstaltung gehalten habe).
Unter unseren Datenplattform-Kunden, welche mit InterSystems IRIS arbeiten, können wir ein schnelles und starkes Wachstum der Nutzung von RAG mit vollständig integrierter Vektorsuche beobachten. Bereits auf unserer globalen Konferenz für InterSystems-Partner und Endkunden im Jahr 2024, dem InterSystems Global Summit, konnten 17 Kunden ihre RAG- und Vector Search-Implementierungen präsentieren. Wohlgemerkt weniger als drei Monate nach der Erstveröffentlichung unserer Vektorfunktionen – seither sind zahlreiche weitere hinzugekommen.
Falls Sie eine Anwendung, die unsere RAG-Funktionen in InterSystems IRIS nutzt, spielerisch ausprobieren möchten, besuchen Sie gerne die
„Ask DC AI“-Seite der InterSystems Developer Community. Dort können Sie in natürlicher Sprache Fragen stellen und darauf Antworten aus dem umfangreichen Wissensbestand unserer InterSystems Developer Community erhalten. Ich selbst nutze diese Anwendung von InterSystems IRIS und RAG regelmäßig, um Programmier-Tipps und Code-Snippets samt einleuchtender Erklärungen zu erhalten und spare mir dadurch enorm viel Zeit.
Über „naives RAG“ hinaus
Seit der ersten Entwicklung von RAG – heute oft als „naives RAG“ bezeichnet – sind zahlreiche weiterentwickelte Varianten entstanden, darunter RAFT, FLARE, REACT, GraphRAG, Agentic RAG und weitere.
RAG ist ein relativ einfaches Konzept, aber die erfolgreiche Umsetzung kann mitunter komplex sein – und ständig entstehen neue Methoden. Für alle, die sich hierzu nicht erst in akademischen Fachartikel einlesen möchten, sei ein aktueller Gartner®-Bericht zum Thema empfohlen (Hinweis: Der Bericht ist leider nur für Gartner-Kunden zugänglich).
Er beginnt mit dem Satz: „Die Erstellung hochakkurater Retrieval-Augmented Generation-Systeme für geschäftliche Anwendungsfälle ist eine Herausforderung – aufgrund der vielen Faktoren, die zur Gesamtleistung beitragen.“
Die hervorgehobenen Felder in untenstehender Abbildung des Reports zeigen alle zentrale Optimierungsbereiche:

Die gute Nachricht ist: Sämtliche genannten Funktionen sind bereits in unsere Datenplattform InterSystems IRIS integriert. Unsere Philosophie, alle Funktionalitäten in einer einzigen Plattform zu vereinen und die Verarbeitung direkt auf den Daten selbst durchzuführen – anstatt sie in eine separate Analyse-Engine oder Vektordatenbank zu kopieren – erweist sich als ideal für GenAI: vom Orchestrieren von LLMs mit produktionsreifen Kontrollmechanismen bis hin zur Verwaltung von RAG mit der nötigen Raffinesse für höchste Genauigkeit in komplexen Anwendungen.
Entwickler können mit einfachem RAG starten und die benötigten Optimierungen für den produktiven Einsatz schrittweise hinzufügen. Und weil InterSystems stets an der Spitze der technologischen Entwicklung bleibt, können Kunden sicher sein, dass sie auch hier erstklassige Skalierbarkeit, Performance und Benutzerfreundlichkeit erhalten. Die Robustheit und Zuverlässigkeit von InterSystems IRIS ist entscheidend für unsere Kunden, wenn sie ihre GenAI-Projekte in die Produktion bringen.
Schnellere Wertschöpfung durch RAG
2025 wird ein wegweisendes Jahr für unsere Kunden, die GenAI nutzen.
Viele Projekte, die 2024 als Pilotprojekte gestartet sind, gehen nun in die Produktion und immer mehr unserer Kunden beginnen, RAG aktiv einzusetzen. Auch InterSystems selbst setzt RAG intensiv in unseren Produkten und Betriebsabläufen ein und sammelt dabei Erfahrungen „aus dem realen Leben“ sowie Best Practices.
Kunden dabei zu unterstützen, das volle Potenzial ihrer Daten zu nutzen, um neue Erkenntnisse und wertschöpfende Services zu schaffen, gehört zum Kern der InterSystems-Kultur. Und GenAI eröffnet dabei eine völlig neue, spannende Welt voller Chancen und Möglichkeiten.