Retrieval-Augmented Generation- RAG
Definition
Retrieval-Augmented Generation (RAG) bezeichnet ein Verfahren der Künstlichen Intelligenz, das ein Large Language Model (LLM) mit der Fähigkeit ausstattet, gezielt auf externe Wissensquellen zuzugreifen, um Antworten aktueller, präziser und nachvollziehbarer zu machen. Dabei werden Information Retrieval und Textgenerierung kombiniert: Zuerst werden relevante Informationen aus Datenbanken oder Dokumentensammlungen gesucht, anschließend fließen diese in die Antwortgenerierung ein.
Ein Softwaresystem, das externe Wissensquellen in die Generierung einbindet, indem es zur Anfrage passende Dokumente („Retrieval“) aus einem Index abruft und diese dem LLM als Kontext für die Antwort bereitstellt. Ziel ist es, über das im Training gespeicherte Wissen hinauszugehen und aktuelle sowie domänenspezifische Inhalte einzubeziehen.
Zielgruppen
- Unternehmen mit Chatbots, Suchsystemen oder internen Wissensmanagement-Lösungen
- Forschungseinrichtungen, die auf aktuelle Publikationen zugreifen
- Branchen mit hohen Anforderungen an Genauigkeit (z. B. Medizin, Recht, Technik)
- Entwickler von KI-Systemen mit domänenspezifischem Wissen
Vorteile
- Aktualität: Zugriff auf stets aktuelle Datenquellen
- Genauigkeit: Reduzierung von Halluzinationen durch verifizierte Informationen
- Nachvollziehbarkeit: Quellenangaben ermöglichen Überprüfung
- Domänenspezifität: Nutzung interner oder branchenspezifischer Daten
- Effizienz: Kein vollständiges Retraining des Modells nötig
Wichtige Bestandteile
- Datenindex: Strukturierte Ablage der durchsuchbaren Dokumente
- Retriever: Algorithmus (z. B. Dense Passage Retrieval, BM25) zur Auswahl relevanter Passagen
- Augmentierung: Einbettung der gefundenen Inhalte in den Prompt
- Generator: LLM, das die Antwort basierend auf dem angereicherten Kontext erstellt
Prioritäten
- Relevanz der Treffer: Präzises Auffinden passender Informationen
- Skalierbarkeit: Leistungsfähig auch bei sehr großen Wissensbasen
- Sicherheit & Datenschutz: Schutz sensibler Daten, Compliance
- Transparenz: Offenlegung der genutzten Quellen
Trends
- Kombination mit multimodalen Daten (Text, Bild, Audio, Video)
- Integration in Enterprise-Search- und Assistenzsysteme
- Einsatz in Echtzeit-Anwendungen mit Live-Datenanbindung