Was ist RAG (Retrieval-Augmented Generation)? | KI-Glossar

RAG (Retrieval-Augmented Generation) ist die Schlüsseltechnologie, um Large Language Models im Unternehmenskontext nutzbar zu machen. Statt nur auf Trainingswissen zu vertrauen, greift die KI auf Ihre eigenen Daten zu - aktuell, kontrolliert und nachvollziehbar.

Wie RAG funktioniert

Der Prozess läuft in drei Schritten ab:

1. Indexierung (einmalig): Ihre Dokumente (PDFs, Wiki-Seiten, Handbuecher, FAQ) werden in kleine Abschnitte zerlegt und als Embeddings in einer Vektordatenbank gespeichert.

2. Retrieval (bei jeder Anfrage): Wenn ein Nutzer eine Frage stellt, werden die semantisch relevantesten Dokumentenabschnitte aus der Vektordatenbank abgerufen.

3. Generation: Das LLM erhaelt die Frage plus die gefundenen Kontextdokumente und generiert eine Antwort, die auf Ihren echten Daten basiert.

Warum RAG fuer Unternehmen relevant ist

Aktualitaet: Neue Dokumente sind sofort verfuegbar - ohne Modell-Retraining. Ein Produktupdate oder eine neue Policy ist innerhalb von Minuten im System.

Kontrolle: Sie bestimmen exakt, auf welche Datenquellen die KI Zugriff hat. Sensible Bereiche koennen ausgeschlossen werden.

Nachvollziehbarkeit: Jede Antwort kann mit Quellenangaben belegt werden. Das ist entscheidend fuer Compliance und Vertrauen der Nutzer.

Kosteneffizienz: RAG ist deutlich guenstiger als Fine-Tuning und funktioniert mit jedem LLM (GPT-4, Claude, Llama, Mistral).

Typische Anwendungen im Unternehmen

Interner Wissensbot: Mitarbeiter fragen einen Chatbot zu Prozessen, HR-Themen, IT-Support - statt in SharePoint oder Confluence zu suchen.

Kundenservice: Automatische Beantwortung von Anfragen basierend auf Produktdokumentation, FAQ und Handbuchern.

Dokumenten-Q&A: Vertraege, technische Spezifikationen oder Gutachten durchsuchbar und befragbar machen.

Onboarding-Assistent: Neue Mitarbeiter erhalten Antworten auf Basis interner Dokumentation, Prozessbeschreibungen und Guidelines.

Qualitaet eines RAG-Systems

Die Antwortqualitaet steht und faellt mit drei Faktoren:

Chunking-Strategie: Wie werden Dokumente aufgeteilt? Zu kleine Chunks verlieren Kontext, zu grosse verwassern die Relevanz.

Embedding-Modell: Bestimmt, wie gut semantische Aehnlichkeit erkannt wird. Modelle wie BGE, E5 oder Cohere Embed liefern unterschiedliche Ergebnisse je nach Domaene.

Retrieval-Optimierung: Hybrid Search (Keyword + Semantic), Re-Ranking und Metadaten-Filter verbessern die Trefferquote erheblich.

Was RAG nicht kann

RAG ist kein Allheilmittel. Es funktioniert schlecht, wenn die Wissensbasis lueckenhaft oder veraltet ist, wenn Antworten kreativen Schreibstil erfordern oder wenn das Problem nicht durch Dokumentensuche loesbar ist.

Fuer Stilanpassung, Formatierung oder domainspezifische Sprachmuster ist Fine-Tuning die bessere Wahl - oder eine Kombination aus beidem.

RAG (Retrieval-Augmented Generation)

Wie RAG funktioniert

Warum RAG fuer Unternehmen relevant ist

Typische Anwendungen im Unternehmen

Qualitaet eines RAG-Systems

Was RAG nicht kann

Typische Anwendungen

Verwandte Begriffe

RAG fuer Ihr Unternehmen?