Was bedeutet RAG einfach erklärt?

RAG steht für «Retrieval Augmented Generation» — auf Deutsch etwa «durch Abruf angereicherte Texterzeugung». Stell dir die KI wie eine sehr belesene Mitarbeiterin vor, die deine internen Unterlagen aber nicht auswendig kennt. Bei RAG bekommt sie vor jeder Antwort die passenden Seiten aus deinem Wiki, deinen Verträgen oder Handbüchern auf den Tisch gelegt und antwortet dann auf dieser Basis. Sie rät nicht aus dem Gedächtnis, sondern liest erst nach und antwortet dann.

Was ist der Unterschied zwischen RAG und einem trainierten Modell?

Beim Training wird das Wissen fest in das Modell «eingebrannt» — das ist aufwendig, teuer und bei jeder Änderung muss man nachtrainieren. RAG lässt das Modell unangetastet und legt das Wissen daneben, in einer durchsuchbaren Dokumentenquelle. Ändert sich ein Vertrag oder eine Richtlinie, tauschst du einfach das Dokument aus — die KI nutzt sofort den neuen Stand, ohne Neu-Training. Für die meisten KMU-Anwendungen ist RAG deshalb der praktischere und günstigere Weg.

Senkt RAG das Risiko, dass die KI etwas erfindet?

Ja, deutlich — wenn es richtig gebaut ist. Weil das Modell die Antwort aus konkret abgerufenen Dokumenten ableitet statt aus vagem Allgemeinwissen, hat es weniger Anlass, Dinge zu erfinden. Entscheidend ist die Quellenangabe: Nennt die KI zu jeder Aussage das zugrunde liegende Dokument, kannst du sie nachprüfen. Ganz verschwinden Fehler nie — mehr dazu unter Halluzinationen. Bei wichtigen Entscheidungen bleibt deshalb der Mensch in der Schleife.

Sind meine Firmendaten bei RAG sicher?

Das hängt vom Aufbau ab, nicht von RAG selbst. Deine Dokumente liegen in einer Wissensquelle, die du kontrollierst — auf Wunsch mit Schweizer Hosting und so, dass die Daten nicht fürs Modelltraining verwendet werden. FrontierX baut RAG-Lösungen mit Zugriffsrechten je Rolle, damit jede Mitarbeiterin nur findet, was sie auch sehen darf, und mit Protokollierung, wer was abgefragt hat. So bleibt eine interne Wissenssuche DSG-konform.

Was ist RAG (Retrieval Augmented Generation)?

Was RAG genau bedeutet

Ein grosses Sprachmodell wie ChatGPT oder Claude hat sehr viel allgemeines Wissen gelernt — aber nichts über deine Firma. Es kennt deine Verträge nicht, dein internes Wiki nicht, deine Handbücher und Prozessbeschreibungen nicht. Fragst du es trotzdem nach internen Details, antwortet es entweder ausweichend oder es rät. Genau dieses Problem löst RAG.

RAG (Retrieval Augmented Generation) verbindet ein Sprachmodell mit einer externen Wissensquelle. Bei jeder Anfrage läuft ein zweistufiger Ablauf: Zuerst werden aus dieser Quelle die relevanten Dokumente abgerufen (das «Retrieval»), dann werden sie dem Modell als Kontext mitgegeben, und das Modell formuliert daraus seine Antwort (die «Generation»). Das Modell selbst wird dabei nicht neu trainiert (RAG-Grundlagenpaper, Lewis et al. 2020) — das Wissen lebt daneben, nicht im Modell.

Faustregel: Ohne RAG antwortet die KI aus dem, was sie irgendwann gelernt hat. Mit RAG antwortet sie aus dem, was heute in deinen Dokumenten steht.

Wie RAG Schritt für Schritt arbeitet

Hinter der einfachen Idee «erst nachschlagen, dann antworten» stehen vier Schritte:

Sammeln und aufbereiten — Deine Unterlagen (Verträge, Wiki, Handbücher, Mails) werden in eine durchsuchbare Wissensquelle überführt und in handliche Abschnitte zerlegt.
Passende Stellen finden — Stellt jemand eine Frage, sucht das System nicht nach exakten Stichwörtern, sondern nach Bedeutung: Es findet die Abschnitte, die zur Frage thematisch passen, auch wenn andere Wörter verwendet wurden. Die Technik dahinter sind Embeddings und eine Vektordatenbank.
Kontext mitgeben — Die gefundenen Abschnitte werden zusammen mit der eigentlichen Frage an das Sprachmodell übergeben.
Antwort mit Beleg — Das Modell formuliert die Antwort auf Basis dieser Abschnitte — und kann dazu sagen, aus welchem Dokument sie stammt.

Der entscheidende Punkt ist Schritt 2 und 4: Die KI rät nicht aus dem Gedächtnis, sie liest erst die richtige Stelle nach und nennt sie dann.

Warum Unternehmen RAG nutzen

RAG hat sich aus zwei sehr praktischen Gründen zum Standardweg entwickelt, eine KI mit eigenen Daten arbeiten zu lassen:

Wissen bleibt aktuell — ohne Neu-Training. Inhalte können täglich aktualisiert werden, ohne das Modell neu zu trainieren. Ändert sich eine Richtlinie oder kommt ein neuer Vertrag dazu, tauschst du das Dokument aus, und die KI nutzt sofort den neuen Stand. Ein nachtrainiertes Modell müsstest du dagegen bei jeder Änderung erneut anpassen.
Antworten sind nachprüfbar. Weil die KI ihre Antwort aus konkreten Dokumenten ableitet, kann sie Quellenzitate liefern. Das ermöglicht Audits und Compliance — du siehst, worauf eine Aussage beruht, statt einer Black-Box vertrauen zu müssen.
Weniger erfundene Antworten. Wer aus belegten Dokumenten antwortet statt aus vagem Allgemeinwissen, erfindet seltener etwas. Wie das mit dem Trust-Thema KI-Halluzinationen zusammenhängt, lest ihr dort im Detail.

RAG oder ein eigenes Modell trainieren?

Es gibt zwei Wege, einer KI dein Firmenwissen beizubringen — sie schliessen sich nicht aus, lösen aber unterschiedliche Aufgaben:

	RAG (Wissen daneben)	Modell neu trainieren
Wo liegt das Wissen?	In einer durchsuchbaren Dokumentenquelle	Fest im Modell «eingebrannt»
Aktualisierung	Dokument austauschen — sofort aktuell	Erneutes Training nötig
Quellenangabe	Ja, nennt das zugrunde liegende Dokument	Schwierig — Wissen ist vermischt
Aufwand	Vergleichsweise gering	Hoch und wiederkehrend
Ideal für	Firmenwissen, das sich ändert	Festen Stil oder Spezialsprache

Für die meisten KMU-Anwendungen — interne Wissenssuche, Support, Auskünfte aus Verträgen und Handbüchern — ist RAG der richtige Weg, weil sich das Wissen laufend ändert und Antworten belegbar sein müssen.

Was RAG für ein Schweizer KMU konkret ermöglicht

RAG ist nicht Selbstzweck, sondern die Grundlage für sehr handfeste Anwendungen:

Interne Wissenssuche. Dein Team fragt in natürlicher Sprache und bekommt eine Antwort aus euren echten Unterlagen — mit Verweis aufs Quelldokument. Statt ein PDF nach dem anderen zu durchsuchen, fragt man einmal. → Interne Wissenssuche
Support-Agent mit Firmenwissen. Ein Agent beantwortet Kunden- oder Mitarbeiterfragen auf Basis eurer Handbücher, Richtlinien und FAQ — konsistent und rund um die Uhr.
Auskünfte aus Verträgen und Dossiers. «Welche Kündigungsfrist gilt bei diesem Mandat?» — die KI findet die Stelle im Vertrag und zitiert sie, statt dass jemand manuell sucht.

In all diesen Fällen sorgt die Quellenangabe dafür, dass eine Mitarbeiterin die Antwort prüfen kann, bevor sie darauf vertraut.

Sicherheit, Quellen und der Mensch in der Schleife

Eine KI, die auf deine Verträge und Dossiers zugreift, braucht klare Leitplanken. FrontierX baut RAG-Lösungen entlang von drei Prinzipien:

Daten unter deiner Kontrolle. Deine Dokumente liegen in einer Wissensquelle, die du kontrollierst — auf Wunsch mit Schweizer Hosting und so, dass die Daten nicht fürs Modelltraining verwendet werden. Das ist gerade bei sensiblen Inhalten wie Verträgen und Personaldaten entscheidend.
Zugriffsrechte je Rolle. Nicht jede Mitarbeiterin darf jedes Dokument sehen. Eine saubere RAG-Lösung berücksichtigt, wer was abfragen darf, und protokolliert die Zugriffe — Grundlage für eine DSG-konforme interne Suche.
Mensch in der Schleife. Quellenzitate machen Antworten prüfbar, aber sie ersetzen kein Urteil. Bei Entscheidungen mit Wirkung auf Personen bleibt der Mensch in der Schleife — in der Schweiz nach revDSG ohnehin Pflicht.

So wird aus einem allgemeinen Sprachmodell ein Werkzeug, das mit deinem echten Firmenwissen arbeitet — nachprüfbar und kontrolliert.

Der erste Schritt

Du brauchst kein eigenes Modell und kein Grossprojekt, um mit RAG zu starten. Der pragmatische Weg ist eine kurze Auslegeordnung: Welche Unterlagen sollen abfragbar werden, wer darf was sehen, und welcher Anwendungsfall bringt den schnellsten Nutzen — meist die interne Wissenssuche. Daraus wird ein klar abgegrenzter Pilot, den man messen und dann ausrollen kann. Die Technik übernimmt FrontierX; du bringst das Wissen über deine Abläufe mit.

Was ist RAG?