Was ist RAG?
ChatGPT oder Claude kennen das halbe Internet — aber nicht deine Verträge, dein Wiki oder deine Handbücher. RAG ist der Standardweg, das zu ändern, ohne ein eigenes Modell zu trainieren.
RAG (Retrieval Augmented Generation) verbindet ein Sprachmodell mit einer externen Wissensquelle — etwa deinen Verträgen, deinem Wiki oder deinen Handbüchern. Bei jeder Anfrage werden zuerst die relevanten Dokumente aus dieser Quelle abgerufen und dem Modell als Kontext mitgegeben, ohne das Modell neu zu trainieren (RAG-Grundlagenpaper, Lewis et al. 2020). So antwortet die KI auf Basis deiner echten Firmendaten statt aus dem allgemeinen Trainingswissen. Der grosse Vorteil: Die Inhalte lassen sich täglich aktualisieren, ohne ein neues Training, und jede Antwort kann ihre Quelle nennen — wichtig für Audits und Compliance.
Was RAG genau bedeutet
Ein grosses Sprachmodell wie ChatGPT oder Claude hat sehr viel allgemeines Wissen gelernt — aber nichts über deine Firma. Es kennt deine Verträge nicht, dein internes Wiki nicht, deine Handbücher und Prozessbeschreibungen nicht. Fragst du es trotzdem nach internen Details, antwortet es entweder ausweichend oder es rät. Genau dieses Problem löst RAG.
RAG (Retrieval Augmented Generation) verbindet ein Sprachmodell mit einer externen Wissensquelle. Bei jeder Anfrage läuft ein zweistufiger Ablauf: Zuerst werden aus dieser Quelle die relevanten Dokumente abgerufen (das «Retrieval»), dann werden sie dem Modell als Kontext mitgegeben, und das Modell formuliert daraus seine Antwort (die «Generation»). Das Modell selbst wird dabei nicht neu trainiert (RAG-Grundlagenpaper, Lewis et al. 2020) — das Wissen lebt daneben, nicht im Modell.
Faustregel: Ohne RAG antwortet die KI aus dem, was sie irgendwann gelernt hat. Mit RAG antwortet sie aus dem, was heute in deinen Dokumenten steht.
Wie RAG Schritt für Schritt arbeitet
Hinter der einfachen Idee «erst nachschlagen, dann antworten» stehen vier Schritte:
- Sammeln und aufbereiten — Deine Unterlagen (Verträge, Wiki, Handbücher, Mails) werden in eine durchsuchbare Wissensquelle überführt und in handliche Abschnitte zerlegt.
- Passende Stellen finden — Stellt jemand eine Frage, sucht das System nicht nach exakten Stichwörtern, sondern nach Bedeutung: Es findet die Abschnitte, die zur Frage thematisch passen, auch wenn andere Wörter verwendet wurden. Die Technik dahinter sind Embeddings und eine Vektordatenbank.
- Kontext mitgeben — Die gefundenen Abschnitte werden zusammen mit der eigentlichen Frage an das Sprachmodell übergeben.
- Antwort mit Beleg — Das Modell formuliert die Antwort auf Basis dieser Abschnitte — und kann dazu sagen, aus welchem Dokument sie stammt.
Der entscheidende Punkt ist Schritt 2 und 4: Die KI rät nicht aus dem Gedächtnis, sie liest erst die richtige Stelle nach und nennt sie dann.
Warum Unternehmen RAG nutzen
RAG hat sich aus zwei sehr praktischen Gründen zum Standardweg entwickelt, eine KI mit eigenen Daten arbeiten zu lassen:
- Wissen bleibt aktuell — ohne Neu-Training. Inhalte können täglich aktualisiert werden, ohne das Modell neu zu trainieren. Ändert sich eine Richtlinie oder kommt ein neuer Vertrag dazu, tauschst du das Dokument aus, und die KI nutzt sofort den neuen Stand. Ein nachtrainiertes Modell müsstest du dagegen bei jeder Änderung erneut anpassen.
- Antworten sind nachprüfbar. Weil die KI ihre Antwort aus konkreten Dokumenten ableitet, kann sie Quellenzitate liefern. Das ermöglicht Audits und Compliance — du siehst, worauf eine Aussage beruht, statt einer Black-Box vertrauen zu müssen.
- Weniger erfundene Antworten. Wer aus belegten Dokumenten antwortet statt aus vagem Allgemeinwissen, erfindet seltener etwas. Wie das mit dem Trust-Thema KI-Halluzinationen zusammenhängt, lest ihr dort im Detail.
RAG oder ein eigenes Modell trainieren?
Es gibt zwei Wege, einer KI dein Firmenwissen beizubringen — sie schliessen sich nicht aus, lösen aber unterschiedliche Aufgaben:
| RAG (Wissen daneben) | Modell neu trainieren | |
|---|---|---|
| Wo liegt das Wissen? | In einer durchsuchbaren Dokumentenquelle | Fest im Modell «eingebrannt» |
| Aktualisierung | Dokument austauschen — sofort aktuell | Erneutes Training nötig |
| Quellenangabe | Ja, nennt das zugrunde liegende Dokument | Schwierig — Wissen ist vermischt |
| Aufwand | Vergleichsweise gering | Hoch und wiederkehrend |
| Ideal für | Firmenwissen, das sich ändert | Festen Stil oder Spezialsprache |
Für die meisten KMU-Anwendungen — interne Wissenssuche, Support, Auskünfte aus Verträgen und Handbüchern — ist RAG der richtige Weg, weil sich das Wissen laufend ändert und Antworten belegbar sein müssen.
Was RAG für ein Schweizer KMU konkret ermöglicht
RAG ist nicht Selbstzweck, sondern die Grundlage für sehr handfeste Anwendungen:
- Interne Wissenssuche. Dein Team fragt in natürlicher Sprache und bekommt eine Antwort aus euren echten Unterlagen — mit Verweis aufs Quelldokument. Statt ein PDF nach dem anderen zu durchsuchen, fragt man einmal. → Interne Wissenssuche
- Support-Agent mit Firmenwissen. Ein Agent beantwortet Kunden- oder Mitarbeiterfragen auf Basis eurer Handbücher, Richtlinien und FAQ — konsistent und rund um die Uhr.
- Auskünfte aus Verträgen und Dossiers. «Welche Kündigungsfrist gilt bei diesem Mandat?» — die KI findet die Stelle im Vertrag und zitiert sie, statt dass jemand manuell sucht.
In all diesen Fällen sorgt die Quellenangabe dafür, dass eine Mitarbeiterin die Antwort prüfen kann, bevor sie darauf vertraut.
Sicherheit, Quellen und der Mensch in der Schleife
Eine KI, die auf deine Verträge und Dossiers zugreift, braucht klare Leitplanken. FrontierX baut RAG-Lösungen entlang von drei Prinzipien:
- Daten unter deiner Kontrolle. Deine Dokumente liegen in einer Wissensquelle, die du kontrollierst — auf Wunsch mit Schweizer Hosting und so, dass die Daten nicht fürs Modelltraining verwendet werden. Das ist gerade bei sensiblen Inhalten wie Verträgen und Personaldaten entscheidend.
- Zugriffsrechte je Rolle. Nicht jede Mitarbeiterin darf jedes Dokument sehen. Eine saubere RAG-Lösung berücksichtigt, wer was abfragen darf, und protokolliert die Zugriffe — Grundlage für eine DSG-konforme interne Suche.
- Mensch in der Schleife. Quellenzitate machen Antworten prüfbar, aber sie ersetzen kein Urteil. Bei Entscheidungen mit Wirkung auf Personen bleibt der Mensch in der Schleife — in der Schweiz nach revDSG ohnehin Pflicht.
So wird aus einem allgemeinen Sprachmodell ein Werkzeug, das mit deinem echten Firmenwissen arbeitet — nachprüfbar und kontrolliert.
Der erste Schritt
Du brauchst kein eigenes Modell und kein Grossprojekt, um mit RAG zu starten. Der pragmatische Weg ist eine kurze Auslegeordnung: Welche Unterlagen sollen abfragbar werden, wer darf was sehen, und welcher Anwendungsfall bringt den schnellsten Nutzen — meist die interne Wissenssuche. Daraus wird ein klar abgegrenzter Pilot, den man messen und dann ausrollen kann. Die Technik übernimmt FrontierX; du bringst das Wissen über deine Abläufe mit.
Fragen, die zu diesem Thema gestellt werden.
Was bedeutet RAG einfach erklärt?
RAG steht für «Retrieval Augmented Generation» — auf Deutsch etwa «durch Abruf angereicherte Texterzeugung». Stell dir die KI wie eine sehr belesene Mitarbeiterin vor, die deine internen Unterlagen aber nicht auswendig kennt. Bei RAG bekommt sie vor jeder Antwort die passenden Seiten aus deinem Wiki, deinen Verträgen oder Handbüchern auf den Tisch gelegt und antwortet dann auf dieser Basis. Sie rät nicht aus dem Gedächtnis, sondern liest erst nach und antwortet dann.
Was ist der Unterschied zwischen RAG und einem trainierten Modell?
Beim Training wird das Wissen fest in das Modell «eingebrannt» — das ist aufwendig, teuer und bei jeder Änderung muss man nachtrainieren. RAG lässt das Modell unangetastet und legt das Wissen daneben, in einer durchsuchbaren Dokumentenquelle. Ändert sich ein Vertrag oder eine Richtlinie, tauschst du einfach das Dokument aus — die KI nutzt sofort den neuen Stand, ohne Neu-Training. Für die meisten KMU-Anwendungen ist RAG deshalb der praktischere und günstigere Weg.
Senkt RAG das Risiko, dass die KI etwas erfindet?
Ja, deutlich — wenn es richtig gebaut ist. Weil das Modell die Antwort aus konkret abgerufenen Dokumenten ableitet statt aus vagem Allgemeinwissen, hat es weniger Anlass, Dinge zu erfinden. Entscheidend ist die Quellenangabe: Nennt die KI zu jeder Aussage das zugrunde liegende Dokument, kannst du sie nachprüfen. Ganz verschwinden Fehler nie — mehr dazu unter Halluzinationen. Bei wichtigen Entscheidungen bleibt deshalb der Mensch in der Schleife.
Sind meine Firmendaten bei RAG sicher?
Das hängt vom Aufbau ab, nicht von RAG selbst. Deine Dokumente liegen in einer Wissensquelle, die du kontrollierst — auf Wunsch mit Schweizer Hosting und so, dass die Daten nicht fürs Modelltraining verwendet werden. FrontierX baut RAG-Lösungen mit Zugriffsrechten je Rolle, damit jede Mitarbeiterin nur findet, was sie auch sehen darf, und mit Protokollierung, wer was abgefragt hat. So bleibt eine interne Wissenssuche DSG-konform.
Verwandte Themen.
Bereit, das in deinem Betrieb einzusetzen?
FrontierX startet mit einer Auslegeordnung deiner Abläufe und automatisiert den Vorgang mit dem grössten Hebel zuerst — DSG-konform, in Tagen statt Quartalen.
Gespräch anfragen