Start / Produkte / RAG-System
Pixelschnitzel · Folio 03 · RAG

Euer Wissen.
Mit Quelle.
Verlässlich abfragbar.

Verträge, Handbücher, Tickets, Mails, SharePoint, Confluence, das Wissen Eures Hauses ist da. Es liegt nur überall. Unser RAG-System macht es zugänglich, mit belastbarer Antwort und nachvollziehbarer Quelle.

Antwort Mit Quellenangabe
Rechte Aus dem Quellsystem
Betrieb DE-Cloud · On-Premise
Verträge SharePoint Handbuch Tickets Mails Confluence DMS RAG Pixelschnitzel
· Vorwort ·

Volltextsuche
findet Wörter.
Wir finden Antworten.

Wer „Welche Regel gilt für Reklamationen über 1.000 €?" googelt, bekommt PDFs. Wer in einen Standard-Chatbot tippt, bekommt eine erfundene Auskunft. Beides ist im Geschäftsalltag unbrauchbar. Ein gutes RAG-System tut etwas anderes: Es holt vor jeder Antwort die relevanten Dokumente aus euren eigenen Quellen, gibt sie an ein Sprachmodell und lässt nur darauf antworten, mit Quellenangabe. Was nicht in den Quellen steht, wird auch nicht behauptet.

· Aufbau ·

Vier Schritte.
Von Quelle
zu Antwort.

i

Anbinden. Quellen einsammeln.

SharePoint, Confluence, Fileserver, DMS, Mailserver, Ticketsysteme. Wir holen das Wissen ab, wo es entsteht, ohne dass Mitarbeiter es noch einmal pflegen müssen.

SharePointConfluenceFileserverDMSOutlookJiraZammad
ii

Verstehen. Strukturieren & vektorisieren.

Dokumente werden semantisch zerlegt, mit Metadaten angereichert, Rechte, Geltungszeit, Quelle, und in einen Vector Store überführt. Das ist die Grundlage für gute Antworten.

QdrantWeaviateEmbeddingsOCRMetadaten
iii

Antworten. Frage → Quelle → Antwort.

Die Frage wird gegen den Vector Store gespiegelt, relevante Quellen ausgewählt und an ein Sprachmodell übergeben. Es antwortet ausschließlich auf Basis dieser Quellen, und nennt sie.

Llama 3.3Qwen 2.5Guardrails„Weiß nicht"Zitate
iv

Steuern. Rechte, Audit, Feedback.

Wer fragt, sieht nur, was er sehen darf. Jede Anfrage wird auditiert. Mitarbeiter bewerten Antworten, daraus verbessern sich Quellenauswahl und Promptstrategie.

RBACAudit-LogFeedback-LoopMonitoring
· Was anders ist ·

Antworten mit
Zitat,
nicht aus dem Bauch.

Jede Antwort zeigt, woher sie kommt. Halluzinationen sind so deutlich seltener, und das System darf ehrlich sagen: „Das weiß ich nicht."

Vertrag § 4.3
// Quelle 1
Richtlinie 12
// Quelle 2
Handbuch 7.1
// Quelle 3
Antwort
→ basiert auf Q1 + Q2
· Anwendung ·

Sechs Anwendungsfälle,
die sofort entlasten.

i.

Vertrieb. Was haben wir vereinbart?

„Welche Konditionen gelten für Kunde X?", Antwort in Sekunden, mit Verweis auf Vertrag und Angebot.

ii.

Support. Lösungswissen aus Tickets.

Aus 10.000 alten Tickets wird ein Wissensschatz, Mitarbeiter zapfen ihn an, bevor sie selbst recherchieren.

iii.

Compliance. Richtlinien greifbar.

AGBs, Datenschutz, Compliance-Regeln, beantwortet mit Quellenstelle statt 50-seitigem PDF.

iv.

Klinik. Leitlinien & SOPs.

Hygienevorschriften, Schulungsunterlagen, Leitlinien, abfragbar an der Station, nicht im Ordner.

v.

Verwaltung. Akten- & Verfahrenswissen.

Verfahrenshandbücher, Erlasse, Altvorgänge, schneller auffindbar, konkret beantwortbar, mit Quellenbezug.

vi.

Werk. Wartung & Konstruktion.

Konstruktionszeichnungen, Wartungsprotokolle, Anleitungen, Antworten an der Maschine, nicht im Aktenschrank.

Bibliothek mit gestapelten Büchern und Akten
„Wissen, das in einer Akte schläft,
ist Wissen, das nicht existiert."
· Häufig gefragt ·

Antworten,
noch bevor
Ihr fragen.

Was unterscheidet RAG von einem normalen Chatbot?
Ein normaler Chatbot antwortet aus dem Modellwissen, und damit oft falsch. RAG holt vor jeder Antwort die relevanten Dokumente aus euren Quellen, gibt sie dem Modell und lässt nur darauf antworten. Ergebnis: belegbare Aussagen mit Quelle.
Was passiert mit Berechtigungen aus SharePoint oder DMS?
Ihr werden respektiert. Jede Anfrage wird gegen das Rechtekonzept geprüft, ein Mitarbeiter sieht in der Antwort nur, worauf er auch im Quellsystem zugreifen darf.
Kann das System auch „Ich weiß es nicht" sagen?
Ja, und das ist ein zentrales Feature. Wenn die Quellen keine belastbare Antwort liefern, antwortet das System genau das, statt etwas zu erfinden.
Wo läuft das System?
Beides möglich. Standard ist der Betrieb in einer kontrollierten Umgebung in Deutschland. Auf Wunsch komplett lokal, siehe Lokale KI für Unternehmen.
Wie lange dauert der Start?
Erste belastbare Antworten auf einer abgegrenzten Quelle (Handbuch, Confluence-Sektion) typischerweise nach 2–4 Wochen. Breitere Anbindung in 6–12 Wochen, je nach Quellanzahl.
Was kostet das?
Einrichtung im niedrigen fünfstelligen Bereich plus laufender Betrieb, abhängig von Quellenmenge, Modellbetrieb und Last. Konkrete Zahl nach dem Erstgespräch.
Wie wird das System aktuell gehalten?
Quellen werden regelmäßig neu indiziert. Geänderte Dokumente fließen automatisch ein, abgelöste werden entfernt. Ihr definieren mit uns Frequenz und Tiefe.
· Erstgespräch ·

Geben ihr uns
eine Quelle.
Wir zeigen Antworten.

Ein abgegrenztes Quellset, Handbuch, Confluence-Bereich, Verträge reicht. In einem Termin sehen ihr, wie Antworten und Quellen aussehen würden. Realistisch, an euren echten Inhalten.