Jak utrzymać system wiedzy w stanie przewidywalnym: sygnały, progi, reakcja i regresje. Dokument opisuje minimalny standard monitoringu dla RAG i GraphRAG — bez mistyki, z dyscypliną operacyjną.
Czas czytania: ~10 minAktualizacja: 2026-01-10
Minimalny standard SLO
Retrieval success ≥ 98% (≥1 dopuszczony dowód).
Evidence coverage ≥ 95% dla faktów lub tryb no‑answer.
Path validity ≥ 97% (provenance dla krawędzi).
p95 latency ≤ 6 s end‑to‑end (warstwowo).
Sygnały operacyjne: od trace i evidence coverage do bramek i regresji.
Zasada operacyjna: w systemach opartych o wiedzę nie „wierzymy w model”. Wierzymy w ślady i dowody.
Jeśli system nie potrafi pokazać, na czym oparł odpowiedź — powinien wejść w tryb no‑answer lub eskalacji.
1. Zakres i definicje
Ten rozdział dotyczy obserwowalności dla systemów typu RAG oraz GraphRAG:
od zasilania baz wiedzy (SSOT), przez retrieval i traversale grafu, aż po bramki polityk
(ACL/DLP/cytowania) i finalną odpowiedź.
Trace — zapis decyzji: query, filtry, wyniki, odrzucone elementy i powód odrzucenia.
Evidence set — zestaw dowodów dopuszczonych do odpowiedzi (doc@ver, chunk_id, edge_provenance).
Coverage — procent twierdzeń w odpowiedzi, które mają dowód (cytowanie) zgodny z kontraktem.
2. Metryki i SLO
Metryki dzielimy na pięć warstw. Dobrą praktyką jest publikacja SLO na warstwę, a nie „jednego SLO na wszystko”.
Warstwa
Metryka
Sugerowane SLO
Notatka operacyjna
Retrieval
Retrieval success rate
≥ 98%
„Sukces” = ≥1 dowód dopuszczony przez politykę.
Evidence
Evidence coverage (fact claims)
≥ 95%
Jeśli spada, włącz no‑answer dla faktów.
Graph
Path validity rate
≥ 97%
Ścieżka ważna = wszystkie krawędzie mają provenance.
Gates
Policy denial rate
monitoruj trend
Skok = zmiana ACL/DLP lub błąd mapowania atrybutów.
Performance
End‑to‑end latency (p95)
≤ 6 s
Rozdziel na: retrieval, graf, LLM, narzędzia.
Uwaga: SLO są zależne od domeny. W Luage rekomendujemy zacząć od progów „obronnych”, a potem je
doprecyzować na podstawie danych z produkcji i golden setów.
3. Dashboards: co musi być widoczne
Overview: SLO per warstwa + trend 7/30 dni + rozkład latency.
Evidence: coverage per typ twierdzenia, top kategorie braków (brak źródeł, konflikt, gating).
Graph: skuteczność entity linking, odsetek krawędzi bez provenance, najczęstsze typy relacji w ścieżkach.