Procedura

Monitoring Retrieval i GraphRAG

Jak utrzymać system wiedzy w stanie przewidywalnym: sygnały, progi, reakcja i regresje. Dokument opisuje minimalny standard monitoringu dla RAG i GraphRAG — bez mistyki, z dyscypliną operacyjną.

Czas czytania: ~10 min Aktualizacja: 2026-01-10

Rozszerzenie praktyczne

Operacyjny skrót

Ten rozdział należy do rodziny Wiedza i źródła i ma formę Procedura. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.

Checklista

Ustal SSOT i hierarchię źródeł (co jest kanoniczne, co pomocnicze).
Zaprojektuj retrieval: filtry, hybryda (keyword+semantics), reranking.
Wprowadź cytowania i atrybucję (proweniencja w odpowiedzi).
Zadbaj o świeżość i konflikty źródeł (zasady rozstrzygania).
Monitoruj jakość retrieval (trafność, pokrycie, dryft).
Zastosuj uprawnienia, redakcję danych i logowanie zapytań.

Najczęstsze pułapki

RAG bez cytowań – nie da się audytować, skąd wzięła się teza.
Chunking „na oko” – zbyt duże lub zbyt małe fragmenty psują trafność.
Brak polityki świeżości – model miesza stare i nowe wersje informacji.
Ignorowanie uprawnień – wycieki danych przez zbyt szeroki kontekst.

Artefakty w Luage

context_packet sources:ssot citations_contract retrieval_metrics access_policy

Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.

Szablon do skopiowania

Szkielet „context packet” (źródła + zasady)

context_packet: support.reply@v3
sources:
  - id: kb:refund_policy
    version: 1.7
    cite_as: "[1]"
  - id: kb:pricing
    version: 3.2
    cite_as: "[2]"
rules:
  - "Każde twierdzenie faktograficzne musi mieć cytowanie"
  - "Gdy źródła są sprzeczne → wybierz SSOT i pokaż konflikt"

Źródła i reguły to „kontrakt prawdy” – bez tego rośnie ryzyko halucynacji.

Minimalny standard SLO

Retrieval success ≥ 98% (≥1 dopuszczony dowód).
Evidence coverage ≥ 95% dla faktów lub tryb no‑answer.
Path validity ≥ 97% (provenance dla krawędzi).
p95 latency ≤ 6 s end‑to‑end (warstwowo).

1. Zakres i definicje

Ten rozdział dotyczy obserwowalności dla systemów typu RAG oraz GraphRAG: od zasilania baz wiedzy (SSOT), przez retrieval i traversale grafu, aż po bramki polityk (ACL/DLP/cytowania) i finalną odpowiedź.

Trace — zapis decyzji: query, filtry, wyniki, odrzucone elementy i powód odrzucenia.

Evidence set — zestaw dowodów dopuszczonych do odpowiedzi (doc@ver, chunk_id, edge_provenance).

Coverage — procent twierdzeń w odpowiedzi, które mają dowód (cytowanie) zgodny z kontraktem.

2. Metryki i SLO

Metryki dzielimy na pięć warstw. Dobrą praktyką jest publikacja SLO na warstwę, a nie „jednego SLO na wszystko”.

Warstwa	Metryka	Sugerowane SLO	Notatka operacyjna
Retrieval	Retrieval success rate	≥ 98%	„Sukces” = ≥1 dowód dopuszczony przez politykę.
Evidence	Evidence coverage (fact claims)	≥ 95%	Jeśli spada, włącz no‑answer dla faktów.
Graph	Path validity rate	≥ 97%	Ścieżka ważna = wszystkie krawędzie mają provenance.
Gates	Policy denial rate	monitoruj trend	Skok = zmiana ACL/DLP lub błąd mapowania atrybutów.
Performance	End‑to‑end latency (p95)	≤ 6 s	Rozdziel na: retrieval, graf, LLM, narzędzia.

Uwaga: SLO są zależne od domeny. W Luage rekomendujemy zacząć od progów „obronnych”, a potem je doprecyzować na podstawie danych z produkcji i golden setów.

3. Dashboards: co musi być widoczne

Overview: SLO per warstwa + trend 7/30 dni + rozkład latency.

Evidence: coverage per typ twierdzenia, top kategorie braków (brak źródeł, konflikt, gating).

Graph: skuteczność entity linking, odsetek krawędzi bez provenance, najczęstsze typy relacji w ścieżkach.

SSOT: świeżość dokumentów, reindeksacje, wersje, „tombstones”.

4. Alerting: progi i eskalacja

Alerty powinny być kontraktowe: odnoszą się do naruszenia SLO, a nie do „dziwnego feelingu”. Przykładowe reguły:

P1: evidence coverage spada poniżej progu przez 15 min (fakty) → on‑call + blok publikacji.

P2: retrieval success spada poniżej 97% → sprawdź indeks, filtry i polityki.

P3: rośnie denial rate po zmianie ACL → weryfikuj mapowanie atrybutów.

5. Triage w 5 krokach

Potwierdź naruszenie na dashboardzie (trend, nie pojedynczy punkt).

Złap przykłady: 5–10 trace_id z ostatnich 30 minut.

Klasyfikuj: retrieval / graph / gates / LLM.

Odtwórz przypadek (replay) na tej samej wersji indeksu i polityk.

Wybierz akcję i przygotuj minimalną zmianę (patrz następny rozdział).

6. Akcje naprawcze: minimalna zmiana

Najczęstsze scenariusze i bezpieczne działania:

Spadek recall → sprawdź chunking, embedding model, filtry; rozważ reindeksację canary.

Konflikt źródeł → zastosuj procedurę kanoniczności i dopisz notę w SSOT.

Brak provenance w grafie → wstrzymaj traversale bez dowodu; napraw ekstrakcję relacji.

Skok denial rate → porównaj ACL/ABAC między wersjami; w razie potrzeby użyj wyjątku czasowego.

{ "trace_id": "trc_01H...", "hint": "GraphRAG", "retrieval": {"top_k": 12, "eligible": 3, "filtered_out": 9}, "graph": {"paths": 2, "invalid_edges": 1, "missing_provenance": true}, "gates": {"acl": "pass", "dlp": "pass", "citations": "fail"}, "decision": "no_answer" }

Monitoring Retrieval i GraphRAG

Operacyjny skrót

Checklista

Najczęstsze pułapki

Artefakty w Luage

Szkielet „context packet” (źródła + zasady)

1. Zakres i definicje

2. Metryki i SLO

3. Dashboards: co musi być widoczne

4. Alerting: progi i eskalacja

5. Triage w 5 krokach

6. Akcje naprawcze: minimalna zmiana

7. Regresje i wydanie

8. Checklista zamknięcia incydentu