Monitoring Retrieval i GraphRAG
Jak utrzymać system wiedzy w stanie przewidywalnym: sygnały, progi, reakcja i regresje. Dokument opisuje minimalny standard monitoringu dla RAG i GraphRAG — bez mistyki, z dyscypliną operacyjną.
Operacyjny skrót
Ten rozdział należy do rodziny Wiedza i źródła i ma formę Procedura. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.
Checklista
- Ustal SSOT i hierarchię źródeł (co jest kanoniczne, co pomocnicze).
- Zaprojektuj retrieval: filtry, hybryda (keyword+semantics), reranking.
- Wprowadź cytowania i atrybucję (proweniencja w odpowiedzi).
- Zadbaj o świeżość i konflikty źródeł (zasady rozstrzygania).
- Monitoruj jakość retrieval (trafność, pokrycie, dryft).
- Zastosuj uprawnienia, redakcję danych i logowanie zapytań.
Najczęstsze pułapki
- RAG bez cytowań – nie da się audytować, skąd wzięła się teza.
- Chunking „na oko” – zbyt duże lub zbyt małe fragmenty psują trafność.
- Brak polityki świeżości – model miesza stare i nowe wersje informacji.
- Ignorowanie uprawnień – wycieki danych przez zbyt szeroki kontekst.
Artefakty w Luage
Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.
Szkielet „context packet” (źródła + zasady)
context_packet: support.reply@v3
sources:
- id: kb:refund_policy
version: 1.7
cite_as: "[1]"
- id: kb:pricing
version: 3.2
cite_as: "[2]"
rules:
- "Każde twierdzenie faktograficzne musi mieć cytowanie"
- "Gdy źródła są sprzeczne → wybierz SSOT i pokaż konflikt"
Źródła i reguły to „kontrakt prawdy” – bez tego rośnie ryzyko halucynacji.
- Retrieval success ≥ 98% (≥1 dopuszczony dowód).
- Evidence coverage ≥ 95% dla faktów lub tryb no‑answer.
- Path validity ≥ 97% (provenance dla krawędzi).
- p95 latency ≤ 6 s end‑to‑end (warstwowo).