GraphRAG: planner zapytań i fuzja wyników
Wzorzec projektowy: routing retrieval (wektory vs graf), fuzja wyników i pakiet dowodowy z citation binding.
Operacyjny skrót
Ten rozdział należy do rodziny Wiedza i źródła i ma formę Wzorzec. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.
Checklista
- Ustal SSOT i hierarchię źródeł (co jest kanoniczne, co pomocnicze).
- Zaprojektuj retrieval: filtry, hybryda (keyword+semantics), reranking.
- Wprowadź cytowania i atrybucję (proweniencja w odpowiedzi).
- Zadbaj o świeżość i konflikty źródeł (zasady rozstrzygania).
- Monitoruj jakość retrieval (trafność, pokrycie, dryft).
- Zastosuj uprawnienia, redakcję danych i logowanie zapytań.
Najczęstsze pułapki
- RAG bez cytowań – nie da się audytować, skąd wzięła się teza.
- Chunking „na oko” – zbyt duże lub zbyt małe fragmenty psują trafność.
- Brak polityki świeżości – model miesza stare i nowe wersje informacji.
- Ignorowanie uprawnień – wycieki danych przez zbyt szeroki kontekst.
Artefakty w Luage
Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.
Szkielet „context packet” (źródła + zasady)
context_packet: support.reply@v3
sources:
- id: kb:refund_policy
version: 1.7
cite_as: "[1]"
- id: kb:pricing
version: 3.2
cite_as: "[2]"
rules:
- "Każde twierdzenie faktograficzne musi mieć cytowanie"
- "Gdy źródła są sprzeczne → wybierz SSOT i pokaż konflikt"
Źródła i reguły to „kontrakt prawdy” – bez tego rośnie ryzyko halucynacji.
- Planner dobiera strategię do typu pytania i budżetu
- Fuzja musi być jawna i testowalna (union/intersection/constraints)
- Kończymy pakietem dowodowym, nie listą dokumentów
- Degradacja musi być kontrolowana (fail‑closed)