Wzorzec

GraphRAG: planner zapytań i fuzja wyników

Wzorzec projektowy: routing retrieval (wektory vs graf), fuzja wyników i pakiet dowodowy z citation binding.

Rozszerzenie praktyczne

Operacyjny skrót

Ten rozdział należy do rodziny Wiedza i źródła i ma formę Wzorzec. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.

Checklista

Ustal SSOT i hierarchię źródeł (co jest kanoniczne, co pomocnicze).
Zaprojektuj retrieval: filtry, hybryda (keyword+semantics), reranking.
Wprowadź cytowania i atrybucję (proweniencja w odpowiedzi).
Zadbaj o świeżość i konflikty źródeł (zasady rozstrzygania).
Monitoruj jakość retrieval (trafność, pokrycie, dryft).
Zastosuj uprawnienia, redakcję danych i logowanie zapytań.

Najczęstsze pułapki

RAG bez cytowań – nie da się audytować, skąd wzięła się teza.
Chunking „na oko” – zbyt duże lub zbyt małe fragmenty psują trafność.
Brak polityki świeżości – model miesza stare i nowe wersje informacji.
Ignorowanie uprawnień – wycieki danych przez zbyt szeroki kontekst.

Artefakty w Luage

context_packet sources:ssot citations_contract retrieval_metrics access_policy

Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.

Szablon do skopiowania

Szkielet „context packet” (źródła + zasady)

context_packet: support.reply@v3
sources:
  - id: kb:refund_policy
    version: 1.7
    cite_as: "[1]"
  - id: kb:pricing
    version: 3.2
    cite_as: "[2]"
rules:
  - "Każde twierdzenie faktograficzne musi mieć cytowanie"
  - "Gdy źródła są sprzeczne → wybierz SSOT i pokaż konflikt"

Źródła i reguły to „kontrakt prawdy” – bez tego rośnie ryzyko halucynacji.

W skrócie

Planner dobiera strategię do typu pytania i budżetu
Fuzja musi być jawna i testowalna (union/intersection/constraints)
Kończymy pakietem dowodowym, nie listą dokumentów
Degradacja musi być kontrolowana (fail‑closed)

Jeżeli GraphRAG ma działać w produkcji, planner jest równie ważny jak sam graf.

3. Routing: cztery strategie

Vector‑first: najpierw podobne fragmenty → z nich startowe encje → krótka eksploracja grafu.

Graph‑first: start z encji/ID → traversal po relacjach → dopiero potem dobór fragmentów jako dowodów.

Hybrid: równolegle graf i wektory, a potem fuzja wyników.

Iterative: pętla: retrieval → ocena dowodów → doprecyzowanie zapytania.

Uwaga: Iterative wymaga śladu (trace) i budżetu kroków; inaczej wchodzi w „nieskończone doczytywanie”.

4. Fuzja wyników (join + ranking)

Fuzja powinna być jawna i testowalna. Zalecane reguły:

Union: łączymy wyniki i dopiero potem rerank (dobre na eksplorację).

Intersection: bierzemy tylko elementy wspólne (dobre na rygor dowodowy).

Constraint join: filtrujemy po politykach (tenant, dział, wersja, data).

Weighted: ważenie sygnałów (freshness, confidence, access, relevance).

6. Budżet, latencja, degradacja

Planner powinien mieć zdefiniowane tryby:

Normal: pełny pipeline, rerank, ścieżka grafowa.

Degraded: ograniczenie liczby kroków grafu / dokumentów, bez iteracji.

Fail‑closed: jeśli nie ma dowodów lub nie ma uprawnień — no‑answer + eskalacja.

Zasady „no‑answer” i eskalacji opisuje rozdział: Brak odpowiedzi i eskalacja.

GraphRAG: planner zapytań i fuzja wyników

Operacyjny skrót

Checklista

Najczęstsze pułapki

Artefakty w Luage

Szkielet „context packet” (źródła + zasady)

1. Kiedy to ma sens

2. Architektura planera

3. Routing: cztery strategie

4. Fuzja wyników (join + ranking)

5. Evidence i cytowania

6. Budżet, latencja, degradacja

7. Checklista implementacyjna

8. Powiązane