Przewodnik

Operacje GraphRAG: diagnostyka ścieżek, trace i klasy awarii

GraphRAG daje przewagę tylko wtedy, gdy można go utrzymać. Ten przewodnik porządkuje klasy awarii i pokazuje, jak wracać do stabilności bez chaotycznych zmian w ontologii.

Czas czytania: ~10 min Aktualizacja: 2026-01-10
Trzy pytania startowe
  • Czy odpowiedź ma dowód (cytowanie) dla faktów?
  • Czy retrieval znalazł jakikolwiek dopuszczony materiał?
  • Czy graf dodał ścieżkę z provenance?
Szybka diagnoza: retrieval vs graf vs bramki.
Szybka diagnoza: retrieval vs graf vs bramki.
Wzorzec diagnostyczny: najpierw ślad (trace), potem hipoteza. W GraphRAG „intuicja” bez trace to prosta droga do niekontrolowanych zmian w ontologii lub retrieverze.

1. Co musi zawierać trace GraphRAG

  • Retrieval: query, filtry, top‑k, rerank, odrzucone elementy i powody.
  • Graph: encje wejściowe, ścieżki, typy relacji, krawędzie odrzucone (brak provenance / brak uprawnień).
  • Gates: decyzje ACL/DLP/cytowań, wraz z kodem powodu.
  • Decision: answer / no‑answer / escalate.

2. Klasy awarii (praktyczne)

Klasa Objaw Najczęstsza przyczyna Pierwsza akcja
Retrieval‑0 Brak dowodów filtry, świeżość, indeks replay + sprawdź top‑k
Entity‑link Zła encja startowa aliasy, registry, NER waliduj mapping
Ontology‑drift „Dziwne” ścieżki relacje bez reguł constraints + testy
Provenance‑gap Krawędzie bez dowodu ekstrakcja relacji blok traversale
Gate‑deny Dużo odrzuceń ACL/DLP mismatch porównaj polityki

3. Playbook: decyzje krok po kroku

Poniżej masz krótkie playbooki. Zasada: zmiana powinna być minimalna, a jej efekt musi być zmierzony golden setem.

  1. Sprawdź filtry (tenant, ACL, czas) i top‑k.
  2. Porównaj z poprzednią wersją indeksu (blue/green).
  3. Jeśli problem jest w świeżości: uruchom reindeksację canary.

  1. Sprawdź registry aliasów i reguły normalizacji.
  2. Dodaj testy: 20–50 aliasów krytycznych dla domeny.
  3. Nie zmieniaj ontologii, jeśli problem leży w mappingu.

  1. Włącz „deny‑by‑default” dla traversali bez provenance.
  2. Napraw ekstrakcję relacji i przelicz build grafu.
  3. Dodaj metrykę: procent krawędzi bez provenance.

  1. Zidentyfikuj, która bramka odrzuca: ACL czy DLP.
  2. Porównaj mapowanie atrybutów użytkownika (ABAC).
  3. Jeśli biznes wymaga: użyj wyjątku czasowego (jawny, rejestrowany).

4. Minimalne narzędzia diagnostyczne

  • Replay trace na tej samej wersji indeksu, grafu i polityk.
  • Diff między buildami (index/graph).
  • Evidence viewer: klikany dowód (doc@ver + fragment) dla każdej tezy.

5. Checklista przed wdrożeniem poprawki

  • Klasa awarii wybrana na podstawie trace.
  • Zmiana jest minimalna i ma ownera.
  • Golden set + progi akceptacji spełnione.
Skrót: sygnały alarmowe
  • Skok krawędzi bez provenance.
  • Spadek skuteczności entity linking.
  • Nagły wzrost denial rate (ACL/DLP).