Standard

Proweniencja krawędzi i ścieżki dowodowe

Standard audytowalności GraphRAG: dowody dla relacji, polityki dostępu i wiązanie ścieżek z twierdzeniami.

W skrócie
  • Krawędź bez dowodu nie jest używalna w odpowiedzi
  • Dowód = doc@ver + chunk_id + polityka dostępu
  • Claim→ścieżka→dowód to standard audytu
  • Provenance umożliwia regresje i rollback
To jest warunek rzetelności GraphRAG. Bez tego graf nie powinien zasilać odpowiedzi.
Standard dowodowy: jeśli krawędź nie ma provenance, to w praktyce nie wolno jej użyć do odpowiedzi. Graf bez dowodów jest grafem „opowieści”, nie grafem wiedzy.

1. Dlaczego provenance na poziomie krawędzi

W klasycznym RAG dowodem jest cytowany fragment. W GraphRAG dowodem musi być również: dlaczego dana relacja istnieje oraz z jakiego źródła wynika.

  • Bez provenance nie da się wykonać audytu ani regressions po zmianie dokumentów.
  • Bez provenance nie da się ustalić polityk dostępu per relacja.
  • Bez provenance model zaczyna „dorysowywać” relacje z intuicji.

2. Minimalny model danych provenance

Ścieżka dowodowa: węzły, krawędzie i dowody (doc_id@ver, chunk_id)

Minimalna struktura dowodu dla krawędzi:

{
  "edge_id": "E:dep:SYS_A->SYS_B",
  "relation": "depends_on",
  "evidence": [
    {"doc": "POL-17@1.4", "chunk": "c-0291", "quote_hash": "…"},
    {"doc": "RUNBOOK@2.1", "chunk": "c-1044"}
  ],
  "access": {"policy": "internal", "tenant": "ACME"},
  "extracted_by": {"pipeline": "graph/etl", "version": "2026.01"},
  "confidence": 0.87
}

3. Wiązanie dowodów z odpowiedzią (citation binding)

W Luage standardem jest mapowanie claimdowód. Dla GraphRAG oznacza to:

  • claim wskazuje ścieżkę grafową (encje + relacje),
  • każda relacja w ścieżce wskazuje dowody (evidence),
  • dla czytelnika końcowego cytowanie może pozostać „dokumentowe”, ale ślad wewnętrzny musi umieć zejść do krawędzi.

4. Kontrola dostępu

Access control nie może być „po indeksie”. Musi działać na poziomie dowodów, bo to dowody pochodzą z SSOT. Minimalna polityka:

  • jeśli dowód ma politykę „restricted”, krawędź dziedziczy ograniczenie,
  • jeśli krawędź miesza dowody z różnych polityk — obowiązuje bardziej restrykcyjna,
  • jeśli nie da się ustalić polityki — krawędź jest niepublikowana.

5. Audyt i regresje

Provenance umożliwia:

  • ponowne przeliczenie grafu po zmianie źródeł (diff),
  • wyjaśnienie, skąd wzięła się relacja (doc, wersja, fragment),
  • testy regresji dla ścieżek (patrz: Ewaluacja GraphRAG).

6. Wdrożenie: minimum akceptowalne

  • Wszystkie krawędzie mają dowody (lista, nie string).
  • Dowody są wersjonowane (doc@ver) i odnoszą się do chunk_id.
  • Jest audyt: kto, kiedy, jakim pipeline to opublikował.
  • W logach istnieje trace_id, który łączy aktualizację grafu z rejestrem zmian.

7. Powiązane

Na tej stronie
Spis
    Minimum akceptowalne
    • dowody strukturalne (lista), nie „opis tekstowy”
    • wersjonowanie źródeł (doc@ver)
    • trace_id dla publikacji grafu
    • fail‑closed przy braku polityki