Standard

Świeżość i konflikty źródeł

Standard utrzymania źródeł wiedzy: świeżość, autorytet, rozstrzyganie sprzeczności oraz wersjonowanie cytowań. System bez tych reguł produkuje odpowiedzi niespójne w czasie.

Czas czytania: ~12 min Aktualizacja: 2026-01-09
Rozszerzenie praktyczne

Operacyjny skrót

Ten rozdział należy do rodziny Wiedza i źródła i ma formę Standard. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.

Checklista

  • Ustal SSOT i hierarchię źródeł (co jest kanoniczne, co pomocnicze).
  • Zaprojektuj retrieval: filtry, hybryda (keyword+semantics), reranking.
  • Wprowadź cytowania i atrybucję (proweniencja w odpowiedzi).
  • Zadbaj o świeżość i konflikty źródeł (zasady rozstrzygania).
  • Monitoruj jakość retrieval (trafność, pokrycie, dryft).
  • Zastosuj uprawnienia, redakcję danych i logowanie zapytań.

Najczęstsze pułapki

  • RAG bez cytowań – nie da się audytować, skąd wzięła się teza.
  • Chunking „na oko” – zbyt duże lub zbyt małe fragmenty psują trafność.
  • Brak polityki świeżości – model miesza stare i nowe wersje informacji.
  • Ignorowanie uprawnień – wycieki danych przez zbyt szeroki kontekst.

Artefakty w Luage

context_packet sources:ssot citations_contract retrieval_metrics access_policy

Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.

Szablon do skopiowania

Szkielet „context packet” (źródła + zasady)

context_packet: support.reply@v3
sources:
  - id: kb:refund_policy
    version: 1.7
    cite_as: "[1]"
  - id: kb:pricing
    version: 3.2
    cite_as: "[2]"
rules:
  - "Każde twierdzenie faktograficzne musi mieć cytowanie"
  - "Gdy źródła są sprzeczne → wybierz SSOT i pokaż konflikt"

Źródła i reguły to „kontrakt prawdy” – bez tego rośnie ryzyko halucynacji.

W skrócie
  • autorytet źródeł i hierarchia
  • gate konfliktu + eskalacja
  • cache związany z wersją

Dlaczego świeżość jest parametrem jakości

Dla Compendium i RAG „prawda” nie jest abstrakcyjna — jest związana z konkretną wersją dokumentu. Jeżeli system nie rozumie świeżości, zaczyna mieszać stan „sprzed” i „po” zmianie polityki, co generuje sprzeczne odpowiedzi.

Świeżość i konflikty źródeł
Wersje, autorytet i gate konfliktu: preferencje muszą być jawne i zautomatyzowane.

Model autorytetu źródeł

Standard Luage rozróżnia autorytet, który może rozstrzygać konflikty:

  1. Polityka / Regulamin (źródło nadrzędne, wersjonowane, właściciel wskazany w governance).
  2. Dokumentacja produktowa (opis działania, release notes).
  3. FAQ / artykuły wsparcia (praktyka, wyjątki, interpretacje).
  4. Notatki robocze (tylko jako sygnał, nie jako prawda).

Reguły rozstrzygania konfliktów

Konflikty są normalne — ważne jest, aby były rozstrzygane powtarzalnie. Minimalny zestaw reguł:

  • nowsze wygrywa, chyba że źródło ma niższy autorytet,
  • autorytet wygrywa, gdy różnica świeżości jest niewielka,
  • jeśli konflikt nie jest rozstrzygalny → no‑answer + eskalacja do właściciela.
Najgorszy możliwy wariant to „wypadkowa” dwóch sprzecznych źródeł. Wtedy odpowiedź wygląda rozsądnie, ale jest fałszywa.

SLA aktualizacji i monitoring

Świeżość powinna mieć właściciela i SLA. Przykład:

  • Polityki: przegląd kwartalny (lub po incydencie).
  • Dokumentacja produktowa: przegląd po releasie.
  • FAQ: przegląd miesięczny dla najczęstszych pytań.

Monitoring: wykrywaj dokumenty „stare” względem progu i sygnalizuj w dashboardzie.

Cache a świeżość

Cache poprawia latencję, ale musi być zgodny z wersją źródła. W praktyce:

  • klucz cache zawiera doc_version lub source_hash,
  • unieważnianie cache jest częścią procesu publikacji.

Cytowanie wersji i fragmentów

Cytowanie jest mechanizmem dowodowym. Minimalna jednostka cytowania to fragment:

[doc_id, doc_version, section_id, quote_span, retrieved_at]

W Luage citations powinny być klikane i prowadzić do źródła (nawet wewnętrznego).

Checklist

  • Zdefiniuj autorytet źródeł (hierarchia).
  • Wymuś wersjonowanie i daty w metadanych.
  • Wprowadź gate konfliktu: rozstrzygaj lub eskaluj.
  • Zwiąż cache z wersją źródła i wprowadź invalidację po publikacji.
  • Cytuj fragmenty i zapisuj retrieved_at.

Powiązane

Skrót operacyjny
  1. Źródła mają autorytet i wersję.
  2. Konflikt rozstrzygaj regułami lub eskaluj.
  3. Cache zawsze wiąż z wersją.
Najczęstszy błąd
„Dokument mówi jedno, FAQ drugie — to połączmy”. Nie. Konflikt jest sygnałem procesu, nie treścią do miksowania.