Procedura

Hybrydowe wyszukiwanie i reranking

Wzorzec produkcyjny dla RAG: hybrydowe retrieval (BM25 + wektory), deduplikacja, reranking i filtry (ACL/świeżość/DLP). Zorientowane na mierzalną jakość oraz SLO.

Czas czytania: ~14 min Aktualizacja: 2026-01-09

Rozszerzenie praktyczne

Operacyjny skrót

Ten rozdział należy do rodziny Wiedza i źródła i ma formę Procedura. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.

Checklista

Ustal SSOT i hierarchię źródeł (co jest kanoniczne, co pomocnicze).
Zaprojektuj retrieval: filtry, hybryda (keyword+semantics), reranking.
Wprowadź cytowania i atrybucję (proweniencja w odpowiedzi).
Zadbaj o świeżość i konflikty źródeł (zasady rozstrzygania).
Monitoruj jakość retrieval (trafność, pokrycie, dryft).
Zastosuj uprawnienia, redakcję danych i logowanie zapytań.

Najczęstsze pułapki

RAG bez cytowań – nie da się audytować, skąd wzięła się teza.
Chunking „na oko” – zbyt duże lub zbyt małe fragmenty psują trafność.
Brak polityki świeżości – model miesza stare i nowe wersje informacji.
Ignorowanie uprawnień – wycieki danych przez zbyt szeroki kontekst.

Artefakty w Luage

context_packet sources:ssot citations_contract retrieval_metrics access_policy

Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.

Szablon do skopiowania

Szkielet „context packet” (źródła + zasady)

context_packet: support.reply@v3
sources:
  - id: kb:refund_policy
    version: 1.7
    cite_as: "[1]"
  - id: kb:pricing
    version: 3.2
    cite_as: "[2]"
rules:
  - "Każde twierdzenie faktograficzne musi mieć cytowanie"
  - "Gdy źródła są sprzeczne → wybierz SSOT i pokaż konflikt"

Źródła i reguły to „kontrakt prawdy” – bez tego rośnie ryzyko halucynacji.

W skrócie

BM25 + vector równolegle
merge, dedupe i rerank
filtry ACL/świeżość + cytowania

Kiedy hybryda jest potrzebna

W klasycznym RAG pojedynczy mechanizm wyszukiwania często nie wystarcza: BM25 jest niezastąpiony dla nazw własnych, numerów, kodów i cytatów, natomiast wyszukiwanie wektorowe lepiej radzi sobie z parafrazą i semantyką. Hybryda łączy oba światy — pod warunkiem, że jest porządnie zrobiona.

Pipeline: BM25 + vector → merge+dedupe → rerank → filtry → dobór fragmentów i cytowania.

Architektura pipeline

Minimalny, solidny wariant obejmuje:

Normalizację zapytania (język, odmiany, usuwanie śmieci).

Lexical retrieval (BM25) oraz vector retrieval (embeddingi).

Merge + dedupe na poziomie doc_id i chunk_id.

Rerank (cross‑encoder lub inny model rankingowy).

Filtry: ACL, świeżość, DLP, domeny dozwolone.

Wybór fragmentów (K_final) i przygotowanie cytowań.

Reguła porządkowa: filtry dostępu (ACL) wykonuj jak najwcześniej, natomiast filtry jakości („na temat / nie na temat”) po reranku.

Reranking: kiedy i jak

Rerank jest najdroższym, ale najskuteczniejszym elementem jakości. Dobre praktyki:

Cross‑encoder jako domyślna opcja jakości (najlepsza precyzja, koszt CPU/GPU).

LLM‑rerank tylko, gdy potrzebujesz oceny semantycznej z uzasadnieniem (drożej, wolniej).

Heurystyki (boost na tytuł, świeżość) jako tani „pierwszy filtr”.

Filtry i bezpieczeństwo

Retrieval to także wektor ataku. Minimalne zabezpieczenia:

sanity‑check zapytania (długość, zakazane wzorce, prompt injection w query),

whitelist domen/źródeł w RAG,

twarde filtry DLP przed wstrzyknięciem fragmentów do kontekstu,

cytowanie na poziomie fragmentu (nie „ogólnie z dokumentu”).

Checklist wdrożenia

Zdefiniuj pipeline, a następnie go wersjonuj (parametry, modele, progi).

Stosuj dedupe po doc_id/chunk_id oraz filtry ACL przed rerankiem.

Rerank traktuj jako inwestycję jakości: kontroluj koszt i SLO.

Wymuś cytowania do fragmentów i testuj „coverage”.

Utrzymuj golden set i porównuj metryki po każdej zmianie.

Hybrydowe wyszukiwanie i reranking

Operacyjny skrót

Checklista

Najczęstsze pułapki

Artefakty w Luage

Szkielet „context packet” (źródła + zasady)

Kiedy hybryda jest potrzebna

Architektura pipeline

Reranking: kiedy i jak

Filtry i bezpieczeństwo

Metryki i ewaluacja

Parametry domyślne

Checklist wdrożenia

Powiązane