Przewodnik • Wiedza i źródła

RAG — Retrieval‑Augmented Generation

RAG podnosi rzetelność odpowiedzi, ale tylko wtedy, gdy jest traktowany jak system: SSOT, kontrakt cytowań, metryki jakości i operacje.

Powiązane: Chunking i indeksowanie Powiązane: Ewaluacja RAG Powiązane: ADR RAG vs fine‑tuning

Rozszerzenie praktyczne

Operacyjny skrót

Ten rozdział należy do rodziny Wiedza i źródła i ma formę Przewodnik. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.

Checklista

Ustal SSOT i hierarchię źródeł (co jest kanoniczne, co pomocnicze).
Zaprojektuj retrieval: filtry, hybryda (keyword+semantics), reranking.
Wprowadź cytowania i atrybucję (proweniencja w odpowiedzi).
Zadbaj o świeżość i konflikty źródeł (zasady rozstrzygania).
Monitoruj jakość retrieval (trafność, pokrycie, dryft).
Zastosuj uprawnienia, redakcję danych i logowanie zapytań.

Najczęstsze pułapki

RAG bez cytowań – nie da się audytować, skąd wzięła się teza.
Chunking „na oko” – zbyt duże lub zbyt małe fragmenty psują trafność.
Brak polityki świeżości – model miesza stare i nowe wersje informacji.
Ignorowanie uprawnień – wycieki danych przez zbyt szeroki kontekst.

Artefakty w Luage

context_packet sources:ssot citations_contract retrieval_metrics access_policy

Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.

W skrócie

RAG podnosi rzetelność, ale tylko przy kontrakcie cytowań i bramkach dowodowych.
Jakość to nie „trafność” — to pokrycie, atrybucja i stabilność w czasie.
Bezpieczeństwo: ACL, poisoning, prompt injection przez dokumenty, redakcja danych.
Operacje: reindeks, monitoring, regresje i kontrola kosztu.

RAG — Retrieval‑Augmented Generation

Operacyjny skrót

Checklista

Najczęstsze pułapki

Artefakty w Luage

1. Definicja: co RAG rozwiązuje (a czego nie)

2. Kiedy RAG ma sens

3. Minimalna architektura RAG

4. Jakość: metryki i test harness

5. Bezpieczeństwo i zgodność

6. Operacje: świeżość i monitoring

7. Checklist wdrożeniowy