DLP w Luage jest traktowane jako element inżynierii kontekstu: zanim dane trafią do modelu,
są klasyfikowane i redagowane. Analogicznie — zanim odpowiedź trafi do użytkownika, jest sprawdzana pod kątem
wycieku PII/sekretów.
1. Model mentalny: dwa kierunki
Input DLP (do modelu)
- maskowanie PII, sekretów, identyfikatorów
- minimalizacja pól (tylko to, co potrzebne)
- logowanie metadanych zamiast treści
Output DLP (do użytkownika)
- wykrywanie wycieku danych
- blokada lub redakcja fragmentu
- eskalacja / approval dla incydentów
2. Demonstrator redakcji
Poniżej jest uproszczony demonstrator (lokalny) pokazujący ideę. W produkcji detekcja jest bogatsza
(kontekst, allowlisty, słowniki, modele pomocnicze), ale mechanika jest ta sama.
Redakcja danych — tryb demonstracyjny
Zaznacz detektory — zobacz jak zmienia się tekst i lista trafień.
Po redakcji (do modelu / do logów)
3. Pipeline: gdzie wpiąć DLP
- Przed kontekstem: redakcja danych wejściowych użytkownika i narzędzi.
- Przed RAG: filtrowanie źródeł po ACL oraz usuwanie danych spoza celu.
- Przed odpowiedzią: detekcja wycieku i polityka blokady/eskalacji.
- Przed logami: zawsze redakcja — trace bez danych wrażliwych.
4. Tryby pracy i wyjątki
Dla wdrożeń produkcyjnych Luage zakłada trzy tryby:
- Block — twarda blokada (sekrety, dane prawnie wrażliwe).
- Redact — maskowanie i kontynuacja (część PII).
- Report‑only — wykrywanie i logowanie zdarzeń (start, pilotaż).
Report‑only jest wyjątkiem, nie docelowym stanem. Jeśli jest użyty, powinien pojawić się w rejestrze wyjątków
z terminem wygaszenia i planem przejścia na tryb „block/redact”.
5. Testy i regresje
DLP ma typowy problem: poprawka jednego detektora psuje inne. Dlatego potrzebne są regresje:
- zestaw przypadków pozytywnych i negatywnych (false positives są kosztowne),
- testy „przez domenę” (support, sprzedaż, HR),
- metadane i telemetry (częstość trafień, koszt redakcji, latencja).
6. Checklist standardu
- Detektory: e‑mail/telefon/sekrety/identyfikatory + allowlisty kontekstowe.
- DLP wpięte na wejściu, na wyjściu i przed logowaniem.
- Tryb report‑only ma termin wygaszenia; wyjątki są rejestrowane.
- Regresje i monitoring (false positives / false negatives).