Human‑in‑the‑Loop: zatwierdzanie narzędzi i treści wysokiego ryzyka
Klasyczna kontrola: jeśli decyzja ma koszt lub ryzyko, potrzebuje autoryzacji. Ten rozdział pokazuje, jak ująć to w Engine: tryby wykonania, bramki, audyt i regresje.
HITL: kontrola tam, gdzie koszt błędu jest wysoki
Human‑in‑the‑Loop nie jest „hamulcem”. To mechanizm bezpieczeństwa i jakości, uruchamiany tylko wtedy, gdy model wchodzi w obszar wysokiego ryzyka: decyzje prawne, finansowe, operacje nieodwracalne, ujawnienie danych lub działania na kontach użytkowników.
Klasyfikacja ryzyka (prosty model)
- Low: informacyjne odpowiedzi bez narzędzi i bez danych wrażliwych.
- Medium: użycie narzędzia „read-only”, brak PII, brak skutków trwałych.
- High: write actions, finanse, legal, PII, eskalacje uprawnień.
Wzorzec zatwierdzania
- Propozycja: model generuje plan/zmianę i uzasadnienie + cytowania.
- Podgląd skutków: co dokładnie zrobi narzędzie (diff / preview).
- Zatwierdzenie: osoba odpowiedzialna (RACI) akceptuje, odrzuca albo modyfikuje.
- Wykonanie: narzędzie działa z tokenem czasowym i pełnym audytem.
Artefakty audytowe
- request_id, trace_id, user_id (z redakcją danych),
- policy_version, tool_contract_version,
- decyzja (approve/deny) i powód,
- wynik wykonania + ewentualna kompensacja/rollback.
Operacyjny skrót
Ten rozdział należy do rodziny Wdrożenie i governance i ma formę Procedura. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.
Checklista
- Ustal właścicieli (RACI) dla polityk, szablonów i danych.
- Wersjonuj i publikuj zmiany (changelog) z uzasadnieniem.
- Prowadź rejestr wyjątków i decyzji (ADR) dla odstępstw.
- Zdefiniuj SLO i monitoring (jakość, koszty, bezpieczeństwo).
- Zaplanuj rollout: środowiska, feature flags, rollback.
- Ustal rytm przeglądów i audytów (np. co kwartał).
Najczęstsze pułapki
- „Wdrożenie na wczoraj” bez ownerów – po miesiącu nikt nie utrzymuje standardu.
- Brak changelogu – użytkownicy nie wiedzą, czemu odpowiedzi się zmieniły.
- Brak rollbacku – błąd w polityce rozlewa się na całą organizację.
- Brak procesu wyjątków – wszyscy robią „po swojemu”, standard się rozpada.
Artefakty w Luage
Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.
Wpis do changelogu (przykład)
date: 2026-01-18
change:
id: language.standard@0.10
summary: "Ujednolicenie terminologii i doprecyzowanie stylu"
owner: "Content/AI Governance"
impact: "Wsparcie, dokumentacja, marketing"
rollback: "powrót do 0.9"
Governance to powtarzalność: jasne role, wersje, rejestry i kontrola jakości przed zmianą.
- AUTO‑EXECUTE vs APPROVAL vs BLOCK
- reguły bramek i odpowiedzialność
- audyt decyzji człowieka
- symulator doboru trybu