Checklist

Checklisty jakości (review)

Dobrze zrobiona checklista jest krótka, egzekwowalna i ma jedno zadanie: zatrzymać słaby materiał zanim trafi do użytkownika lub na produkcję. Poniżej jest zestaw, który nadaje się zarówno do rozdziałów Compendium, jak i do promptów, RAG oraz integracji narzędzi.

W skrócie
  • Blokuj, gdy brak źródeł / brak kontraktu / niejasna odpowiedzialność.
  • Ostrzegaj, gdy forma jest niespójna, a wynik „płynie”.
  • Mierz: checklista bez metryk zamienia się w „opinię”.

1. Zasady checklist (żeby działały)

Jednoznaczność
Każdy punkt ma wynik: tak / nie / nie dotyczy. Bez „wydaje mi się”.
Egzekwowalność
Zdefiniuj, które punkty blokują publikację, a które są tylko ostrzeżeniem.
Powiązanie z audytem
Jeśli nie potrafimy pokazać dowodu w logu/trace — punkt jest „na oko”.
Praktyka: checklista to bramka jakości, a nie recenzja literacka. Ma zatrzymać ryzyko, nie ocenić styl.

2. Szybki review (narzędzie)

Poniższy panel jest po to, żeby dało się zrobić przegląd „na jednym ekranie”. Jest świadomie konserwatywny — lepiej zatrzymać materiał o jeden raz za dużo niż przepuścić błąd.

Bramka: publikacja / wdrożenie
Wersja minimalna. 12 punktów.
0/12 0%
Wskazówka: jeśli wynik jest < 80%, traktuj to jako blokadę dla publikacji/produkcji.

3. Checklist promptu i polityki

  • Precedence: czy jasno opisano hierarchię instrukcji i co jest „niezmienne”?
  • Delimitacja: czy dane wejściowe są oddzielone od instrukcji (np. cytaty, bloki)?
  • Format: czy wynik jest walidowalny (JSON, tabela, szablon)?
  • Odmowa/eskalacja: czy system wie, kiedy przestać zgadywać?

4. Checklist źródeł i cytowań (RAG)

  • Jakość źródła: czy dokument ma ownera, wersję i datę aktualizacji?
  • Wiązanie twierdzeń: czy odpowiedź potrafi wskazać, z czego wynika?
  • Konflikty: czy opisano, co robić, gdy źródła się rozchodzą?
  • Sanityzacja: czy treści z RAG są traktowane jako dane (nie jako instrukcje)?

5. Checklist narzędzi (Tool Gateway)

  • Allowlist + RBAC: model nie „wymyśla” narzędzi i nie omija uprawnień.
  • Kontrakt: schemat wejścia i wyjścia jest walidowany.
  • Idempotency + limity: brak lawiny akcji na retrach, brak niekontrolowanych kosztów.
  • Audit: każde wywołanie ma trace_id, parametry po redakcji i wynik.

6. Checklist regresji (po zmianie)

  • Porównanie: wynik w kontrolowanych scenariuszach nie pogarsza się w metrykach.
  • Drift: monitorowanie „po cichu” w tle (sampling + analiza błędów).
  • Rollback: jest plan cofnięcia oraz kryteria uruchomienia.

7. Powiązane

Jak tego używać

W praktyce najlepiej działa rytuał: autor przechodzi checklistę, potem robi to recenzent. Rozbieżności oznaczają punkt do doprecyzowania, a nie „remis”.

Następny krok

Jeśli checklista ma działać, potrzebuje governance.

Przejdź do Governance polityk