Testy kontraktowe narzędzi
Jeżeli narzędzie ma być bezpieczne w rękach agenta, musi mieć kontrakt i testy. To stara, solidna zasada z integracji systemów — w agentach jest tylko bardziej bezwzględna.
Testy kontraktowe: stabilność na styku LLM ↔ narzędzia
Testy kontraktowe weryfikują, czy narzędzie spełnia oczekiwany kontrakt: schema wejścia/wyjścia, kody błędów, idempotency, limity i zachowanie w scenariuszach brzegowych. W Luage to fundament „tool gateway”.
Co testować (minimum)
- Schema: walidacja wejścia i wyjścia (w tym pola opcjonalne).
- Idempotency: powtórne wywołanie nie może robić podwójnych skutków.
- Timeout: zachowanie przy przekroczeniu budżetu czasu.
- Rate limit: retry/backoff i komunikat błędu do planera.
Jak budować pakiet testów
- Happy path – 3–5 przypadków reprezentatywnych.
- Edge cases – granice zakresu, puste wartości, brak uprawnień.
- Failure matrix – 4xx/5xx/timeout/rate-limit.
- Replay – deterministyczne odtwarzanie kroków (trace → test).
Format raportu
contract_test_report:
tool: "ticket.create"
version: "1.2.0"
passed: 42
failed: 1
failures:
- id: "idempotency.duplicate"
trace: "trc_91fc..."
expected: "no-op"
got: "created"
Operacyjny skrót
Ten rozdział należy do rodziny Wdrożenie i governance i ma formę Procedura. Poniższe dopowiedzenie ma jeden cel: przełożyć treść na działania, które da się wdrożyć, zmierzyć i utrzymać.
Checklista
- Ustal właścicieli (RACI) dla polityk, szablonów i danych.
- Wersjonuj i publikuj zmiany (changelog) z uzasadnieniem.
- Prowadź rejestr wyjątków i decyzji (ADR) dla odstępstw.
- Zdefiniuj SLO i monitoring (jakość, koszty, bezpieczeństwo).
- Zaplanuj rollout: środowiska, feature flags, rollback.
- Ustal rytm przeglądów i audytów (np. co kwartał).
Najczęstsze pułapki
- „Wdrożenie na wczoraj” bez ownerów – po miesiącu nikt nie utrzymuje standardu.
- Brak changelogu – użytkownicy nie wiedzą, czemu odpowiedzi się zmieniły.
- Brak rollbacku – błąd w polityce rozlewa się na całą organizację.
- Brak procesu wyjątków – wszyscy robią „po swojemu”, standard się rozpada.
Artefakty w Luage
Standard działa dopiero wtedy, gdy ma właściciela, wersję, ślad (trace) oraz test regresyjny.
Wpis do changelogu (przykład)
date: 2026-01-18
change:
id: language.standard@0.10
summary: "Ujednolicenie terminologii i doprecyzowanie stylu"
owner: "Content/AI Governance"
impact: "Wsparcie, dokumentacja, marketing"
rollback: "powrót do 0.9"
Governance to powtarzalność: jasne role, wersje, rejestry i kontrola jakości przed zmianą.
- kontrakt narzędzia to schema + semantyka (błędy, retry, idempotency, RBAC)
- testy muszą mieć część must‑pass i must‑fail
- bramka CI blokuje wdrożenie przy regresji, a raport jest artefaktem
- bez testów agent „uczy się” narzędzia na użytkownikach — to kosztowny sport