W produkcyjnych chatbotach „pamięć” jest częścią inżynierii kontekstu: trzeba ją projektować, wersjonować i audytować. Ten rozdział porządkuje warstwy pamięci (historia, sesja, long‑term) oraz pokazuje jak wdrożyć je tak, by nie pogorszyć bezpieczeństwa ani rzetelności.
Czas czytania: ~14 minAktualizacja: 2026-01-09
Zasady nadrzędne
Pamięć jest opt‑in: użytkownik i organizacja muszą wiedzieć, co jest zapisywane.
Brak sekretów w historii rozmowy: sekrety należą do systemu, nie do promptu.
TTL i wersjonowanie: pamięć bez terminu ważności prowadzi do driftu.
Źródła faktów: long‑term przechowuje tylko fakty zweryfikowane (z provenance).
Audyt: każdy zapis ma trace_id, ownera i politykę retencji.
Warstwy pamięci i ich miejsce w pakiecie kontekstu (model „pamięć jako wejście”).
Teza operacyjna: pamięć nie zwiększa „inteligencji” modelu — zwiększa powierzchnię błędu.
Właściwie zaprojektowana pamięć poprawia ciągłość i personalizację, ale tylko wtedy, gdy jest ograniczona,
weryfikowana i odwracalna.
1. Cel i zakres
Celem jest zaprojektowanie pamięci tak, aby:
utrzymać ciągłość w ramach rozmowy (stan zadania),
zachować rozliczalność (kto, co, kiedy i dlaczego zostało zapamiętane).
2. Słownik pojęć
Historia rozmowy
Ostatnie wymiany w sesji. Może być streszczana, ale nie powinna zawierać sekretów.
Pamięć sesji
Stan roboczy zadania (cele, etapy, decyzje). TTL: minuty/godziny.
Pamięć długoterminowa
Profil i fakty opt‑in: tylko to, co jest zweryfikowane oraz potrzebne do wartości produktu.
3. Architektura: trzy pamięci + pakiet kontekstu
Najbezpieczniejszy model to „pamięć jako wejście”: pamięć nie zmienia modelu, tylko zasila pakiet kontekstu.
Dzięki temu mamy jeden punkt kontroli: walidacje, redakcję danych, versioning i audyt.
4. Zapis: co i kiedy wolno zapamiętać
Zapisy w pamięci powinny być rzadkie i intencjonalne. Zalecana jest polityka:
„najpierw sesja, potem long‑term”.
Rodzaj
Przykład
Warunek
TTL
Sesja
„Użytkownik wybrał plan Premium”.
Wymagane do dokończenia zadania.
Godziny / dni
Long‑term
„Preferuje odpowiedzi w języku polskim”.
Opt‑in + minimalizm danych.
Tygodnie / miesiące
Zakaz
Hasła, tokeny, numery kart, dane wrażliwe.
Nigdy. Zawsze redakcja.
—
5. Odczyt: jak włączać pamięć do odpowiedzi
Odczyt pamięci ma sens tylko wtedy, gdy jest selektywny. „Wrzucenie wszystkiego” do kontekstu
zwiększa szum, koszt i ryzyko halucynacji.
Retrieval pamięci: wybieraj wpisy na podstawie intencji i słów kluczowych, nie „na ślepo”.
Konflikty: jeśli pamięć stoi w sprzeczności z bieżącym kontekstem, preferuj bieżący fakt i poproś o potwierdzenie.
Streszczenie: historia rozmowy powinna mieć wersję skróconą (working summary), aktualizowaną przy checkpointach.