AI agenti nepotřebují všechny své vzpomínky najednou — potřebují ty nejrelevantnější. Chytrý recall engine UAML využívá policy-driven retrieval, kontextové rozpočtování a proaktivní vynořování k doručení přesně těch znalostí, které jsou v daný okamžik potřeba.
Kontextové rozpočtování
📊 Token-aware retrieval
Každý LLM má limit kontextového okna. UAML spravuje „kontextový rozpočet" — alokuje tokeny napříč různými typy paměti na základě aktuálního úkolu. Prioritní vzpomínky dostanou více prostoru; méně relevantní kontext je sumarizován nebo odložen.
📐 Víceúrovňový recall
Vzpomínky jsou vybavovány v úrovních: nejprve shrnutí, pak detaily pokud je potřeba. Dotaz na rozhodnutí z minulého týdne nejprve vrátí kompaktní shrnutí. Pokud agent potřebuje více detailů, může si vyžádat plné epizodické záznamy. Tím se zabrání zahlcení kontextu.
Policy-driven retrieval
📜 Recall politiky
Definujte pravidla pro to, co a kdy se vybavuje. Politiky mohou filtrovat podle typu paměti, tématu, stáří, skóre spolehlivosti nebo klasifikace dat. Politika může říkat: „Pro úkoly směřující k zákazníkům nikdy nezahrnuj interní rozhodovací stopy" nebo „Preferuj novější vzpomínky před staršími."
🔄 Proaktivní vynořování
UAML nečeká, až se ho zeptáte. Když detekuje relevantní kontext — související minulé rozhodnutí, konfliktní fakt, relevantní postup — proaktivně ho vynoří. Jako kolega, který řekne „Hele, tohle jsme už zkoušeli a tady je, co se stalo."
Hodnocení relevance
Každá vybavená vzpomínka je hodnocena podle relevance pomocí více signálů:
- Sémantická podobnost — jak blízká je vzpomínka aktuálnímu dotazu?
- Aktuálnost — novější vzpomínky dostávají konfigurovatelný bonus
- Frekvence — často přistupované vzpomínky mohou být důležitější
- Spolehlivost — fakta s vyšší spolehlivostí se řadí nad nejistá
- Shoda kontextu — odpovídá téma vzpomínky aktuálnímu úkolu?
Konfigurace
Proč na tom záleží
- Lepší odpovědi — relevantní kontext produkuje lepší AI odpovědi
- Nižší náklady — méně tokenů na požadavek znamená nižší API náklady
- Rychlejší odpovědi — kompaktní kontext se zpracovává rychleji
- Kontrola soukromí — politiky zabraňují úniku citlivých dat do nesprávných kontextů