🎯 Chytrý recall

Správná vzpomínka, ve správný čas, ve správném množství. Policy-driven recall maximalizující relevanci na token.

AI agenti nepotřebují všechny své vzpomínky najednou — potřebují ty nejrelevantnější. Chytrý recall engine UAML využívá policy-driven retrieval, kontextové rozpočtování a proaktivní vynořování k doručení přesně těch znalostí, které jsou v daný okamžik potřeba.

Kontextové rozpočtování

📊 Token-aware retrieval

Každý LLM má limit kontextového okna. UAML spravuje „kontextový rozpočet" — alokuje tokeny napříč různými typy paměti na základě aktuálního úkolu. Prioritní vzpomínky dostanou více prostoru; méně relevantní kontext je sumarizován nebo odložen.

📐 Víceúrovňový recall

Vzpomínky jsou vybavovány v úrovních: nejprve shrnutí, pak detaily pokud je potřeba. Dotaz na rozhodnutí z minulého týdne nejprve vrátí kompaktní shrnutí. Pokud agent potřebuje více detailů, může si vyžádat plné epizodické záznamy. Tím se zabrání zahlcení kontextu.

Policy-driven retrieval

📜 Recall politiky

Definujte pravidla pro to, co a kdy se vybavuje. Politiky mohou filtrovat podle typu paměti, tématu, stáří, skóre spolehlivosti nebo klasifikace dat. Politika může říkat: „Pro úkoly směřující k zákazníkům nikdy nezahrnuj interní rozhodovací stopy" nebo „Preferuj novější vzpomínky před staršími."

🔄 Proaktivní vynořování

UAML nečeká, až se ho zeptáte. Když detekuje relevantní kontext — související minulé rozhodnutí, konfliktní fakt, relevantní postup — proaktivně ho vynoří. Jako kolega, který řekne „Hele, tohle jsme už zkoušeli a tady je, co se stalo."

Hodnocení relevance

Každá vybavená vzpomínka je hodnocena podle relevance pomocí více signálů:

Konfigurace

from uaml.recall import RecallPolicy, ContextBudget # Definice kontextového rozpočtu budget = ContextBudget( max_tokens=4000, allocation={ "episodic": 0.3, # 30 % pro nedávné události "semantic": 0.4, # 40 % pro fakta "procedural": 0.2, # 20 % pro postupy "reasoning": 0.1, # 10 % pro rozhodovací stopy } ) # Vytvoření recall politiky policy = RecallPolicy( name="zakaznicke", exclude_types=["reasoning"], # Skrýt interní stopy max_age_days=90, # Pouze nedávné vzpomínky min_confidence=0.7, # Pouze vysoká spolehlivost prefer_summaries=True, # Nejdříve kompaktní formát ) # Recall s politikou a rozpočtem results = uaml.recall("historie nasazení zákazníka", policy=policy, budget=budget)

Proč na tom záleží

← Zpět na UAML