Chytrý recall

AI agenti nepotřebují všechny své vzpomínky najednou — potřebují ty nejrelevantnější. Chytrý recall engine UAML využívá policy-driven retrieval, kontextové rozpočtování a proaktivní vynořování k doručení přesně těch znalostí, které jsou v daný okamžik potřeba.

Kontextové rozpočtování

📊 Token-aware retrieval

Každý LLM má limit kontextového okna. UAML spravuje „kontextový rozpočet" — alokuje tokeny napříč různými typy paměti na základě aktuálního úkolu. Prioritní vzpomínky dostanou více prostoru; méně relevantní kontext je sumarizován nebo odložen.

📐 Víceúrovňový recall

Vzpomínky jsou vybavovány v úrovních: nejprve shrnutí, pak detaily pokud je potřeba. Dotaz na rozhodnutí z minulého týdne nejprve vrátí kompaktní shrnutí. Pokud agent potřebuje více detailů, může si vyžádat plné epizodické záznamy. Tím se zabrání zahlcení kontextu.

Policy-driven retrieval

📜 Recall politiky

Definujte pravidla pro to, co a kdy se vybavuje. Politiky mohou filtrovat podle typu paměti, tématu, stáří, skóre spolehlivosti nebo klasifikace dat. Politika může říkat: „Pro úkoly směřující k zákazníkům nikdy nezahrnuj interní rozhodovací stopy" nebo „Preferuj novější vzpomínky před staršími."

🔄 Proaktivní vynořování

UAML nečeká, až se ho zeptáte. Když detekuje relevantní kontext — související minulé rozhodnutí, konfliktní fakt, relevantní postup — proaktivně ho vynoří. Jako kolega, který řekne „Hele, tohle jsme už zkoušeli a tady je, co se stalo."

Hodnocení relevance

Každá vybavená vzpomínka je hodnocena podle relevance pomocí více signálů:

Sémantická podobnost — jak blízká je vzpomínka aktuálnímu dotazu?
Aktuálnost — novější vzpomínky dostávají konfigurovatelný bonus
Frekvence — často přistupované vzpomínky mohou být důležitější
Spolehlivost — fakta s vyšší spolehlivostí se řadí nad nejistá
Shoda kontextu — odpovídá téma vzpomínky aktuálnímu úkolu?

Konfigurace

from uaml.recall import RecallPolicy, ContextBudget

# Definice kontextového rozpočtu
budget = ContextBudget(
    max_tokens=4000,
    allocation={
        "episodic": 0.3,    # 30 % pro nedávné události
        "semantic": 0.4,    # 40 % pro fakta
        "procedural": 0.2,  # 20 % pro postupy
        "reasoning": 0.1,   # 10 % pro rozhodovací stopy
    }
)

# Vytvoření recall politiky
policy = RecallPolicy(
    name="zakaznicke",
    exclude_types=["reasoning"],  # Skrýt interní stopy
    max_age_days=90,              # Pouze nedávné vzpomínky
    min_confidence=0.7,           # Pouze vysoká spolehlivost
    prefer_summaries=True,        # Nejdříve kompaktní formát
)

# Recall s politikou a rozpočtem
results = uaml.recall("historie nasazení zákazníka",
                       policy=policy, budget=budget)
            

Proč na tom záleží

Lepší odpovědi — relevantní kontext produkuje lepší AI odpovědi
Nižší náklady — méně tokenů na požadavek znamená nižší API náklady
Rychlejší odpovědi — kompaktní kontext se zpracovává rychleji
Kontrola soukromí — politiky zabraňují úniku citlivých dat do nesprávných kontextů

← Zpět na UAML

🔍 Chytrý recall