Google zveřejnil zdrojový kód pro „Agent Persistent Memory Agent“, který přináší revoluci ve způsobu, jakým agenti AI ukládají a vyvolávají informace. Na rozdíl od tradičních systémů, které se spoléhají na vektorové databáze, tento agent používá velký jazykový model (LLM) k přímé správě trvalé paměti, ukládání dat v SQLite a jejich konsolidaci na pozadí. Projekt, vytvořený pomocí sady Agent Development Kit (ADK) od Google a Gemini 3.1 Flash-Lite, představuje důležitý krok směrem k nepřetržité a dlouhodobé autonomii umělé inteligence.

Odklon od vektorových databází

Po mnoho let se paměť agentů umělé inteligence při efektivním vyhledávání silně spoléhala na vektorové databáze. Tento nový přístup tuto složitost zcela obchází a místo toho spoléhá na schopnost LLM přímo organizovat a aktualizovat paměť. To zjednodušuje infrastrukturu a potenciálně snižuje náklady a provozní náklady, zejména pro malé a středně velké agenty. V tomto návrhu je rychlost vektorového vyhledávání nahrazena latencí modelu, čímž se posouvá problémové místo výkonu.

Proč na tom záleží: Vzestup perzistentní umělé inteligence

Tento krok odráží rostoucí poptávku po systémech umělé inteligence, které fungují nepřetržitě a udržují kontext během dlouhodobých interakcí. To je zásadní pro aplikace, jako je dlouhodobá výzkumná pomoc, interní koprocesory a automatizované pracovní postupy. Trvalá paměť však také vytváří nové problémy se správou. Na rozdíl od agentů vázaných na relaci vyžadují systémy s nepřetržitou pamětí jasné zásady týkající se uchovávání dat, auditování a řízení přístupu.

Jak to funguje: zjednodušená architektura

Agent běží jako dlouhotrvající služba, ingestuje různé typy dat (text, obrázky, zvuk, video, PDF) a ukládá strukturovanou paměť v SQLite. Plánovaná konsolidace, ve výchozím nastavení každých 30 minut, zajišťuje, že LLM pravidelně aktualizuje svou znalostní bázi. Místní HTTP API a Streamlit panel poskytují přístup a možnosti monitorování. Klíčovým tvrzením je, že nejsou vyžadovány žádné vektorové databáze ani vkládací kanály; LLM nezávisle spravuje organizaci paměti.

Role Flash-Lite: ekonomika a produktivita

Model Gemini 3.1 Flash-Lite od Googlu pohání systém a dosahuje rovnováhy mezi rychlostí a efektivitou nákladů. Cena je 0,25 $ za 1 milion vstupních tokenů a 1,50 $ za 1 milion výstupních tokenů. Flash-Lite je 2,5krát rychlejší než Gemini 2.5 Flash a poskytuje 45% zvýšení výstupní rychlosti. Výkon modelu (skóre Elo 1432 na Arena.ai) jej činí životaschopným pro vysokofrekvenční a stále zapnuté operace.

Problémy se správou a škálovatelností

Vydání již vyvolalo debatu, přičemž odborníci poukazují na rizika shody spojená s nekontrolovanou konsolidací paměti. Bez deterministických hranic může agent „snít“ a křížově opylovat vzpomínky nepředvídatelnými způsoby, vytvářet noční můry auditu a odpovědnosti. Škálování systému také vyvolává otázky týkající se posunu paměti, kruhového chování a efektivity vyhledávání, protože znalostní báze roste.

The Big Picture: Agent Runtime Strategy

Google ADK to neprezentuje jako samostatné demo, ale jako součást širší strategie běhu agenta. Framework je model agnostický a podporuje různé modely nasazení, včetně Cloud Run a Vertex AI Agent Engine. To ukazuje na vizi agentů jako nasaditelných softwarových systémů, kde paměť je nedílnou vrstvou běhového prostředí.

Závěrem lze říci, že systém paměti s otevřeným zdrojovým kódem Google signalizuje posun směrem k trvalejším a autonomnějším systémům umělé inteligence. I když tato technologie nabízí přesvědčivé výhody z hlediska efektivity, její dlouhodobý úspěch bude záviset na řešení problémů správy a zajištění škálovatelnosti v reálném podnikovém nasazení.