随着 AI Agent 应用于多轮对话、长周期任务和复杂协作,记忆系统已经从“可选的附加组件”变成了“不可或缺的基础设施”。
Agent memory和RAG有交叉的地方,但是Agent memory ≠ RAG,RAG只是外挂知识库和知识检索,但是Agent memory一种持续维护的认知状态。它不仅包含存储,还涉及在交互过程中不断地更新、整合、纠错和抽象。Agent 记忆能让模型产生“自我连续性”(Continuity of identity or purpose)。

1、记忆的三大维度

Token level —— 类比为context
Parameter level —— 模型内部参数知识
Latent level —— 将记忆存储为高维向量(Vector Embeddings)或模型的隐藏状态(Hidden States),并在需要时进行相似度检索。

2、为什么需要记忆?

粗略可以分为长期记忆和短期记忆,而长期记忆又可以进一步分为 事实性知识记忆和经验记忆(例如skill能力)。而短期记忆主要是会话时的工作记忆,只作用于当前会话,主动维护和处理上下文的临时认知空间。

3、Agent memory管理

其实这里有点像数据库里面的 增/删/改/查,在mem0框架中,分为 update/delete/add/noop。

4、未来研究方向

1、面向自动化的记忆设计: 目前大多数记忆系统(什么时候写、怎么更新、怎么取)严重依赖人工手写的 Prompt 和规则。未来需要让模型学会自主管理记忆。Memory-R1已经在做相关的探索了,读了一下有很多启发。
2、强化学习与记忆系统的深度融合: 利用 RL 来优化记忆的提取和更新策略,让 Agent 通过奖励信号自动学习什么该记、什么该忘。
3、多模态记忆 (Multimodal Memory): 从单一的文本记忆扩展到视觉、听觉等高维感知记忆的存储与抽象。
4、多 Agent 系统的共享记忆: 在多个 Agent 协同工作时,如何高效地共享环境状态与团队经验,避免信息孤岛。

真正的高级 Agent 必须超越简单的“向量数据库+检索”,建立一套具备生命周期管理(写入、沉淀、抽象、遗忘)的动态记忆认知子系统,而不是单纯的启发式记忆,启发式记忆系统无法在所有领域实现大一统,但是目前主流的框架大多都是启发式记忆系统,但是在具体的工作中做了大量的优化。