Mem0

2025-08-21 约 1055 字预计阅读 3 分钟

从这一节开始我们学习另一个 Agent 长期记忆的开源工具 Mem0

1. Mem0 原理

依据 Mem0 Paper 中的介绍按照是否基于图，Mem0 分为两种架构。两种架构下都分为Extracttion 和 Update 两个阶段。

提取阶段
- 输入：新消息对 $(m_{t-1}, m_t)$，包含用户消息与助手响应
- 上下文来源：
  1. 会话摘要 $S$：全局主题理解，由异步摘要生成模块定期刷新
  2. 最近消息序列：${m_{t-m}, …, m_{t-2}}$，提供细节与时间上下文
- 提示构造： $P = (S, {m_{t-m}, …, m_{t-2}}, m_{t-1}, m_t)$
- 通过 LLM 提取函数 $\phi(P)$ → 得到候选记忆集合 $\Omega = {\omega_1, …, \omega_n}$
更新阶段
- 对每个候选记忆 $\omega_i$：
  1. 通过向量检索获取 top-s 相似记忆
  2. 将候选记忆与相似记忆提交给 LLM
  3. LLM 决策存储操作（工具调用接口实现）：
    - ADD：创建新记忆
    - UPDATE：增强现有记忆
    - DELETE：删除与新信息冲突的记忆
    - NOOP：无需修改
- 执行 LLM 指定的操作 → 保证知识库的一致性与时间连贯性

Mem0g 是一种基于图的记忆方法，用于捕捉、存储和检索自然语言交互中的上下文信息。
记忆表示为有向带标签图 $G = (V, E, L)$。
- 节点 V：实体（Alice, San_Francisco）
- 边 E：实体关系（lives_in）
- 标签 L：语义类型（Person, City）

每个实体节点包含：

关系以三元组形式 $(v_s, r, v_d)$ 表示：
- $v_s$：源实体
- $v_d$：目标实体
- $r$：带标签的边（如 lives_in, prefers）

实体提取器
- 利用 LLM 从文本中识别语义上重要的实体（人、地点、事件、属性等）
- 实体筛选标准：语义重要性、唯一性、持久性
- 示例：旅行计划对话 → 城市、交通方式、日期、活动、偏好
关系生成器
- 分析上下文，生成语义关系三元组
- 关系类型：lives_in, prefers, owns, happened_on
- 使用提示工程，引导 LLM 提取显性与隐含关系