记忆合并不是后台清理:Agent 长期记忆的高风险写路径
从 Useful Memories Become Faulty When Continuously Updated by LLMs 看,自动把成功轨迹持续压缩成文字经验,可能让 Agent 从有用记忆退化到错误记忆;长期记忆系统需要把 consolidation 当成可验证、可回滚、可门控的写操作,而不是无条件后台任务。
Tag
从 Useful Memories Become Faulty When Continuously Updated by LLMs 看,自动把成功轨迹持续压缩成文字经验,可能让 Agent 从有用记忆退化到错误记忆;长期记忆系统需要把 consolidation 当成可验证、可回滚、可门控的写操作,而不是无条件后台任务。
LongMINT 把长期记忆评测推到多目标干扰、事实修订和跨片段聚合推理场景;结合 MedMemoryBench 的 memory saturation,可以看到生产 Agent 记忆的核心风险不是容量不足,而是旧事实、新事实、噪声和多任务目标互相污染。
TMLR 2026-05-17 接收的 ZipAct 把 agent 的交互历史压缩成 Goal、World、Constraint 三类结构化状态,让动作生成只看当前状态表和最新观察。它提醒我们,长任务记忆的关键不只是存储更多历史,而是把可执行状态、负反馈和约束持续更新到一个可验证的工作记忆里。
从 arXiv:2604.27003 和 elfmem 看,外部记忆并不会自动解决持续学习;它只是把灾难性遗忘从参数更新搬到检索、表示、评分衰减和经验复用策略里。
从 2026-05-02 的 agent memory 产品面讨论、ChatGPT Project-only memory、Claude 个性化功能和 Mem0/Cloudflare 的工程材料看,生产级记忆系统必须先定义用户、项目、任务和运行审计的边界,再谈向量库、图谱和长上下文。
从 arXiv:2604.15877 看,长期记忆、技能和规则不是三个孤立模块,而是同一条经验压缩轴上的不同粒度;真正缺失的是跨层晋升、降级和生命周期治理。