Topic Document 不是笔记格式:它是长期 Agent 记忆的维护单元
Infini Memory 把长期 Agent 记忆从孤立片段和向量召回,推进到可维护的主题文档库。工程上,Topic Document 的价值不只是可读 Markdown,而是把写入缓冲、证据聚合、事实修订、局部检索和审计元数据放进同一个维护单元。
Tag
Infini Memory 把长期 Agent 记忆从孤立片段和向量召回,推进到可维护的主题文档库。工程上,Topic Document 的价值不只是可读 Markdown,而是把写入缓冲、证据聚合、事实修订、局部检索和审计元数据放进同一个维护单元。
arXiv:2605.30159 提出用 Belief Entropy 给长程 Agent 的递归记忆摘要做中间奖励:问题不只是摘要能否变短,而是每一步摘要后,Agent 对任务状态、缺口信息和后续动作的信念是否更清楚。
从 arXiv:2606.02461 AgentCL 看,Agent 长期记忆评测不应只停留在长对话召回、环境问答或抗干扰测试,还要测前序任务经验能否在后续任务中被稳定复用,以及何时会造成负迁移。
arXiv:2605.24657 把软件开发对话里的级联压缩和 LoRA 式权重合并放到同一评测里:压缩循环会快速丢失程序性纠错和项目事实,而权重合并保留更多知识。但这不意味着所有记忆都应该写进模型,真正的问题是如何在上下文、外部记忆和可回滚适配器之间划边界。
从 MemPoison 和 MemMorph 看,Agent 记忆攻击正在从“把恶意内容写进长期记忆”推进到“让恶意内容通过抽取、重写、检索和工具推理链条”。生产系统需要把记忆写入、来源权威、检索召回和工具授权放进同一套评测。
从 SuperBrain、Claude Code hooks、claude-mem 和 Memory-R2 看,长期记忆系统的难点正在从存储迁移到工作上下文注入:什么时候取、取多少、凭什么取、如何阻止旧记忆污染当前任务。
从 Persistent AI Agents in Academic Research 看,长期记忆 Agent 的评估对象不该只是单轮回答、RAG 命中率或 token 成本,而应扩展到人-代理-文件-工具-计划任务-治理规则组成的持久化环境。
从 Useful Memories Become Faulty When Continuously Updated by LLMs 看,自动把成功轨迹持续压缩成文字经验,可能让 Agent 从有用记忆退化到错误记忆;长期记忆系统需要把 consolidation 当成可验证、可回滚、可门控的写操作,而不是无条件后台任务。
LongMINT 把长期记忆评测推到多目标干扰、事实修订和跨片段聚合推理场景;结合 MedMemoryBench 的 memory saturation,可以看到生产 Agent 记忆的核心风险不是容量不足,而是旧事实、新事实、噪声和多任务目标互相污染。
TMLR 2026-05-17 接收的 ZipAct 把 agent 的交互历史压缩成 Goal、World、Constraint 三类结构化状态,让动作生成只看当前状态表和最新观察。它提醒我们,长任务记忆的关键不只是存储更多历史,而是把可执行状态、负反馈和约束持续更新到一个可验证的工作记忆里。