Topic Document 不是笔记格式:它是长期 Agent 记忆的维护单元
Infini Memory 把长期 Agent 记忆从孤立片段和向量召回,推进到可维护的主题文档库。工程上,Topic Document 的价值不只是可读 Markdown,而是把写入缓冲、证据聚合、事实修订、局部检索和审计元数据放进同一个维护单元。
Agent Memory
跟踪 Agent 长期记忆、上下文压缩、RAG、经验沉淀、遗忘策略、评测方法和生产化架构。
Infini Memory 把长期 Agent 记忆从孤立片段和向量召回,推进到可维护的主题文档库。工程上,Topic Document 的价值不只是可读 Markdown,而是把写入缓冲、证据聚合、事实修订、局部检索和审计元数据放进同一个维护单元。
arXiv:2606.06448 把 Agent memory 从结构设计推进到系统工作负载表征:写入构建、检索、生成各自承担不同成本。生产系统需要用 phase-aware profiling、容量治理、调度策略和收益指标证明记忆层不是更贵的上下文。
arXiv:2605.30159 提出用 Belief Entropy 给长程 Agent 的递归记忆摘要做中间奖励:问题不只是摘要能否变短,而是每一步摘要后,Agent 对任务状态、缺口信息和后续动作的信念是否更清楚。
从 arXiv:2606.02461 AgentCL 看,Agent 长期记忆评测不应只停留在长对话召回、环境问答或抗干扰测试,还要测前序任务经验能否在后续任务中被稳定复用,以及何时会造成负迁移。
从 arXiv:2605.28009 MemGuard 看,长期记忆的可靠性问题不只来自检索召回不足,也来自把稳定事实、情景事件和操作规则混成同一种证据。生产 Agent 记忆层需要类型边界、关系图、查询路由和可审计的组合策略。
从 arXiv:2605.25092 AgentIR 看,长期对话记忆的读路径不是普通向量检索:索引会持续增长,查询类型会在会话内漂移,dense 通道并不总值得运行。生产 Agent 记忆层应该把检索策略、时间分区、延迟预算、来源治理和写入状态分开设计。
arXiv:2605.24657 把软件开发对话里的级联压缩和 LoRA 式权重合并放到同一评测里:压缩循环会快速丢失程序性纠错和项目事实,而权重合并保留更多知识。但这不意味着所有记忆都应该写进模型,真正的问题是如何在上下文、外部记忆和可回滚适配器之间划边界。
从 SuperBrain、Claude Code hooks、claude-mem 和 Memory-R2 看,长期记忆系统的难点正在从存储迁移到工作上下文注入:什么时候取、取多少、凭什么取、如何阻止旧记忆污染当前任务。
从 Persistent AI Agents in Academic Research 看,长期记忆 Agent 的评估对象不该只是单轮回答、RAG 命中率或 token 成本,而应扩展到人-代理-文件-工具-计划任务-治理规则组成的持久化环境。
从 Useful Memories Become Faulty When Continuously Updated by LLMs 看,自动把成功轨迹持续压缩成文字经验,可能让 Agent 从有用记忆退化到错误记忆;长期记忆系统需要把 consolidation 当成可验证、可回滚、可门控的写操作,而不是无条件后台任务。
LongMINT 把长期记忆评测推到多目标干扰、事实修订和跨片段聚合推理场景;结合 MedMemoryBench 的 memory saturation,可以看到生产 Agent 记忆的核心风险不是容量不足,而是旧事实、新事实、噪声和多任务目标互相污染。
TMLR 2026-05-17 接收的 ZipAct 把 agent 的交互历史压缩成 Goal、World、Constraint 三类结构化状态,让动作生成只看当前状态表和最新观察。它提醒我们,长任务记忆的关键不只是存储更多历史,而是把可执行状态、负反馈和约束持续更新到一个可验证的工作记忆里。
LinkedIn 的 Hierarchical Long-Term Semantic Memory 和 Cognitive Memory Agent 把 agent memory 从“多存一些聊天历史”推进到生产个性化基础设施:schema-aligned 语义树、多视图记忆、身份作用域检索、近线增量更新、可观测来源和端到端质量指标。它的启发是,企业 agent 的长期记忆首先是业务边界、隐私隔离和延迟预算问题,其次才是向量检索问题。
LongMemEval-V2 把长期记忆问题从用户聊天历史推进到 web/enterprise agent 的环境经验:静态状态、动态变化、工作流、局部陷阱和前提意识。它提醒我们,生产记忆系统不能只追求 RAG 召回分数,还要证明经验能被压缩、检索、使用,并在延迟成本内帮助 agent 像资深同事一样工作。
OpenAI Agents SDK 的 sandbox memory 文档和 AgentMemory 近期连续修复显示,coding agent 的长期记忆不再只是 RAG 或偏好存储,而是涉及文件化状态、渐进披露、隔离布局、召回正确性、部署持久化、上下文预算和观测面的运行时系统。
PlugMem、gbrain-evals、MemPalace 和 Mem0 等近期材料显示,agent memory 的公开评测正在进入高分密集区;真正重要的问题不再只是 R@5 或 accuracy,而是数据划分、调参污染、成本账本、可复现脚本和生产迁移边界。
5 月上旬的 Trojan Hippo、MAGE 和 Opal 等研究说明,长期记忆不只是个性化能力,也是跨会话攻击面、隐私泄露面和防护状态本身;生产系统必须把记忆写入、来源、工具权限和遗忘纳入同一个安全模型。
MongoDB 在 2026-05-08 为 LangGraph.js 长期记忆发布一等支持,意味着短期 checkpoint、长期 store、语义检索和自动 embedding 正在进入应用数据库;但这解决的是运行时和存储边界,不等于解决记忆写入、作用域、遗忘和个性化误用。
从 2026-05-06 的 MemAgents workshop 回顾和 ICLR/OpenReview 论文线索看,AI agent memory 的关键问题正在从“要不要长期记忆”转向写入、压缩、召回、利用和评测瓶颈的可诊断化。
从 arXiv:2604.27003 和 elfmem 看,外部记忆并不会自动解决持续学习;它只是把灾难性遗忘从参数更新搬到检索、表示、评分衰减和经验复用策略里。
从 arXiv:2604.23069 ContextWeaver 看,工具型 LLM agent 的记忆不只是在历史里检索相似片段,而是要保留当前行动真正依赖的早期证据、决策和执行反馈。
从 2026-05-02 的 agent memory 产品面讨论、ChatGPT Project-only memory、Claude 个性化功能和 Mem0/Cloudflare 的工程材料看,生产级记忆系统必须先定义用户、项目、任务和运行审计的边界,再谈向量库、图谱和长上下文。
从 arXiv:2604.15877 看,长期记忆、技能和规则不是三个孤立模块,而是同一条经验压缩轴上的不同粒度;真正缺失的是跨层晋升、降级和生命周期治理。
从 NousResearch/hermes-agent 的官方文档和源码看,Hermes 的记忆系统由小容量常驻记忆、SQLite/FTS5 会话检索、外部记忆提供商和技能系统组成;它和 OpenClaw 的差异不在口号,而在事实源、召回路径、晋升机制和治理边界。
从 2026-04-28 的 agentic-db 发布和 n8n Memori 社区节点看,长期记忆正在向数据库、工作流和托管平台下沉;真正要评估的是写入治理、召回路径、遗忘机制和可观测性。
系统介绍 Obsidian 的主要能力、实际使用流程、底层技术和 AI 工作流接法:Markdown vault、双向链接、Properties、Search、Canvas、Bases、CodeMirror、插件 API 与同步加密。