Tag

#RAG

论文解读

Topic Document 不是笔记格式:它是长期 Agent 记忆的维护单元

Infini Memory 把长期 Agent 记忆从孤立片段和向量召回,推进到可维护的主题文档库。工程上,Topic Document 的价值不只是可读 Markdown,而是把写入缓冲、证据聚合、事实修订、局部检索和审计元数据放进同一个维护单元。

安全分析

相似不等于可信:Agent 记忆检索需要准入门,而不只是向量召回

arXiv:2606.06054 MemGate 把个人 Agent 的长期记忆检索定义为信任边界。工程上,记忆读路径不能只按相似度把候选片段塞进上下文,而要在检索和注入之间增加任务条件准入、来源权威、作用域隔离和工具副作用绑定。

工程架构

AgentIR:长期记忆检索需要控制面,而不是固定 RAG 管线

从 arXiv:2605.25092 AgentIR 看,长期对话记忆的读路径不是普通向量检索:索引会持续增长,查询类型会在会话内漂移,dense 通道并不总值得运行。生产 Agent 记忆层应该把检索策略、时间分区、延迟预算、来源治理和写入状态分开设计。

论文解读

记忆合并不是后台清理:Agent 长期记忆的高风险写路径

从 Useful Memories Become Faulty When Continuously Updated by LLMs 看,自动把成功轨迹持续压缩成文字经验,可能让 Agent 从有用记忆退化到错误记忆;长期记忆系统需要把 consolidation 当成可验证、可回滚、可门控的写操作,而不是无条件后台任务。

论文解读

ZipAct:Agent 记忆不一定要回放历史,也可以维护状态

TMLR 2026-05-17 接收的 ZipAct 把 agent 的交互历史压缩成 Goal、World、Constraint 三类结构化状态,让动作生成只看当前状态表和最新观察。它提醒我们,长任务记忆的关键不只是存储更多历史,而是把可执行状态、负反馈和约束持续更新到一个可验证的工作记忆里。

研究综述

LinkedIn HLTM:生产级个性化记忆为什么要先对齐业务边界

LinkedIn 的 Hierarchical Long-Term Semantic Memory 和 Cognitive Memory Agent 把 agent memory 从“多存一些聊天历史”推进到生产个性化基础设施:schema-aligned 语义树、多视图记忆、身份作用域检索、近线增量更新、可观测来源和端到端质量指标。它的启发是,企业 agent 的长期记忆首先是业务边界、隐私隔离和延迟预算问题,其次才是向量检索问题。

研究综述

LongMemEval-V2:Agent 记忆评测正在从聊天历史转向环境经验

LongMemEval-V2 把长期记忆问题从用户聊天历史推进到 web/enterprise agent 的环境经验:静态状态、动态变化、工作流、局部陷阱和前提意识。它提醒我们,生产记忆系统不能只追求 RAG 召回分数,还要证明经验能被压缩、检索、使用,并在延迟成本内帮助 agent 像资深同事一样工作。

工程分析

从记住到可运行:Coding Agent 记忆系统正在变成运行时可靠性问题

OpenAI Agents SDK 的 sandbox memory 文档和 AgentMemory 近期连续修复显示,coding agent 的长期记忆不再只是 RAG 或偏好存储,而是涉及文件化状态、渐进披露、隔离布局、召回正确性、部署持久化、上下文预算和观测面的运行时系统。

工程分析

数据库正在收编 Agent 记忆层:从 LangGraph.js + MongoDB 看长期记忆的工程边界

MongoDB 在 2026-05-08 为 LangGraph.js 长期记忆发布一等支持,意味着短期 checkpoint、长期 store、语义检索和自动 embedding 正在进入应用数据库;但这解决的是运行时和存储边界,不等于解决记忆写入、作用域、遗忘和个性化误用。