Tag

#context compression

2026/07/02 工程架构

长程 Agent 的上下文压缩应该可逆

ACE 把长程 Agent 的上下文管理从一次性截断/摘要推进到可逆编排：原始轨迹和压缩抽象分层保存，每一步按当前任务状态把历史步骤渲染成 raw、abstract 或 drop。本文拆解它对生产 Agent memory runtime 的工程启发、数据模型、失败模式和验证方案。

#AI memory #agent memory #context compression #context orchestration #long-horizon agents #memory evaluation #ReAct #agent runtime

2026/06/26 系统架构

Agent 原生记忆系统需要四模块控制面

arXiv:2606.24775 和 MemoryData 把长期记忆从单一检索模块拆成表示存储、抽取、检索路由和维护四层。工程上真正该落地的不是再换一个向量库，而是给每层建立变更门禁、回放评测、成本账本和失效回滚。

#AI memory #agent memory #long-term memory #memory evaluation #memory-augmented agents #context compression #MemoryData #agent-native memory

2026/06/18 评测方法

Agent Memory 评测不能只看答对率

MemGym 把长期记忆评测从多轮聊天扩展到检索、代码、Web 导航和工具对话；2606.06448 则提醒我们，记忆系统还要按 construction、retrieval、generation 的生命周期成本评估。本文给出一套 memory-isolated scoring 与 lifecycle profiling 结合的工程评测协议。

#AI memory #agent memory #memory evaluation #long-horizon agents #context compression #MemGym #MemRM #lifecycle profiling

2026/06/17 工程架构

长程 Agent 的上下文压缩，不能破坏 prompt cache

TokenPilot 在 2026-06-15 提出一个很实用的工程提醒：长程 Agent 不能只按 token 数做上下文压缩，还要保护 prompt/KV cache 的前缀连续性。本文拆解 cache-aware context management 的机制、数据结构、上线方案、失败模式和可验证指标。

#AI memory #agent memory #context compression #prompt cache #KV cache #long-horizon agents #memory evaluation #cost optimization

2026/06/14 论文解读

Topic Document 不是笔记格式：它是长期 Agent 记忆的维护单元

Infini Memory 把长期 Agent 记忆从孤立片段和向量召回，推进到可维护的主题文档库。工程上，Topic Document 的价值不只是可读 Markdown，而是把写入缓冲、证据聚合、事实修订、局部检索和审计元数据放进同一个维护单元。

#AI memory #agent memory #long-term memory #memory-augmented agents #RAG #context compression #memory evaluation #personalization

2026/06/07 研究分析

记忆摘要要有中间监督：从 MMPO 看长程 Agent 的记忆策略优化

arXiv:2605.30159 提出用 Belief Entropy 给长程 Agent 的递归记忆摘要做中间奖励：问题不只是摘要能否变短，而是每一步摘要后，Agent 对任务状态、缺口信息和后续动作的信念是否更清楚。

#AI memory #agent memory #long-term memory #memory-augmented agents #context compression #memory evaluation #RAG #reinforcement learning

2026/06/01 研究分析

级联压缩不是长期记忆：项目知识该留在上下文里，还是合进权重里

arXiv:2605.24657 把软件开发对话里的级联压缩和 LoRA 式权重合并放到同一评测里：压缩循环会快速丢失程序性纠错和项目事实，而权重合并保留更多知识。但这不意味着所有记忆都应该写进模型，真正的问题是如何在上下文、外部记忆和可回滚适配器之间划边界。

#AI memory #agent memory #long-term memory #memory-augmented agents #context compression #personalization #LoRA #memory evaluation

2026/05/29 工程解读

记忆注入才是 Agent 长期记忆的真正瓶颈

从 SuperBrain、Claude Code hooks、claude-mem 和 Memory-R2 看，长期记忆系统的难点正在从存储迁移到工作上下文注入：什么时候取、取多少、凭什么取、如何阻止旧记忆污染当前任务。

#AI memory #agent memory #long-term memory #memory-augmented agents #context compression #memory evaluation #personalization #RAG

2026/05/28 论文解读

长期记忆的单位不是聊天：持久化 Agent 需要环境级评估

从 Persistent AI Agents in Academic Research 看，长期记忆 Agent 的评估对象不该只是单轮回答、RAG 命中率或 token 成本，而应扩展到人-代理-文件-工具-计划任务-治理规则组成的持久化环境。

#AI memory #agent memory #long-term memory #memory-augmented agents #memory evaluation #context compression #personalization #RAG

2026/05/21 论文解读

记忆合并不是后台清理：Agent 长期记忆的高风险写路径

从 Useful Memories Become Faulty When Continuously Updated by LLMs 看，自动把成功轨迹持续压缩成文字经验，可能让 Agent 从有用记忆退化到错误记忆；长期记忆系统需要把 consolidation 当成可验证、可回滚、可门控的写操作，而不是无条件后台任务。

#AI memory #agent memory #long-term memory #memory-augmented agents #context compression #forgetting #memory evaluation #RAG

2026/05/18 论文解读

ZipAct：Agent 记忆不一定要回放历史，也可以维护状态

TMLR 2026-05-17 接收的 ZipAct 把 agent 的交互历史压缩成 Goal、World、Constraint 三类结构化状态，让动作生成只看当前状态表和最新观察。它提醒我们，长任务记忆的关键不只是存储更多历史，而是把可执行状态、负反馈和约束持续更新到一个可验证的工作记忆里。

#AI memory #agent memory #context compression #memory-augmented agents #memory evaluation #RAG #forgetting

2026/05/14 研究综述

LongMemEval-V2：Agent 记忆评测正在从聊天历史转向环境经验

LongMemEval-V2 把长期记忆问题从用户聊天历史推进到 web/enterprise agent 的环境经验：静态状态、动态变化、工作流、局部陷阱和前提意识。它提醒我们，生产记忆系统不能只追求 RAG 召回分数，还要证明经验能被压缩、检索、使用，并在延迟成本内帮助 agent 像资深同事一样工作。

#AI memory #agent memory #long-term memory #memory evaluation #RAG #web agents #context compression #personalization

2026/05/13 工程分析