Tag

#personalization

2026/07/05 记忆评测

长期记忆要区分当前、历史和过渡状态

A-TMA 把 ghost memory 定义为长期记忆里的状态协调失败：旧事实、当前事实和过渡事实同时存在，但在检索和回答时被混成一类。本文拆解 bank、retrieval、QA 三层诊断，并给出一套状态感知记忆工程方案。

#AI memory #agent memory #long-term memory #memory evaluation #RAG memory #personalization #context engineering #state management

2026/07/03 记忆安全

Agent 记忆不能默认成为证据

MemSyco-Bench 把长期记忆评测从“是否取回相关记忆”推进到“取回后该不该影响当前判断”。本文拆解记忆诱导谄媚的五类任务、作者报告结果，并给出一套记忆准入与使用角色仲裁层的工程方案。

#AI memory #agent memory #memory security #memory evaluation #sycophancy #personalization #long-term memory #RAG memory

2026/06/14 论文解读

Topic Document 不是笔记格式：它是长期 Agent 记忆的维护单元

Infini Memory 把长期 Agent 记忆从孤立片段和向量召回，推进到可维护的主题文档库。工程上，Topic Document 的价值不只是可读 Markdown，而是把写入缓冲、证据聚合、事实修订、局部检索和审计元数据放进同一个维护单元。

#AI memory #agent memory #long-term memory #memory-augmented agents #RAG #context compression #memory evaluation #personalization

2026/06/11 安全分析

相似不等于可信：Agent 记忆检索需要准入门，而不只是向量召回

arXiv:2606.06054 MemGate 把个人 Agent 的长期记忆检索定义为信任边界。工程上，记忆读路径不能只按相似度把候选片段塞进上下文，而要在检索和注入之间增加任务条件准入、来源权威、作用域隔离和工具副作用绑定。

#AI memory #agent memory #long-term memory #memory security #RAG #agent security #memory evaluation #personalization

2026/06/01 研究分析

级联压缩不是长期记忆：项目知识该留在上下文里，还是合进权重里

arXiv:2605.24657 把软件开发对话里的级联压缩和 LoRA 式权重合并放到同一评测里：压缩循环会快速丢失程序性纠错和项目事实，而权重合并保留更多知识。但这不意味着所有记忆都应该写进模型，真正的问题是如何在上下文、外部记忆和可回滚适配器之间划边界。

#AI memory #agent memory #long-term memory #memory-augmented agents #context compression #personalization #LoRA #memory evaluation

2026/05/29 工程解读

记忆注入才是 Agent 长期记忆的真正瓶颈

从 SuperBrain、Claude Code hooks、claude-mem 和 Memory-R2 看，长期记忆系统的难点正在从存储迁移到工作上下文注入：什么时候取、取多少、凭什么取、如何阻止旧记忆污染当前任务。

#AI memory #agent memory #long-term memory #memory-augmented agents #context compression #memory evaluation #personalization #RAG

2026/05/28 论文解读

长期记忆的单位不是聊天：持久化 Agent 需要环境级评估

从 Persistent AI Agents in Academic Research 看，长期记忆 Agent 的评估对象不该只是单轮回答、RAG 命中率或 token 成本，而应扩展到人-代理-文件-工具-计划任务-治理规则组成的持久化环境。

#AI memory #agent memory #long-term memory #memory-augmented agents #memory evaluation #context compression #personalization #RAG

2026/05/20 研究综述

LongMINT：Agent 记忆真正难的是抗干扰，而不是存得更久

LongMINT 把长期记忆评测推到多目标干扰、事实修订和跨片段聚合推理场景；结合 MedMemoryBench 的 memory saturation，可以看到生产 Agent 记忆的核心风险不是容量不足，而是旧事实、新事实、噪声和多任务目标互相污染。

#AI memory #agent memory #long-term memory #memory-augmented agents #memory evaluation #RAG #forgetting #personalization

2026/05/15 研究综述

LinkedIn HLTM：生产级个性化记忆为什么要先对齐业务边界

LinkedIn 的 Hierarchical Long-Term Semantic Memory 和 Cognitive Memory Agent 把 agent memory 从“多存一些聊天历史”推进到生产个性化基础设施：schema-aligned 语义树、多视图记忆、身份作用域检索、近线增量更新、可观测来源和端到端质量指标。它的启发是，企业 agent 的长期记忆首先是业务边界、隐私隔离和延迟预算问题，其次才是向量检索问题。

#AI memory #agent memory #long-term memory #personalization #RAG #memory evaluation #enterprise AI #semantic memory

2026/05/14 研究综述

LongMemEval-V2：Agent 记忆评测正在从聊天历史转向环境经验

LongMemEval-V2 把长期记忆问题从用户聊天历史推进到 web/enterprise agent 的环境经验：静态状态、动态变化、工作流、局部陷阱和前提意识。它提醒我们，生产记忆系统不能只追求 RAG 召回分数，还要证明经验能被压缩、检索、使用，并在延迟成本内帮助 agent 像资深同事一样工作。

#AI memory #agent memory #long-term memory #memory evaluation #RAG #web agents #context compression #personalization

2026/05/13 工程分析

从记住到可运行：Coding Agent 记忆系统正在变成运行时可靠性问题

OpenAI Agents SDK 的 sandbox memory 文档和 AgentMemory 近期连续修复显示，coding agent 的长期记忆不再只是 RAG 或偏好存储，而是涉及文件化状态、渐进披露、隔离布局、召回正确性、部署持久化、上下文预算和观测面的运行时系统。

#AI memory #agent memory #long-term memory #coding agents #RAG #context compression #memory evaluation #personalization

2026/05/12 研究综述

LongMemEval 军备赛之后：AI 记忆评测需要从分数转向证据链

PlugMem、gbrain-evals、MemPalace 和 Mem0 等近期材料显示，agent memory 的公开评测正在进入高分密集区；真正重要的问题不再只是 R@5 或 accuracy，而是数据划分、调参污染、成本账本、可复现脚本和生产迁移边界。

#AI memory #agent memory #long-term memory #memory evaluation #RAG #personalization #benchmark

2026/05/10 安全分析

AI Agent 记忆正在变成安全边界：从 Trojan Hippo 到影子记忆

5 月上旬的 Trojan Hippo、MAGE 和 Opal 等研究说明，长期记忆不只是个性化能力，也是跨会话攻击面、隐私泄露面和防护状态本身；生产系统必须把记忆写入、来源、工具权限和遗忘纳入同一个安全模型。

#AI memory #agent memory #long-term memory #memory security #prompt injection #personalization #memory evaluation #privacy

2026/05/09 工程分析

数据库正在收编 Agent 记忆层：从 LangGraph.js + MongoDB 看长期记忆的工程边界

MongoDB 在 2026-05-08 为 LangGraph.js 长期记忆发布一等支持，意味着短期 checkpoint、长期 store、语义检索和自动 embedding 正在进入应用数据库；但这解决的是运行时和存储边界，不等于解决记忆写入、作用域、遗忘和个性化误用。

#AI memory #agent memory #long-term memory #LangGraph #MongoDB #RAG #memory evaluation #personalization

2026/05/07 研究综述

MemAgents 之后：AI Agent 记忆系统开始进入瓶颈诊断阶段

从 2026-05-06 的 MemAgents workshop 回顾和 ICLR/OpenReview 论文线索看，AI agent memory 的关键问题正在从“要不要长期记忆”转向写入、压缩、召回、利用和评测瓶颈的可诊断化。

#AI memory #agent memory #long-term memory #memory evaluation #context compression #RAG #personalization

2026/05/05 论文解读

记忆稀释：AI Agent 的长期记忆为什么仍然会遗忘

从 arXiv:2604.27003 和 elfmem 看，外部记忆并不会自动解决持续学习；它只是把灾难性遗忘从参数更新搬到检索、表示、评分衰减和经验复用策略里。

#AI memory #agent memory #long-term memory #continual learning #memory evaluation #forgetting #personalization

2026/05/02 架构优化

记忆作用域合约：AI Agent 长期记忆真正难的是边界，不是存储

从 2026-05-02 的 agent memory 产品面讨论、ChatGPT Project-only memory、Claude 个性化功能和 Mem0/Cloudflare 的工程材料看，生产级记忆系统必须先定义用户、项目、任务和运行审计的边界，再谈向量库、图谱和长上下文。

#AI memory #agent memory #long-term memory #personalization #memory evaluation #forgetting #RAG