研究综述

2026/05/20 研究综述

LongMINT：Agent 记忆真正难的是抗干扰，而不是存得更久

LongMINT 把长期记忆评测推到多目标干扰、事实修订和跨片段聚合推理场景；结合 MedMemoryBench 的 memory saturation，可以看到生产 Agent 记忆的核心风险不是容量不足，而是旧事实、新事实、噪声和多任务目标互相污染。

#AI memory #agent memory #long-term memory #memory-augmented agents #memory evaluation #RAG #forgetting #personalization

2026/05/15 研究综述

LinkedIn HLTM：生产级个性化记忆为什么要先对齐业务边界

LinkedIn 的 Hierarchical Long-Term Semantic Memory 和 Cognitive Memory Agent 把 agent memory 从“多存一些聊天历史”推进到生产个性化基础设施：schema-aligned 语义树、多视图记忆、身份作用域检索、近线增量更新、可观测来源和端到端质量指标。它的启发是，企业 agent 的长期记忆首先是业务边界、隐私隔离和延迟预算问题，其次才是向量检索问题。

#AI memory #agent memory #long-term memory #personalization #RAG #memory evaluation #enterprise AI #semantic memory

2026/05/14 研究综述

LongMemEval-V2：Agent 记忆评测正在从聊天历史转向环境经验

LongMemEval-V2 把长期记忆问题从用户聊天历史推进到 web/enterprise agent 的环境经验：静态状态、动态变化、工作流、局部陷阱和前提意识。它提醒我们，生产记忆系统不能只追求 RAG 召回分数，还要证明经验能被压缩、检索、使用，并在延迟成本内帮助 agent 像资深同事一样工作。

#AI memory #agent memory #long-term memory #memory evaluation #RAG #web agents #context compression #personalization

2026/05/12 研究综述

LongMemEval 军备赛之后：AI 记忆评测需要从分数转向证据链

PlugMem、gbrain-evals、MemPalace 和 Mem0 等近期材料显示，agent memory 的公开评测正在进入高分密集区；真正重要的问题不再只是 R@5 或 accuracy，而是数据划分、调参污染、成本账本、可复现脚本和生产迁移边界。

#AI memory #agent memory #long-term memory #memory evaluation #RAG #personalization #benchmark

2026/05/07 研究综述

MemAgents 之后：AI Agent 记忆系统开始进入瓶颈诊断阶段

从 2026-05-06 的 MemAgents workshop 回顾和 ICLR/OpenReview 论文线索看，AI agent memory 的关键问题正在从“要不要长期记忆”转向写入、压缩、召回、利用和评测瓶颈的可诊断化。

#AI memory #agent memory #long-term memory #memory evaluation #context compression #RAG #personalization