运行时记忆投毒防御:证书要绑定写路径,而不是只靠检索过滤
SMSR、MemVenom 和长期记忆安全综述把 Agent 记忆安全推到可验证治理阶段:生产系统不能只做 prompt filter,而要把来源签名、随机化检索、证书复算、回滚和工具调用审计放进同一条验收链。
Tag
SMSR、MemVenom 和长期记忆安全综述把 Agent 记忆安全推到可验证治理阶段:生产系统不能只做 prompt filter,而要把来源签名、随机化检索、证书复算、回滚和工具调用审计放进同一条验收链。
arXiv:2606.06054 MemGate 把个人 Agent 的长期记忆检索定义为信任边界。工程上,记忆读路径不能只按相似度把候选片段塞进上下文,而要在检索和注入之间增加任务条件准入、来源权威、作用域隔离和工具副作用绑定。
arXiv:2606.04329 把 Agent 记忆投毒从零散案例整理成写入通道、结构性漏洞和 ASR/RSR 评测问题。工程上真正该落地的是记忆写入面的资产清单、来源权威、写后审计和跨会话回归测试。
从 arXiv:2605.24462 的 Certified Traces、AgentSecBench、Agent-BOM 和当前 Agent SDK/Bedrock 工程接口看,安全 Agent 的关键不是让模型解释得更像人,而是让每次工具调用、白盒扫描、修复和部署动作在执行前携带可检查的权限、来源、证据和回放条件。
5 月上旬的 Trojan Hippo、MAGE 和 Opal 等研究说明,长期记忆不只是个性化能力,也是跨会话攻击面、隐私泄露面和防护状态本身;生产系统必须把记忆写入、来源、工具权限和遗忘纳入同一个安全模型。