AIAgentMemoryAICon

Agent"记忆断片"如何破局?Memory正成为AI的新战场

AICon··原文链接
收录于 2026/5/23 09:27:52

棘手的Agent"记忆断片"

Agent今年最大的坎儿不是模型智商不够,而是记忆断片。你是否也遇到过这种尴尬:在ChatGPT里刚定好的方案,换到Cursor写代码时,一切又要重头说起。

核心挑战

邓亚峰(EverMind CEO) 指出两个核心挑战:

  1. 作为Infra层,不同Agent的诉求差异非常大,怎么适配不同Agent的需求
  2. 用户用了你的Memory之后,能不能明确感知到价值

赵珏(MemVerge中国区CTO) 认为:真正麻烦的是技术定义里的Memory,和用户真实体感里的Memory之间存在很大鸿沟。用户在意的是:你到底有没有真的懂我?你有没有记住我上次说的话?

王闯闯(OPPO高级算法工程师) 从终端角度指出:终端每天面对海量碎片化信息(截图、文档等),问题在于怎么把这些碎片化、多模态的信息整理成真正有价值的结构化记忆。

独立Memory系统的必要性

数据孤岛问题

几乎所有的Agent都宣称自己有Memory,但本质还是各自为战。模型、Agent、应用都在不断变化,但用户真正希望沉淀下来的长期Memory,本质上应该是稳定存在的。

如果每个Agent都得重新理解用户,协同效率就会变得极低。所以做独立Memory系统,不是为了取代某个Agent,而是为多个Agent提供统一的上下文底座。

端云协同方案

核心是平衡四件事:效果、隐私、成本和时延。面对多模态、异构、碎片化Memory,采用端云协同方案:

  • 高隐私、低时延的任务留在端侧
  • 真正复杂、需要深度推理的放到云端大模型

技术底层共性

从技术底层看,各方案本质相似:数据捕捉、语义理解、结构化组织、检索召回、优先级排序、权限控制。

三类场景的额外优化:

  1. 聊天记忆 — 用户和不同Agent交互产生的上下文
  2. RAG融合 — 企业专业知识点,需要更强语义索引和权限控制
  3. 流程化记忆 — 记录工作流并沉淀成可复用的skill

核心观点

  • 向量负责"把相关内容召回",图负责"把这些内容组织起来"
  • 最终目的是让Agent拿到的是真正有组织、能支撑当前任务的上下文
  • 写入不是简单归档,读取也不是简单Search,都需要Agent和Memory系统协同完成
  • 未来真正能落地的记忆系统,性价比(计算成本和performance的trade-off)非常关键