AIAgentMemoryAICon
Agent"记忆断片"如何破局?Memory正成为AI的新战场
收录于 2026/5/23 09:27:52
棘手的Agent"记忆断片"
Agent今年最大的坎儿不是模型智商不够,而是记忆断片。你是否也遇到过这种尴尬:在ChatGPT里刚定好的方案,换到Cursor写代码时,一切又要重头说起。
核心挑战
邓亚峰(EverMind CEO) 指出两个核心挑战:
- 作为Infra层,不同Agent的诉求差异非常大,怎么适配不同Agent的需求
- 用户用了你的Memory之后,能不能明确感知到价值
赵珏(MemVerge中国区CTO) 认为:真正麻烦的是技术定义里的Memory,和用户真实体感里的Memory之间存在很大鸿沟。用户在意的是:你到底有没有真的懂我?你有没有记住我上次说的话?
王闯闯(OPPO高级算法工程师) 从终端角度指出:终端每天面对海量碎片化信息(截图、文档等),问题在于怎么把这些碎片化、多模态的信息整理成真正有价值的结构化记忆。
独立Memory系统的必要性
数据孤岛问题
几乎所有的Agent都宣称自己有Memory,但本质还是各自为战。模型、Agent、应用都在不断变化,但用户真正希望沉淀下来的长期Memory,本质上应该是稳定存在的。
如果每个Agent都得重新理解用户,协同效率就会变得极低。所以做独立Memory系统,不是为了取代某个Agent,而是为多个Agent提供统一的上下文底座。
端云协同方案
核心是平衡四件事:效果、隐私、成本和时延。面对多模态、异构、碎片化Memory,采用端云协同方案:
- 高隐私、低时延的任务留在端侧
- 真正复杂、需要深度推理的放到云端大模型
技术底层共性
从技术底层看,各方案本质相似:数据捕捉、语义理解、结构化组织、检索召回、优先级排序、权限控制。
三类场景的额外优化:
- 聊天记忆 — 用户和不同Agent交互产生的上下文
- RAG融合 — 企业专业知识点,需要更强语义索引和权限控制
- 流程化记忆 — 记录工作流并沉淀成可复用的skill
核心观点
- 向量负责"把相关内容召回",图负责"把这些内容组织起来"
- 最终目的是让Agent拿到的是真正有组织、能支撑当前任务的上下文
- 写入不是简单归档,读取也不是简单Search,都需要Agent和Memory系统协同完成
- 未来真正能落地的记忆系统,性价比(计算成本和performance的trade-off)非常关键