AICloudflareAgent记忆系统大模型

Cloudflare 推出 Agent Memory:面向 AI 智能体的持久记忆托管服务

InfoQ··原文链接
收录于 2026/5/15 18:11:09

Cloudflare 推出 Agent Memory:面向 AI 智能体的持久记忆托管服务

作者: Steef-Jan Wiggers | 来源: InfoQ | 日期: 2026-05-09


核心要点

  • Cloudflare 推出 Agent Memory 私人测试版,为 AI 智能体提供持久记忆托管服务
  • 解决上下文衰减问题:突破百万级词元窗口限制,提取结构化记忆按需检索
  • 记忆分为四类:事实、事件、指令、任务,支持团队共享记忆档案
  • 行业判断:记忆越来越不像模型特性,更像基础设施

背景:上下文衰减问题

即便大模型上下文窗口已突破百万级词元,研究表明随着上下文被填满,模型输出质量会下降。开发者面临两难:

  • 保留全部信息 → 输出质量下滑
  • 精简内容 → 丢失关键信息

结论:模型在上下文更少但更相关时,生成质量反而更好。


Agent Memory 技术架构

数据摄入端

处理环节实现方式
消息标识SHA-256 内容寻址,实现幂等摄入
分块处理宽泛通道:10K字符分块 + 细节通道:数值信息提取
验证分类8项校验后将记忆分为:事实、事件、指令、任务

检索端

六通道并行检索 + 倒数排名融合(RRF):

  1. 全文搜索
  2. 精确事实键查找
  3. 原始消息搜索
  4. 向量搜索
  5. HyDE 向量搜索(声明式答案补偿词汇不匹配)

模型使用

阶段模型说明
信息提取与分类Llama 4 Scout (17B MoE)默认使用
内容合成Nemotron 3 (120B MoE)仅在合成阶段使用

共享记忆:突破单智能体局限

关键创新:记忆档案可团队共享

  • 工程师编码智能体学到的规范、架构决策、隐性知识可全员共享
  • Cloudflare 内部案例:代码审查智能体学会对已标记且保留的模式自动静默

行业对比

产品特点
Mem0托管云 API,支持向量/图谱/KV存储
Zep Graphiti时序知识图谱,追踪事实有效时间
LangMem与 LangGraph 集成,需自部署
Letta (原 MemGPT)分层记忆架构,智能体自主管控上下文
Cloudflare Agent Memory边缘分布式、与 Workers 深度集成、多通道检索

注意事项

评测者 Kristopher Dunham 指出:

  1. 供应商锁定:可导出原始事实,但检索流程不可移植
  2. 提取质量:取决于次级模型,建议对关键事实主动调用 remember 工具
  3. 最佳实践:对话历史与习得事实架构分离,上下文窗口达60%时触发压缩

结语

Cartesian 首席架构师 Eran Stiller 评价:

当一个智能体需要用到记忆的那一刻,你面对的就不再是聊天问题,而是架构问题。记忆越来越不像是模型的特性,更像是基础设施。

Agent Memory 目前处于私人测试阶段,定价未公布。开发者可加入等待列表。