AICloudflareAgent记忆系统大模型

Cloudflare 推出 Agent Memory：面向 AI 智能体的持久记忆托管服务

InfoQ·2026-05-10·原文链接

收录于 2026/5/15 18:11:09

Cloudflare 推出 Agent Memory：面向 AI 智能体的持久记忆托管服务

作者： Steef-Jan Wiggers | 来源： InfoQ | 日期： 2026-05-09

核心要点

Cloudflare 推出 Agent Memory 私人测试版，为 AI 智能体提供持久记忆托管服务
解决上下文衰减问题：突破百万级词元窗口限制，提取结构化记忆按需检索
记忆分为四类：事实、事件、指令、任务，支持团队共享记忆档案
行业判断：记忆越来越不像模型特性，更像基础设施

背景：上下文衰减问题

即便大模型上下文窗口已突破百万级词元，研究表明随着上下文被填满，模型输出质量会下降。开发者面临两难：

保留全部信息 → 输出质量下滑
精简内容 → 丢失关键信息

结论：模型在上下文更少但更相关时，生成质量反而更好。

Agent Memory 技术架构

数据摄入端

处理环节	实现方式
消息标识	SHA-256 内容寻址，实现幂等摄入
分块处理	宽泛通道：10K字符分块 + 细节通道：数值信息提取
验证分类	8项校验后将记忆分为：事实、事件、指令、任务

检索端

六通道并行检索 + 倒数排名融合（RRF）：

全文搜索
精确事实键查找
原始消息搜索
向量搜索
HyDE 向量搜索（声明式答案补偿词汇不匹配）

模型使用

阶段	模型	说明
信息提取与分类	Llama 4 Scout (17B MoE)	默认使用
内容合成	Nemotron 3 (120B MoE)	仅在合成阶段使用

共享记忆：突破单智能体局限

关键创新：记忆档案可团队共享

工程师编码智能体学到的规范、架构决策、隐性知识可全员共享
Cloudflare 内部案例：代码审查智能体学会对已标记且保留的模式自动静默

行业对比

产品	特点
Mem0	托管云 API，支持向量/图谱/KV存储
Zep Graphiti	时序知识图谱，追踪事实有效时间
LangMem	与 LangGraph 集成，需自部署
Letta (原 MemGPT)	分层记忆架构，智能体自主管控上下文
Cloudflare Agent Memory	边缘分布式、与 Workers 深度集成、多通道检索

注意事项

评测者 Kristopher Dunham 指出：

供应商锁定：可导出原始事实，但检索流程不可移植
提取质量：取决于次级模型，建议对关键事实主动调用 remember 工具
最佳实践：对话历史与习得事实架构分离，上下文窗口达60%时触发压缩

结语

Cartesian 首席架构师 Eran Stiller 评价：

当一个智能体需要用到记忆的那一刻，你面对的就不再是聊天问题，而是架构问题。记忆越来越不像是模型的特性，更像是基础设施。

Agent Memory 目前处于私人测试阶段，定价未公布。开发者可加入等待列表。