Agentic AI工程化上下文工程Token优化AI运维

从 Prompt 到 Context:易点天下 Agentic AI 工程化实践

何宇航··原文链接
收录于 2026/5/15 18:11:09

从 Prompt 到 Context:易点天下 Agentic AI 工程化实践

作者: 何宇航 | 来源: 2026 QCon 北京站

易点天下分享了其将生成式 AI 从 Demo 阶段推进到企业级工程化落地的完整实践。核心是将重心从"怎么措辞(Prompt)"转向"每一步该给什么信息(Context)"。

六层上下文体系

层级名称功能描述
L1Session Memory当前会话毫秒级读写
L2Short-Term24小时跨会话窗口
L3Long-Term向量存储持久化事实
L4Knowledge Graph图数据库存储资源拓扑
L5Experience自动聚类高频故障模式
L6Skill人工验证的经验固化手册

关键技术突破

1. 主动注入机制

在三个关键节点自动注入相关上下文:

  • UserMessage 钩子:用户提问前做意图过滤与语义召回
  • PreToolUse 钩子:敏感操作前按资源ID匹配历史变更记录
  • ErrorSignal 钩子:检测到错误关键字时自动拉取历史解法

实现"需要时刚好知道",将记忆从被动资料库升级为主动副驾驶。

2. Token 预算治理

三级内容分层策略:

  • L0 Abstract:约 100 tokens 的一句话摘要
  • L1 Overview:约 300 tokens 的详细要点
  • L2 Full:完整 Markdown 全文

按相关度动态选档(score > 0.8 注入 L1,否则降级为 L0),单次注入 Token 消耗下降约 80%

3. 渐进式工具加载

初始态仅激活核心工具,长尾工具按需动态唤醒,工具调用准确率从 70% 提升至 90%

4. 五道安全防线

系统设计了五层结构化的纵深防御闸门,仅1层允许大模型参与决策,其余4层全部由严谨的规则代码进行物理兜底。

效果数据

  • 重复性问题处理时间从 60秒缩短至5秒以内,实现数量级改善
  • Token 消耗下降 80%
  • 工具调用准确率提升至 90%

原文链接:https://mp.weixin.qq.com/s/tK0rmfOYRC7SoWGggAT4lg