Agentic AI工程化上下文工程Token优化AI运维
从 Prompt 到 Context:易点天下 Agentic AI 工程化实践
收录于 2026/5/15 18:11:09
从 Prompt 到 Context:易点天下 Agentic AI 工程化实践
作者: 何宇航 | 来源: 2026 QCon 北京站
易点天下分享了其将生成式 AI 从 Demo 阶段推进到企业级工程化落地的完整实践。核心是将重心从"怎么措辞(Prompt)"转向"每一步该给什么信息(Context)"。
六层上下文体系
| 层级 | 名称 | 功能描述 |
|---|---|---|
| L1 | Session Memory | 当前会话毫秒级读写 |
| L2 | Short-Term | 24小时跨会话窗口 |
| L3 | Long-Term | 向量存储持久化事实 |
| L4 | Knowledge Graph | 图数据库存储资源拓扑 |
| L5 | Experience | 自动聚类高频故障模式 |
| L6 | Skill | 人工验证的经验固化手册 |
关键技术突破
1. 主动注入机制
在三个关键节点自动注入相关上下文:
- UserMessage 钩子:用户提问前做意图过滤与语义召回
- PreToolUse 钩子:敏感操作前按资源ID匹配历史变更记录
- ErrorSignal 钩子:检测到错误关键字时自动拉取历史解法
实现"需要时刚好知道",将记忆从被动资料库升级为主动副驾驶。
2. Token 预算治理
三级内容分层策略:
- L0 Abstract:约 100 tokens 的一句话摘要
- L1 Overview:约 300 tokens 的详细要点
- L2 Full:完整 Markdown 全文
按相关度动态选档(score > 0.8 注入 L1,否则降级为 L0),单次注入 Token 消耗下降约 80%。
3. 渐进式工具加载
初始态仅激活核心工具,长尾工具按需动态唤醒,工具调用准确率从 70% 提升至 90%。
4. 五道安全防线
系统设计了五层结构化的纵深防御闸门,仅1层允许大模型参与决策,其余4层全部由严谨的规则代码进行物理兜底。
效果数据
- 重复性问题处理时间从 60秒缩短至5秒以内,实现数量级改善
- Token 消耗下降 80%
- 工具调用准确率提升至 90%