AI智能体技术债工程实践MCP软件开发

智能体工程的隐形技术债:10分钟造出一个Agent,公司却要为它养一个平台团队

Zohar Einy··原文链接

智能体工程的隐形技术债

作者: Zohar Einy | 译者: 平川 | 发布时间: 2026-04-26


核心观点

  • 构建智能体只需几分钟,但在生产环境中维护需要庞大的基础设施支持
  • 智能体工程系统特别擅长积累技术债务
  • 智能体代码只占系统最小的一部分,周边基础设施才是真正复杂的
  • 2015年谷歌的"机器学习系统中的隐性技术债务"论文对智能体同样适用

传统ML vs 智能体工程

2015年,谷歌发表了"机器学习系统中的隐性技术债务",其中那张著名的图片:一个标有"ML Code"的小方框,被庞大的基础设施模块所包围。

对于智能体,我们看到了相同的模式。智能体只是画面的一小部分,周围的基础设施才是真正复杂的。


智能体工程的七大基础设施模块

1. 集成(Integration)

智能体需要连接到实际系统:CI/CD、云提供商、事件工具、可观测性平台、代码库、密钥管理器等。

技术债务陷阱:

  • 30个团队、200名工程师,每个团队都自己生成凭据
  • 每个集成点都有单独配置、单独调试、各自有效时间表
  • GitLab API升级时,每个团队独立调试相同问题

MCP的局限性: MCP为智能体提供了标准的工具调用方式,但它并不管理

  • 调用的凭证
  • 返回数据的范围
  • 当API变化时的处理

2. 上下文湖(Context Lake)

智能体的好坏取决于它们可引用的上下文。需要两种上下文:

运行时上下文:

  • 服务信息、所有权、最近部署内容
  • 不断变化:服务所有权转移、依赖项添加、配置值更新

决策痕迹:

  • 之前做过的事情(人类或智能体完成)
  • 为什么做出决策,以及之后发生了什么

技术债务陷阱:

  • 上下文陈旧过时、支离破碎且无人负责
  • 智能体重复人类/其他智能体已解决的错误
  • 公司标准存在于维基中,智能体基于agents.md文件运行

3. 智能体注册表(Agent Registry)

问题:组织结构图在动态变化。现在不只是人,还有5-10倍数量的智能体

典型模式:

  • 工程师A构建了分诊智能体 → 团队使用
  • 工程师B不知道A的存在 → 构建自己的版本
  • 工程师C也构建类似的东西 → 但连接不同工具、有不同权限

技术债务陷阱:

  • 责任重叠、行为冲突、依赖项不可见
  • 智能体不可见,团队创建重复智能体
  • CISO要求智能体审计时,没有一个列表可以入手

4. 向智能体传达指令

工程师们独立为智能体创建技能文件,但分散在不同存储库中时:

  • 团队创建重复或不准确的技能
  • 与平台分发的上下文相矛盾

需要传递的信息层次:

  • 公司范围标准(安全编码、提交规范)
  • 存储库特定指令\n- 团队级规则

5. 智能体创建

平台团队的责任:

  • 智能体应有标准化的属性
  • 应与公司其他实体建立连接

技术债务陷阱:

  • 没有生命周期状态
  • 没有所有者
  • 没有与操作服务的连接
  • 六个月后在生产环境运行,使用过期Token,找不到构建者

6. 度量(Metrics)

不同角色关心的度量不同:

角色关心问题度量类型
SRE智能体做了什么可观测性
ML工程师/产品经理变好了还是变糟了评估
工程VP是否值得花钱业务影响
最终用户是否根据反馈学习用户满意度

评估难点: 标准软件可以编写单元测试,判断确切字符串输出。智能体工程中,每个响应都不同,需要不同方法。

技术债务陷阱:

  • 更改未经测试发布
  • 输出质量悄无声息降低
  • 用Opus替换Sonnet,PR审查智能体开始批准以前标记过的东西

7. 人机回环(Human-in-the-loop)

复杂场景需要人类介入:

  • 高影响决策
  • 模糊场景
  • 合规要求

解决建议

  1. 集中管理集成,而非每个团队独立配置
  2. 建立上下文管理器,统一处理运行时上下文
  3. 创建智能体注册表,确保可见性和标准化
  4. 实施智能体模板,确保每个智能体具备基本要素
  5. 建立评估体系,跟踪智能体质量变化

结论

构建智能体很容易。但在生产环境中,智能体代码只占系统最小的一部分。周边的一切——集成、上下文、注册表、度量、治理——才是真正复杂的。

几乎每个员工每天都在创建新的智能体。很快,你拥有的智能体将比员工还多。如果没有适当的基础设施和管理,技术债务将快速积累。


原文来源:InfoQ | 原文:THENEWSTACK | 汇总时间:2026-04-27