AIMulti-AgentEngineeringLangGraph

大规模工程支撑场景下的多智能体系统设计:Grab 实践案例

InfoQ··原文链接
收录于 2026/5/26 09:35:13

Grab 分析数据仓库(ADW)平台服务超一千名内部用户,管理着 15000 多张数据表。随着使用量增长,工程团队发现大量运维精力被重复性支持任务和临时问题排查所消耗,挤占了平台优化迭代与系统架构设计的工作时间。

解决方案

团队搭建了一套多智能体架构,采用 LangGraph 工作流引擎 + FastAPI 服务,协调各智能体之间的路由、工具执行和状态管理。请求首先被分类,然后路由至负责上下文检索、代码搜索或解决方案生成的专门智能体。每个智能体的职责受到严格约束,以减少判定偏差,提升输出结果的稳定性。

架构设计

  • 两大工作流:调查工作流(问题诊断:查询分析、日志检索、数据表结构查询、问题整理汇总)与增强工作流(生成可执行输出:代码变更、SQL修复、待审核的自动合并请求)
  • 工具整合:从最初的 30 多个内部工具精简为一个工具集合,提升可维护性,降低智能体选择工具时的不确定性
  • Supervisor 控制模式:控制通信流和任务委派

安全与治理

  • SQL 执行由验证层进行约束
  • 敏感数据处理流程包含检测和缓解暴露风险的机制
  • 所有产生代码变更的增强工作流在部署前均需经过人工审核

技术挑战

上下文管理是重要挑战。系统通过结构化上下文压缩与选择性检索策略解决多步智能体推理中的状态保持与词元限制问题。

效果

每月可节省数百个工程师工时,有效释放核心工程人力,推动团队从被动应急处理的"救火"模式转向深耕高价值的系统构建工作。


来源:InfoQ 翻译自 https://www.infoq.com/news/2026/05/grab-multi-agent-support-system/