Protocol-H：构建分层Agentic RAG系统，实现自主纠错的多模态推理

🎯 核心问题：模态鸿沟（Modality Gap）

企业AI团队长期面临的难题：

"为什么欧洲业务表现不佳？"

这个问题需要同时查询：

结构化数据（SQL）：营收、利润率、员工数量
非结构化文档（向量检索）：市场报告、竞争分析、监管文件

传统RAG是线性流水线：查询 → 向量检索 + SQL → LLM → 答案。结果往往是：

缺少监管上下文的营收数据
缺乏量化校验的市场报告
30%的案例出现"静默失败"——答案表面权威，但遗漏超过20%的相关数据

🏗️ Protocol-H架构：组织层级的启示

受人类组织架构启发，Protocol-H采用Supervisor-Worker拓扑：

Supervisor（管理者）
    ↓ 分配任务
SQL Worker（数据分析师） ←→ Vector Worker（研究员）
    ↓ 汇总
Reflective Retry（纠错机制）
    ↓
最终答案

三层核心组件

组件	职责	关键技术
Supervisor	策略指挥、任务分解、结果综合	查询分析、路由决策、Worker协调
SQL Worker	结构化数据查询	Schema自省、关系识别、查询验证
Vector Worker	语义文档检索	BM25+向量混合检索、相关性过滤

🧠 Supervisor智能体：元认知编排器

核心职责

查询分析：判断需要SQL、向量检索，还是两者
任务分解：拆成原子步骤（如"先找欧洲客户 → 取工单 → 关联流失数据"）
Worker路由：基于任务状态决定下一步
结果综合：整合各方输出成连贯答案
错误管理：检测失败并触发纠错

代码示意

def supervisor_node(state: AgentState):
    # 分析对话历史和当前状态
    # 决定：需要SQL？文档搜索？还是可直接合成答案？
    decision = llm.invoke(supervisor_prompt).parse()
    return {
        "next_step": decision.next_worker,
        "reasoning": decision.reasoning
    }

🔧 SQL Worker：Schema感知查询引擎

关键技术

Schema自省

通过INFORMATION_SCHEMA自动发现表与列
识别外键约束（权威依据）
LLM启发式推断命名规范匹配

多层防护机制

置信度评分（<0.8需显式确认）
Supervisor仲裁推断关系
运行时验证（行数受限执行）
显式外键优先跳过推断

📄 Vector Worker：语义检索智能体

核心能力

混合检索：BM25关键词匹配 + 稠密向量余弦相似度 + RRF融合
相关性过滤：阈值抑制伪匹配
摘要提取：关键信息压缩

挑战处理

问题	策略
冷启动（无相关文档）	向Supervisor返回null信号，触发SQL回退
语义歧义	标记歧义，Top-N结果+相关性分数交由Supervisor仲裁
时效性需求	时间衰减因子加权（可选）

🔄 Reflective Retry：自主错误恢复

这是Protocol-H与标准Agent系统的根本差异。

传统系统的问题

错误 → 包装成答案 → 继续传播（埋雷）

Protocol-H的处理

错误 → 进入Reflective Retry → 自主纠错

示例场景：SQL语法错误时

捕获错误信息
LLM分析失败原因
生成修正方案（改写查询或换策略）
重试次数上限控制

📊 实验结果

指标	传统RAG	Protocol-H	提升
数据完整性	~70%	~97%	+27%
静默失败率	30%	<5%	-25%
多跳查询准确率	中等	高	显著

关键洞察：在"决策质量优先于速度"的企业分析场景中，这种额外开销通常是更优的权衡。

🏢 适用场景

财务分析（结构化报表 + 市场评论）
客户流失分析（客户数据 + 支持工单）
竞品研究（销售数据 + 行业报告）
监管合规（交易记录 + 政策文档）