AI应用本地化人机协同LLM工程实践
Lyft使用AI和人机协同扩展了全球范围内的本地化能力
收录于 2026/5/15 18:11:09
Lyft使用AI和人机协同扩展了全球范围内的本地化能力
作者: Leela Kumili | 译者: 张卫滨 | 发布时间: 2026-04-28 | 来源: InfoQ
核心要点
- Lyft实现AI驱动的本地化系统,支持全球化扩张
- 批量翻译流水线处理约99%的用户内容,95%任务在30分钟内完成
- 采用大语言模型+自动评估+人工审核的混合模式
- 双路径架构:AI译文立即投入使用,人工审核后替换确保质量
- 翻译周期从数天缩短至分钟级
一、背景:从人工瓶颈到AI驱动
此前,Lyft严重依赖人工翻译流程。随着公司进入新市场且产品迭代速度加快,这一模式逐渐成为瓶颈。新系统的核心目标是:在大幅缩短交付周期的同时,保持语气、风格与法律文本的一致性。
二、技术架构:批量翻译流水线
双路径架构设计
系统采用双路径架构,源文本会同时提交至:
- 翻译管理系统(TMS)——进行人工监管和记录保留
- 基于LLM的工作模块——快速生成译稿
这种设计的优势:
- AI生成译文可立即投入使用,保障版本发布不受阻
- 语言专家异步审核译文,通过后替换初始输出
- 兼顾效率与质量
Drafter与Evaluator角色分离
系统将职责划分为两个角色:
- Drafter:产出多个版本的候选译文
- Evaluator:从准确性、流畅度、品牌契合度等维度评判,选出最优方案或对低置信度结果发起重试
这种生成与评估解耦的设计,提升了错误检出能力并能够减少偏差。
上下文注入与约束规则
系统会注入上下文信息,包括:
- UI元数据
- 占位符
- 地区差异考量
同时通过确定性约束规则,严格把控安全、法律与风格的要求。
三、实时翻译:低延迟优化流程
像行程聊天消息这样的实时翻译采用另一套专注于低延迟的架构:
- 批量翻译:依托更丰富的上下文信息与迭代评估
- 实时翻译模型:优先保证用户即时反馈
两者分工明确,针对不同场景优化。
四、人机协同的质量闭环
数据驱动的质量优化
系统持续采集以下指标:
- 翻译质量
- 模型表现
- 审核一致性
这些数据用于模型调优与后续翻译策略优化。
质量分布
- **95%**的译文经人工审核后仅需少量修改即可上线
- **5%**为复杂场景(地区习惯用语、法律声明、品牌专属用语),必须依靠人工把控
通过对结果的追踪,Lyft能够量化翻译质量、优化AI模型,并在多语言环境下维持稳定可靠的生产级译文。
五、生产实践成果
| 指标 | 数据 |
|---|---|
| 用户内容覆盖 | 约99% |
| 任务SLA目标 | 95%在30分钟内 |
| 翻译周期 | 从数天缩短至分钟级 |
| 人工审核通过率 | 95%需少量修改 |
| 复杂场景比例 | 约5%需深度人工介入 |
六、关键经验
-
渐进式部署:支持提示词分批上线,可在小批量测试新的AI翻译策略后再全面部署
-
人机协同不是替代而是增强:AI负责首轮翻译减轻人工工作量,人工专注于校验和质量把关
-
架构分层:批量处理与实时处理采用不同架构,针对不同场景做针对性优化
-
数据闭环:持续采集质量指标用于模型迭代,形成正向反馈循环
结论
Lyft的本地化实践表明,AI在翻译领域的应用已经进入生产级阶段。关键在于:
- 设计合理的架构分层(批量vs实时)
- 建立人机协同的质量闭环
- 保持人工在关键环节的最终把控权
- 用数据驱动持续优化
这套模式不仅适用于本地化,也为其他AI+人工协同的业务场景提供了参考范式。