AI应用本地化人机协同LLM工程实践

Lyft使用AI和人机协同扩展了全球范围内的本地化能力

RSS精选··原文链接
收录于 2026/5/15 18:11:09

Lyft使用AI和人机协同扩展了全球范围内的本地化能力

作者: Leela Kumili | 译者: 张卫滨 | 发布时间: 2026-04-28 | 来源: InfoQ


核心要点

  • Lyft实现AI驱动的本地化系统,支持全球化扩张
  • 批量翻译流水线处理约99%的用户内容,95%任务在30分钟内完成
  • 采用大语言模型+自动评估+人工审核的混合模式
  • 双路径架构:AI译文立即投入使用,人工审核后替换确保质量
  • 翻译周期从数天缩短至分钟级

一、背景:从人工瓶颈到AI驱动

此前,Lyft严重依赖人工翻译流程。随着公司进入新市场且产品迭代速度加快,这一模式逐渐成为瓶颈。新系统的核心目标是:在大幅缩短交付周期的同时,保持语气、风格与法律文本的一致性


二、技术架构:批量翻译流水线

双路径架构设计

系统采用双路径架构,源文本会同时提交至:

  1. 翻译管理系统(TMS)——进行人工监管和记录保留
  2. 基于LLM的工作模块——快速生成译稿

这种设计的优势:

  • AI生成译文可立即投入使用,保障版本发布不受阻
  • 语言专家异步审核译文,通过后替换初始输出
  • 兼顾效率与质量

Drafter与Evaluator角色分离

系统将职责划分为两个角色:

  • Drafter:产出多个版本的候选译文
  • Evaluator:从准确性、流畅度、品牌契合度等维度评判,选出最优方案或对低置信度结果发起重试

这种生成与评估解耦的设计,提升了错误检出能力并能够减少偏差。

上下文注入与约束规则

系统会注入上下文信息,包括:

  • UI元数据
  • 占位符
  • 地区差异考量

同时通过确定性约束规则,严格把控安全、法律与风格的要求。


三、实时翻译:低延迟优化流程

像行程聊天消息这样的实时翻译采用另一套专注于低延迟的架构:

  • 批量翻译:依托更丰富的上下文信息与迭代评估
  • 实时翻译模型:优先保证用户即时反馈

两者分工明确,针对不同场景优化。


四、人机协同的质量闭环

数据驱动的质量优化

系统持续采集以下指标:

  • 翻译质量
  • 模型表现
  • 审核一致性

这些数据用于模型调优与后续翻译策略优化。

质量分布

  • **95%**的译文经人工审核后仅需少量修改即可上线
  • **5%**为复杂场景(地区习惯用语、法律声明、品牌专属用语),必须依靠人工把控

通过对结果的追踪,Lyft能够量化翻译质量、优化AI模型,并在多语言环境下维持稳定可靠的生产级译文。


五、生产实践成果

指标数据
用户内容覆盖约99%
任务SLA目标95%在30分钟内
翻译周期从数天缩短至分钟级
人工审核通过率95%需少量修改
复杂场景比例约5%需深度人工介入

六、关键经验

  1. 渐进式部署:支持提示词分批上线,可在小批量测试新的AI翻译策略后再全面部署

  2. 人机协同不是替代而是增强:AI负责首轮翻译减轻人工工作量,人工专注于校验和质量把关

  3. 架构分层:批量处理与实时处理采用不同架构,针对不同场景做针对性优化

  4. 数据闭环:持续采集质量指标用于模型迭代,形成正向反馈循环


结论

Lyft的本地化实践表明,AI在翻译领域的应用已经进入生产级阶段。关键在于:

  • 设计合理的架构分层(批量vs实时)
  • 建立人机协同的质量闭环
  • 保持人工在关键环节的最终把控权
  • 用数据驱动持续优化

这套模式不仅适用于本地化,也为其他AI+人工协同的业务场景提供了参考范式。