AI应用本地化人机协同LLM工程实践

Lyft使用AI和人机协同扩展了全球范围内的本地化能力

RSS精选·2026-04-29·原文链接

收录于 2026/5/15 18:11:09

Lyft使用AI和人机协同扩展了全球范围内的本地化能力

作者： Leela Kumili | 译者： 张卫滨 | 发布时间： 2026-04-28 | 来源： InfoQ

核心要点

Lyft实现AI驱动的本地化系统，支持全球化扩张
批量翻译流水线处理约99%的用户内容，95%任务在30分钟内完成
采用大语言模型+自动评估+人工审核的混合模式
双路径架构：AI译文立即投入使用，人工审核后替换确保质量
翻译周期从数天缩短至分钟级

一、背景：从人工瓶颈到AI驱动

此前，Lyft严重依赖人工翻译流程。随着公司进入新市场且产品迭代速度加快，这一模式逐渐成为瓶颈。新系统的核心目标是：在大幅缩短交付周期的同时，保持语气、风格与法律文本的一致性。

二、技术架构：批量翻译流水线

双路径架构设计

系统采用双路径架构，源文本会同时提交至：

翻译管理系统（TMS）——进行人工监管和记录保留
基于LLM的工作模块——快速生成译稿

这种设计的优势：

AI生成译文可立即投入使用，保障版本发布不受阻
语言专家异步审核译文，通过后替换初始输出
兼顾效率与质量

Drafter与Evaluator角色分离

系统将职责划分为两个角色：

Drafter：产出多个版本的候选译文
Evaluator：从准确性、流畅度、品牌契合度等维度评判，选出最优方案或对低置信度结果发起重试

这种生成与评估解耦的设计，提升了错误检出能力并能够减少偏差。

上下文注入与约束规则

系统会注入上下文信息，包括：

UI元数据
占位符
地区差异考量

同时通过确定性约束规则，严格把控安全、法律与风格的要求。

三、实时翻译：低延迟优化流程

像行程聊天消息这样的实时翻译采用另一套专注于低延迟的架构：

批量翻译：依托更丰富的上下文信息与迭代评估
实时翻译模型：优先保证用户即时反馈

两者分工明确，针对不同场景优化。

四、人机协同的质量闭环

数据驱动的质量优化

系统持续采集以下指标：

翻译质量
模型表现
审核一致性

这些数据用于模型调优与后续翻译策略优化。

质量分布

**95%**的译文经人工审核后仅需少量修改即可上线
**5%**为复杂场景（地区习惯用语、法律声明、品牌专属用语），必须依靠人工把控

通过对结果的追踪，Lyft能够量化翻译质量、优化AI模型，并在多语言环境下维持稳定可靠的生产级译文。

五、生产实践成果

指标	数据
用户内容覆盖	约99%
任务SLA目标	95%在30分钟内
翻译周期	从数天缩短至分钟级
人工审核通过率	95%需少量修改
复杂场景比例	约5%需深度人工介入

六、关键经验

渐进式部署：支持提示词分批上线，可在小批量测试新的AI翻译策略后再全面部署
人机协同不是替代而是增强：AI负责首轮翻译减轻人工工作量，人工专注于校验和质量把关
架构分层：批量处理与实时处理采用不同架构，针对不同场景做针对性优化
数据闭环：持续采集质量指标用于模型迭代，形成正向反馈循环

结论

Lyft的本地化实践表明，AI在翻译领域的应用已经进入生产级阶段。关键在于：

设计合理的架构分层（批量vs实时）
建立人机协同的质量闭环
保持人工在关键环节的最终把控权
用数据驱动持续优化

这套模式不仅适用于本地化，也为其他AI+人工协同的业务场景提供了参考范式。