AI工程文化管理Meta

Meta 几周内毁掉二十年工程文化,给所有"AI 优先"公司上了一课

Gergely Orosz(InfoQ 译者:明知山)··原文链接
收录于 2026/6/21 22:27:17

一句话总结

为了追赶大模型风口,扎克伯格把"Scale AI 那套数据工厂"作为剧本搬进 Meta,绕过工程师自治、把研发部门改造成数据标注流水线。短期换来 Token 燃烧曲线,长期烧掉了二十年工程文化、最优秀工程师的忠诚度,以及 Instagram 的安全防线。

时间线还原

时间事件
2026-04 下旬全员通知:上线键盘 / 鼠标全量记录系统,用于生成 AI 训练数据,不允许 opt-out
2026-04 下旬硬性指令:产品工程团队必须抽调 30%–50% 工程师调入"智能体数据优化部门(ADO)"
2026-04-20路透社披露:一个月内裁 10%,全员悬而未决
2026-05-20裁员名单宣布
2026-05-30Instagram 大规模账号被劫持(含奥巴马白宫官方账号),疑似"零认证密码重置"漏洞
2026-06-01宕机解决,启动 SEV0 调查
2026-06-02首席信息安全官 Guy Rosen 离职
2026-06-12Facebook / Instagram 又一次 SEV0 全面宕机
2026-06英国分部因数据保护法规未上线监控系统;员工反对后管理层让步:可暂停 30 分钟、可申请豁免

Meta 此前的工程文化(被毁掉的资产)

作者把 Meta 工程文化分为两段:

2010s · "Move Fast and Break Things"

  • 自上而下的工程师中心:CEO 自己写代码、看重个人 impact
  • 极少流程:测试 / 文档 / 注释少得惊人
  • 红宝书(仿《毛主席语录》)写满"完成胜于完美""若无所畏惧"等口号

2020s · "Move Fast with Stable Infra"

  • 工程师为公司而非团队招聘,Bootcamp 6 周后自选团队
  • 高度自治:内部转岗容易、由工程师主动发起
  • 业内最强发布系统之一,Threads 上线一周服务 1 亿用户

这次自毁式重组的 5 个核心问题

问题 1:全量记录键盘鼠标,员工无 opt-out 权

理由是"为下一代 AI 生成训练数据"。员工担心的隐私边界(私人邮件、银行登录、私人通话)公司事前完全没回应。受 GDPR 限制英国分部没上。

问题 2:30%–50% 工程师被"抓壮丁"做数据标注

  • 抽调到 ADO(Agentic Data Optimization)部门
  • 这与 Meta 二十年来"工程师自选团队"的传统正面冲突
  • 工作内容并不简单:写 task → 写测试用例 → Harbor 框架打 Docker → 读多模型生成的代码并打反馈
  • 但日复一日做,绝大多数工程师都失去工作热情
  • 基础设施和安全团队抽调比例尤其高,部分团队顶尖工程师直接被调走
  • ADO 现规模 6500 人,超过 OpenAI + Anthropic 加起来
  • 每 5–6 名 Meta 软件工程师里就有 1 人在全职打标——没人会把领英 title 改成"Meta 数据标注专员"

问题 3:一个月的"等着被裁"期

4 月 20 日宣布"一个月内裁 10%",到 5 月 20 日才落地。整整四周全员人心惶惶,士气直接归零。

问题 4:极为严苛的 PSC 绩效考核

  • 管理层之间相互博弈员工评级,压同事的分抬自己下属
  • 各类指标(业务贡献、代码评审数、写码行数)早已被当成博弈工具
  • "避免差评的唯一方式"是把数字做得比同事高

问题 5:Token 使用量纳入 PSC,引爆"刷 Token"内卷

  • 公司内部还有 token 消耗排行榜
  • 30 天 60.2T tokens,按 Anthropic API 价格折合 9 亿美元;即便 Meta 拿大额折扣,成本也超 1 亿美元
  • 绝大部分是"表演式刷指标"
  • 激励扭曲到匪夷所思:因 AI 生成代码引发故障不会被裁,但手写代码反而可能丢工作

最尴尬的代价:Instagram SEV0 宕机

5 月 30 日大规模账号被劫持事件,软件工程师 Siddharth Sundharam 复盘的攻击链:

  1. 用 VPN 切到目标账号所在城市
  2. 找 Instagram 的 AI 客服谎称账号被盗,要求把验证码发到攻击者邮箱
  3. 没了。 没有任何"邮箱是否是历史绑定邮箱"的校验
  4. AI 把验证码送到攻击者邮箱 → 攻击者完成密码重置 → 完整接管账号

作者通过内部人员了解到根因:

  • Instagram 信任与安全团队因抽调 + 裁员流失约一半员工
  • "AI 生成代码 → 另一轮 AI 代码评审 → 直接合入"在整个代码库里已经非常普遍
  • 信任与安全团队因快速重组陷入混乱,常规预警机制失效
  • 6 月 2 日首席信息安全官 Guy Rosen 离职——作者推测是因警告被无视

内部正在崩坏

《连线》拿到的录音:员工在面向数千人的内部直播里爆粗口,称自己"成了公司的奴才"。首席产品官 Chris Cox 在 Instagram 全员会上把当前处境比作"顶着冰雹跑马拉松,中途队友还被换掉,一举一动还要被记录监控",连说两遍"离谱到家了"。

CTO Andrew Bosworth 向员工承认"AI 重组糟透了"并承诺加强沟通——作者认为这种安抚此刻几乎没有诚意。

作者把矛头指向两个人

扎克伯格——所有决策的最终签字人,包括在 Meta 营收和利润历史新高时裁 10%。

Alexandr Wang(Scale AI 创始人 / Meta AI 战略负责人)——除裁员之外,所有动作都是把 Scale AI 的剧本搬进来:

  • 强制采集键盘 / 鼠标数据(高质量训练语料)
  • 强制抽 4500+ 工程师做 RLHF 标注
  • 优先保证编程大模型的训练,而不是 Instagram / FB / Messenger 的稳定性

而 6 月 12 日的第二次 SEV0 几乎已经把这套优先级的代价摆在了台面上。

行业警示:MTTR 不是免死金牌

HashiCorp 创始人 Mitchell Hashimoto 给作者提供了一个值得记的框架——他把现在的 AI 狂热类比当年云计算转型时的 MTBF vs MTTR 之争:

'AI 狂热者'几乎完全秉持"只要有 MTTR 就够了"的心态:发布有缺陷的代码没关系,反正智能体修得比人快。当年做基础设施我们就明白,MTTR 固然重要,但你不能因此抛弃系统的韧性。

具体症状:

  • 局部指标(缺陷数、测试覆盖率)看起来更好
  • 但语义理解在下降、底层架构在快速腐化
  • 没人能看清全貌,因为变更速度太快

关键数据

数据点数值
Meta 工程师总数~25000
ADO 部门规模~6500(4500 为软件工程师)
抽调比例核心团队 30%–50%
Instagram 信任与安全团队流失~50%
30 天 Token 消耗60.2T(按 Anthropic 价折 9 亿美元)
收购 Scale AI 49% 股份148 亿美元
SEV0 宕机次数2 次(5/30 + 6/12)

我的看法

Rainsho 维度的几个观察:

  1. "绩效中嵌入工具使用量"是普适反面教材。Token 排行榜本质上和"今天写了多少行代码""提了多少次 code review"一样,是 Goodhart's law 的 textbook case——一旦指标变成目标,工程师必然学会"刷指标",而 LLM 工具的成本结构恰好让"刷"成本极低、损害极大。前端团队如果想引导团队用 Copilot / Claude Code,禁止把使用量挂进 KPI,只评估产出物质量;否则两周内就会看到 PR 里全是 AI 生成的过度抽象 + 测试用例水化。

  2. "AI 审 AI"是工程文化的死亡信号。Instagram 那个零认证密码重置漏洞,本质上不是 AI 能力问题,而是评审环节被掏空——人不再 push back AI 的输出,因为 push back 会显得"没用 AI"。这条对前端尤其要警惕:UI 改动不像后端事故那么明显,AI 生成的可用性 / 可访问性退化往往要几个月才暴露。人审 AI 不能因为"麻烦"而被简化为"AI 审 AI"。

  3. 大厂"抽壮丁"的剧本对国内也有镜像。把核心工程师整建制调去做"数据标注 / RLHF / 评测集打分"在国内很多大模型公司也在发生,差别只是包装话术("参与模型迭代""一线打磨 AI 体验")。如果哪天产品团队被通知"30% 的人调过去支援 AI Lab"——这篇文章的剧本基本就是你 6 个月后的预演,特别是看清楚"调走的人能不能调回来""绩效是否可比"。

  4. 作者结尾那句"现在是从 Meta 挖人的最佳时机"很值得国内大厂 HR 留意。Meta 工程师都是 AI 早期采用者 + 能搭基础设施,这种 profile 在中国市场也极稀缺。如果你团队正在招 PC 前端的 AI 工程化方向(IDE 插件 / 提示词工程 / Agent 集成),现在 Meta 流失的人才波是个真窗口。

  5. 管理层"All in"的代价被严重低估。文章里 Mitchell 那段话很重要:你身边那些"沉迷 AI"的高管,理性讨论的窗口可能已经关闭——因为任何质疑都会被"我们有测试覆盖""缺陷在下降"挡回去,而这些都是局部指标。这条对一线工程师的实操建议是:把质疑写在 doc 里、留时间戳,不指望说服,但 6 个月后回头看会变成珍贵的免责证据。

一句话总评:这不是 Meta 一家的事故,是给所有"AI 优先"公司的提前剖检报告。值得每个团队 leader 仔细读,然后在公司推 AI 提效政策时多问一句"我们是不是在抄 Meta 这套剧本"。