AIAgentClaude CodeROI

Claude Code 工程一号位亲自给 Agent 热潮降温:狂烧 Token 时代已过,现在该算 ROI 了

编译|冬梅··原文链接
收录于 2026/6/23 10:05:24

核心观点

Fiona 的核心论点可归纳为一句话:Coding is solved,但工程不是。 当 Anthropic 工程师季度代码交付量相比 2025 年增长 8 倍后,写代码不再是稀缺能力,新的稀缺能力变成了五件事——

  1. Verification:怎么确认高速生成的东西是正确、高质量的;
  2. 优先级判断:在产出过剩的环境里,决定"做哪个"比"做出来"更难;
  3. 真实产出衡量:从"工具使用量"切到"outcome 指标",避免 motion ≠ progress;
  4. 异步 agent 管理:routines 抽象层之上,怎么调度 20+ 并行 agent 而不被 context switching 拖垮;
  5. 团队文化:高速增长中如何保留 one team mentality、开放争论、跨人协作。

她反复强调的口号是 "不要把 motion 当成 progress"。token maxing 是 2025 年的故事,2026 年的故事是 ROI。

关键论点详解

一、瓶颈从"写"转移到"验"和"管"

代码生成被模型吃掉后,下一个瓶颈是 verification。Fiona 的解法不是"再加一道人类 review"(那会变回瓶颈),而是把"什么是好的"框架化、代码化、版本化:

  • 把 spec、content design 做成 repo 里的 skill,跟代码一起维护;
  • 让 Claude Code review 按这些 spec 自动校验;
  • TDD 不再是"先吃西兰花"——让 Claude 先写失败测试、再写实现通过测试,老原则反而因模型能负担执行成本而重新发光。

这一套本质上是 "把人类判断沉淀成机器可读的 guardrail",而不是把人留在循环里。

二、token maxing 已死,ROI 时代开始

Fiona 主动泼冷水:

  • 代码行数、PR 数、token 用量都只是 action 指标,不能等同于 outcome;
  • 好的指标要能持续 hill climb,且始终服务于最初想达成的结果;
  • 早期 Marketplace 的教训:卖家数量不是真目标,找到想要的物品才是——指标会骗人,要回到"解决了什么问题"。

她给团队 leader 的建议是做 listening tour——尤其去听资深工程师对 AI 工具的真实反馈,比 dashboard 更有信息量。

三、routines:异步协作的下一个抽象层

Fiona 把自己的日常工作流抽象为三层演进:

  1. 同步:写 prompt → 等结果;
  2. 异步:同时跑几个 prompt;
  3. routines:写一个 routine,让 agent 替我生成 prompt、甚至启动子 agent。

关键洞察:她作为 manager,每天需要 review 的 PR、读到的反馈摘要,是 routines 替她"先看一遍"的结果。这让管理动作从"看 dashboard 找问题"变成"review agent 已经生成的修复 PR"。

但她也承认新问题:context switching 负担急剧上升。20+ agent 并行意味着无穷无尽的 check + review,她自己也要重新 block focus time 去追自己启动的异步工作。

四、role 边界模糊,但 depth 仍然稀缺

Fiona 在招聘上仍坚持两类画像:

  • Creative builders / dreamers:有产品感、端到端拥有体验;
  • Deep systems experts:分布式系统、底层专家,依然不可或缺——"trust but verify"。

她特别提到了一个观察:AI 让"野心"重新成为稀缺品。当"做不做得了"不再是问题,"你想做多大的事" 成了新的瓶颈。移动端非专家也能借助 Claude 拓展到陌生 surface,能力上限被抬高。

五、agency + accountability 是同一枚硬币

Fiona 强调 high agency 必须配 high accountability:你可以自由尝试,但必须问清楚——问题是什么、假设是什么、谁来负责。她特别警惕"房间里着火,狗说 this is fine"的管理者。

六、dogfooding 是产品感的来源

她自己作为 leader 坚持 daily driver 自家产品,给出三点理由:

  • 保持产品脉搏,不被 dashboard 隔离;
  • 用户会以你没想到的方式使用产品(她曾在 Marketplace 挂二手 Mac 时撞上新诈骗方式);
  • 现场能稳定复现的 bug 比任何数据都值钱。

七、JIT planning 取代传统 roadmap

六个月 roadmap 在她看来已经过时。现在的做法是:

  • 每月一个小 spreadsheet 列优先级;
  • 每周 check-in 确认"这还是本月重点吗";
  • 半年定主题,但保持对现实变化的感知。

关键是 "明确允许自己杀掉不再服务目的的流程"——她曾带入 Claude 团队的 6 个月 roadmap 文档,三个月后自己主动废掉。

八、工程师培养:双击能力(double click)不能丢

Fiona 担忧的不是就业本身,而是下一代工程师可能跳过亲手理解底层的过程。她用的词是 double click——能深入到依赖的那一层。模型可能某天强到不需要,但这层理解力在改进产品时仍然不可替代。她建议未来工程教育更接近 fellowship / apprenticeship,把多年踩坑经验压缩传递。

关键数据 / 金句

  • 8 倍:Anthropic 工程师平均季度代码交付量相比 2025 年的增长倍数
  • 25 年:Fiona 的工程生涯跨度(IBM DB2 → Microsoft VS → Meta Marketplace/VR → Anthropic)
  • "Make new mistakes":犯错可以,但要犯新错误,团队才是在学习
  • "不要把 motion 当成 progress":核心反 token maxing 口号
  • "Keep it simple":她工作上最常提醒团队的话
  • "In a world where you can be anything, be kind":她的人生座右铭
  • high agency = high accountability:同一枚硬币的两面
  • "this is fine" meme:她最怕的管理者状态——房间里着火还说一切都好
  • bad vs. sad 框架:用用户脏话频率观察挫败感
  • JIT planning:用一个月度小 spreadsheet + 周 check-in 替代长周期 roadmap

我的看法

Fiona 这套话术对前端工程化有几个直接可借鉴的点:第一,spec-as-code——把 design system 的"什么是好组件"沉淀成可被 Claude review 消费的 skill/lint,这跟 Rainsho 正在做的组件库方向高度同构;第二,CI 里的 TDD 自动化——让 Claude 先写失败测试再写实现,是把"老原则因新工具复活"的范式,值得在构建工程里复用;第三,listening tour 替代 dashboard——做技术选型时,老工程师的"哪些有效"比 benchmark 数字更值钱。

但要警惕她没说的部分:Anthropic 是"内部用 token 不心疼"的不公平样本,她的 ROI 框架在中小企业根本跑不通;token maxing 转向 ROI 更像公关降温叙事(结合 6 月 22 日发布、7 月 1 日涨价的窗口期),不是技术判断。最后,routines 抽象层本质是把"管理者注意力"商品化——Fiona 自己也承认 context switching 是新痛点,不要被硅谷话术包装成"自由"就忽略了它的代价。