AIClaudeAnthropic产品

Anthropic首次揭秘下一代Claude怎么造!用户吐槽直接喂模型,连AI"做梦"都被训练

冬梅(整理)··原文链接
收录于 2026/5/19 08:13:50

核心要点

  • 下一代Claude核心方向:不是更强的代码生成器,而是"持续运行的智能体"——长期在线、主动维护上下文、具备稳定判断能力
  • "Dreaming"机制:当Agent空闲时,后台自动回顾记忆、清理冲突信息、压缩上下文、重建用户画像——类似人类睡眠中的记忆再巩固过程
  • 真正瓶颈不是编码:组织协调能力。代码生产效率已被极大压缩,真正耗时的是战略判断、跨团队协作和对不可逆决策的审慎讨论
  • Claude的人格训练:模型人格训练已是团队核心工作之一,决定AI能否被长期信任
  • AI正在改变PM工作方式:从"写文档→找人给反馈"到随时拥有即时反馈系统

详细内容

一、Anthropic如何把每一代新模型当成"产品"来打造

Alex的核心观点:

每推出一个新模型,我们都会非常明确地定义它的规格:这个模型应该具备哪些能力?我们希望它擅长什么?我们预计它会在哪些方面表现突出?

每一代Claude在训练开始前,都像一款正式产品一样拥有清晰的规格定义、目标能力和评测路线:

  • 它需要在哪些任务上变强
  • 要修复上一代哪些缺陷
  • 最终服务哪些真实用户场景

模型研发已经不只是研究员"调参+刷benchmark"那么简单了,已经发展成为一套完整的产品工程流程

二、Claude的"自适应思考"是怎么回事

Adaptive Thinking(自适应思考)允许模型自己决定什么时候需要思考:

  • 面对复杂问题 → 判断需要更多前期规划 → 主动进入深度推理
  • 面对简单问题 → 可能选择不进入深度思考

核心在于上下文:如果模型没有足够的用户上下文,没有形成关于这个用户的"心理模型",它就可能错误判断一个问题是否值得深入思考。

三、为什么Claude开始"做梦"

当Agent空闲时,它会后台自动回顾自己的记忆,清理冲突信息、压缩上下文、重建用户画像。这种机制被Anthropic类比为人类睡眠中的记忆再巩固过程

Alex解释道:

我们在思考:能不能把类似机制带到Claude的记忆系统里?所以当Agent没有执行任务、或者处于后台空闲时,它会重新遍历记忆:查找冲突信息、清理无效内容、重新整理,相当于做第二轮加工。

四、AI如何改变产品开发流程

Alex的核心判断:

**现在真正的瓶颈已经从"构建能力"转移到了"协调能力"。**即使我们能极快地把东西做出来,依然需要解决:要不要做?这是正确战略吗?怎么对外沟通?怎么组织上线?

Claude的Cowork产品已经成Alex最喜欢的工具之一,团队过去几个月做得非常出色,能从用户可能想不到的角度切入问题。

五、Claude如何成为PM的"大脑搭档"

  • 重大决策前做deep research:让Claude扫几千个网页,做超人级别的信息检索
  • 两个不同人格互相辩论:设两个不同立场,让AI互相辩论,然后直接读争论过程
  • 即时的战略反馈:任何时候只要有一个想法,都能立刻获得反馈

Alex表示:

在Anthropic内部,甚至会形成一种默认预期:如果你来找数据科学家帮忙,他们很可能先问:"你先问过Claude了吗?"

六、如何训练AI的"人格"

这是Anthropic最核心的工作方向之一。他们认真讨论:

  • Claude应该拥有什么价值观?
  • 如何拒绝错误请求?
  • 什么时候该主动反驳用户?

Alex指出:

随着Agent独立运行时间越来越长,它的判断边界将直接决定它能否被信任。而这恰恰也是比代码能力更难量化、却更关键的能力。

七、关于"意识问题"的研究

Alex透露:

现在Anthropic有一些人的全职工作,就是思考:Claude是否可能成为一个有意识的行动者(conscious actor)。虽然他们没有官方结论,但Consciousness(意识)已经被正式纳入研究议题。

这是一个值得深思的信号:当行业里大多数公司还在卷模型参数、跑分和价格战时,Anthropic已经开始思考一个更长远的问题——如果未来的AI真正成为长期协作者,它究竟该拥有什么样的"心智"、人格和判断方式。


文章原载于 InfoQ,整理冬梅,经授权转载。