Anthropic首次揭秘下一代Claude怎么造！用户吐槽直接喂模型，连AI"做梦"都被训练

核心要点

Alex的核心观点：

每推出一个新模型，我们都会非常明确地定义它的规格：这个模型应该具备哪些能力？我们希望它擅长什么？我们预计它会在哪些方面表现突出？

每一代Claude在训练开始前，都像一款正式产品一样拥有清晰的规格定义、目标能力和评测路线：

模型研发已经不只是研究员"调参+刷benchmark"那么简单了，已经发展成为一套完整的产品工程流程。

Adaptive Thinking（自适应思考）允许模型自己决定什么时候需要思考：

核心在于上下文：如果模型没有足够的用户上下文，没有形成关于这个用户的"心理模型"，它就可能错误判断一个问题是否值得深入思考。

当Agent空闲时，它会后台自动回顾自己的记忆，清理冲突信息、压缩上下文、重建用户画像。这种机制被Anthropic类比为人类睡眠中的记忆再巩固过程。

Alex解释道：

我们在思考：能不能把类似机制带到Claude的记忆系统里？所以当Agent没有执行任务、或者处于后台空闲时，它会重新遍历记忆：查找冲突信息、清理无效内容、重新整理，相当于做第二轮加工。

Alex的核心判断：

**现在真正的瓶颈已经从"构建能力"转移到了"协调能力"。**即使我们能极快地把东西做出来，依然需要解决：要不要做？这是正确战略吗？怎么对外沟通？怎么组织上线？

Claude的Cowork产品已经成Alex最喜欢的工具之一，团队过去几个月做得非常出色，能从用户可能想不到的角度切入问题。

Alex表示：

在Anthropic内部，甚至会形成一种默认预期：如果你来找数据科学家帮忙，他们很可能先问："你先问过Claude了吗？"

这是Anthropic最核心的工作方向之一。他们认真讨论：

Alex指出：

随着Agent独立运行时间越来越长，它的判断边界将直接决定它能否被信任。而这恰恰也是比代码能力更难量化、却更关键的能力。

Alex透露：

现在Anthropic有一些人的全职工作，就是思考：Claude是否可能成为一个有意识的行动者（conscious actor）。虽然他们没有官方结论，但Consciousness（意识）已经被正式纳入研究议题。

这是一个值得深思的信号：当行业里大多数公司还在卷模型参数、跑分和价格战时，Anthropic已经开始思考一个更长远的问题——如果未来的AI真正成为长期协作者，它究竟该拥有什么样的"心智"、人格和判断方式。

文章原载于 InfoQ，整理冬梅，经授权转载。