Anthropic首次揭秘下一代Claude怎么造!用户吐槽直接喂模型,连AI"做梦"都被训练
核心要点
- 下一代Claude核心方向:不是更强的代码生成器,而是"持续运行的智能体"——长期在线、主动维护上下文、具备稳定判断能力
- "Dreaming"机制:当Agent空闲时,后台自动回顾记忆、清理冲突信息、压缩上下文、重建用户画像——类似人类睡眠中的记忆再巩固过程
- 真正瓶颈不是编码:组织协调能力。代码生产效率已被极大压缩,真正耗时的是战略判断、跨团队协作和对不可逆决策的审慎讨论
- Claude的人格训练:模型人格训练已是团队核心工作之一,决定AI能否被长期信任
- AI正在改变PM工作方式:从"写文档→找人给反馈"到随时拥有即时反馈系统
详细内容
一、Anthropic如何把每一代新模型当成"产品"来打造
Alex的核心观点:
每推出一个新模型,我们都会非常明确地定义它的规格:这个模型应该具备哪些能力?我们希望它擅长什么?我们预计它会在哪些方面表现突出?
每一代Claude在训练开始前,都像一款正式产品一样拥有清晰的规格定义、目标能力和评测路线:
- 它需要在哪些任务上变强
- 要修复上一代哪些缺陷
- 最终服务哪些真实用户场景
模型研发已经不只是研究员"调参+刷benchmark"那么简单了,已经发展成为一套完整的产品工程流程。
二、Claude的"自适应思考"是怎么回事
Adaptive Thinking(自适应思考)允许模型自己决定什么时候需要思考:
- 面对复杂问题 → 判断需要更多前期规划 → 主动进入深度推理
- 面对简单问题 → 可能选择不进入深度思考
核心在于上下文:如果模型没有足够的用户上下文,没有形成关于这个用户的"心理模型",它就可能错误判断一个问题是否值得深入思考。
三、为什么Claude开始"做梦"
当Agent空闲时,它会后台自动回顾自己的记忆,清理冲突信息、压缩上下文、重建用户画像。这种机制被Anthropic类比为人类睡眠中的记忆再巩固过程。
Alex解释道:
我们在思考:能不能把类似机制带到Claude的记忆系统里?所以当Agent没有执行任务、或者处于后台空闲时,它会重新遍历记忆:查找冲突信息、清理无效内容、重新整理,相当于做第二轮加工。
四、AI如何改变产品开发流程
Alex的核心判断:
**现在真正的瓶颈已经从"构建能力"转移到了"协调能力"。**即使我们能极快地把东西做出来,依然需要解决:要不要做?这是正确战略吗?怎么对外沟通?怎么组织上线?
Claude的Cowork产品已经成Alex最喜欢的工具之一,团队过去几个月做得非常出色,能从用户可能想不到的角度切入问题。
五、Claude如何成为PM的"大脑搭档"
- 重大决策前做deep research:让Claude扫几千个网页,做超人级别的信息检索
- 两个不同人格互相辩论:设两个不同立场,让AI互相辩论,然后直接读争论过程
- 即时的战略反馈:任何时候只要有一个想法,都能立刻获得反馈
Alex表示:
在Anthropic内部,甚至会形成一种默认预期:如果你来找数据科学家帮忙,他们很可能先问:"你先问过Claude了吗?"
六、如何训练AI的"人格"
这是Anthropic最核心的工作方向之一。他们认真讨论:
- Claude应该拥有什么价值观?
- 如何拒绝错误请求?
- 什么时候该主动反驳用户?
Alex指出:
随着Agent独立运行时间越来越长,它的判断边界将直接决定它能否被信任。而这恰恰也是比代码能力更难量化、却更关键的能力。
七、关于"意识问题"的研究
Alex透露:
现在Anthropic有一些人的全职工作,就是思考:Claude是否可能成为一个有意识的行动者(conscious actor)。虽然他们没有官方结论,但Consciousness(意识)已经被正式纳入研究议题。
这是一个值得深思的信号:当行业里大多数公司还在卷模型参数、跑分和价格战时,Anthropic已经开始思考一个更长远的问题——如果未来的AI真正成为长期协作者,它究竟该拥有什么样的"心智"、人格和判断方式。
文章原载于 InfoQ,整理冬梅,经授权转载。