DeepSeekClaudeCodeHarnessAgentAI编程
模型之外,皆属Harness!DeepSeek终于出手:招人、组队、从零造一个中国版Claude Code
收录于 2026/5/23 09:27:52
DeepSeek公开招兵买马
DeepSeek在官网、小红书、X同步发布招聘信息,目标明确:Model + Harness = Agent
招聘要求覆盖Agent工程涉及的多个关键技术方向,候选人要深度使用过Claude Code、Cowork、Codex、Cursor等类似产品,并熟悉其中的使用方法、设计思想和产品实现。
关键人物:
- 陈德里(Deli Chen):北大毕业,2023年加入DeepSeek担任研究员,是对外沟通的重要代表
- Cui Tianyi:Jane Street工作近九年,从股票和固定收益领域的软件开发与研究,加入Harness团队
Anthropic的中国封锁
Anthropic一边定义未来,一边把中国开发者挡在门外:
- 官方明确禁止中国大陆访问Claude
- 2025年9月:任何由中国资本控制超过50%的公司都不准用
- CEO达里奥·阿莫迪公开主张对中国实施技术制裁
结果: 全球最好的AI编程产品之一,中国开发者连正式使用的资格都没有。
Harness为何成为必争之地
同模型不同Harness的差距
以Claude Opus 4.5为例:
- 放进Claude Code的Harness:CORE-Bench Hard达到95%
- 换成朴素Hugging Face Smolagents配置:只剩42%
- 同样的权重、同样的智能水平,Harness拉开了53个百分点
2026年的焦点转移
AI行业的关注点一直在往外层移动:
- 2022年:权重、微调、RLHF
- 2023年:上下文、RAG、长上下文
- 2024年:工具调用、MCP
- 2026年:真正站到台前的是最外层的Harness
Harness的核心职责
Harness负责:
- 组织代码库、项目规则、上下文摘要
- 控制迭代次数、重试策略和任务边界
- 把模型的决策转化成shell命令、文件编辑和测试执行
- 把测试失败、日志输出、浏览器截图重新喂回模型
现代coding agent跑的已经不是一次性问答,而是一个"思考—行动—反馈—修正"的长循环。这个循环能不能跑稳,靠的就是Harness。
模型和Harness的共同进化
Claude Code的演进史说明:模型和Harness从来不是两条分开的线。
一年间的变化:
- 一年前:Claude连写bash命令、处理字符串转义都很吃力
- 一年后:几乎整个Claude Code都是Claude Code自己写出来的
- Claude已经可以稳定地连续运行几分钟、几小时、甚至几天
长运行时间的突破:
- 最小脚手架下稳定完成50%任务的运行时间:从Opus 3.7的约1小时提升到Opus 4.6的12小时
- 解决途径:一是模型本身直接把能力烘焙进权重,二是改Harness(模型外面的脚手架)
DeepSeek面临的真正挑战
做一个代码助手的外观并不难,真正难的是建立自己的长时间运行闭环:
- 让DeepSeek模型在真实代码库里工作
- 让Harness记录它在哪里失败、为什么失败
- 用户怎么修正,再把这些失败变成下一轮产品设计、工具设计和模型训练的输入
核心结论:
- 如果DeepSeek只做模型,它永远会被包在别人的工具里
- 如果它能跑通模型和Harness共同演化的循环,才有机会长出自己的Claude Code
结语
DeepSeek官网那句 "Model + Harness = Agent" 正在成为行业共识。控制层不再只是模型的附属品,而是一个独立的产品维度。没有Harness,模型只是能力;有了Harness,模型才开始变成能运行、能交付、能持续迭代的产品。