DeepSeekClaudeCodeHarnessAgentAI编程

模型之外，皆属Harness！DeepSeek终于出手：招人、组队、从零造一个中国版Claude Code

Tina·2026-05-22·原文链接

收录于 2026/5/23 09:27:52

DeepSeek公开招兵买马

DeepSeek在官网、小红书、X同步发布招聘信息，目标明确：Model + Harness = Agent

招聘要求覆盖Agent工程涉及的多个关键技术方向，候选人要深度使用过Claude Code、Cowork、Codex、Cursor等类似产品，并熟悉其中的使用方法、设计思想和产品实现。

关键人物：

陈德里（Deli Chen）：北大毕业，2023年加入DeepSeek担任研究员，是对外沟通的重要代表
Cui Tianyi：Jane Street工作近九年，从股票和固定收益领域的软件开发与研究，加入Harness团队

Anthropic的中国封锁

Anthropic一边定义未来，一边把中国开发者挡在门外：

官方明确禁止中国大陆访问Claude
2025年9月：任何由中国资本控制超过50%的公司都不准用
CEO达里奥·阿莫迪公开主张对中国实施技术制裁

结果： 全球最好的AI编程产品之一，中国开发者连正式使用的资格都没有。

Harness为何成为必争之地

同模型不同Harness的差距

以Claude Opus 4.5为例：

放进Claude Code的Harness：CORE-Bench Hard达到95%
换成朴素Hugging Face Smolagents配置：只剩42%
同样的权重、同样的智能水平，Harness拉开了53个百分点

2026年的焦点转移

AI行业的关注点一直在往外层移动：

2022年：权重、微调、RLHF
2023年：上下文、RAG、长上下文
2024年：工具调用、MCP
2026年：真正站到台前的是最外层的Harness

Harness的核心职责

Harness负责：

组织代码库、项目规则、上下文摘要
控制迭代次数、重试策略和任务边界
把模型的决策转化成shell命令、文件编辑和测试执行
把测试失败、日志输出、浏览器截图重新喂回模型

现代coding agent跑的已经不是一次性问答，而是一个"思考—行动—反馈—修正"的长循环。这个循环能不能跑稳，靠的就是Harness。

模型和Harness的共同进化

Claude Code的演进史说明：模型和Harness从来不是两条分开的线。

一年间的变化：

一年前：Claude连写bash命令、处理字符串转义都很吃力
一年后：几乎整个Claude Code都是Claude Code自己写出来的
Claude已经可以稳定地连续运行几分钟、几小时、甚至几天

长运行时间的突破：

最小脚手架下稳定完成50%任务的运行时间：从Opus 3.7的约1小时提升到Opus 4.6的12小时
解决途径：一是模型本身直接把能力烘焙进权重，二是改Harness（模型外面的脚手架）

DeepSeek面临的真正挑战

做一个代码助手的外观并不难，真正难的是建立自己的长时间运行闭环：

让DeepSeek模型在真实代码库里工作
让Harness记录它在哪里失败、为什么失败
用户怎么修正，再把这些失败变成下一轮产品设计、工具设计和模型训练的输入

核心结论：

如果DeepSeek只做模型，它永远会被包在别人的工具里
如果它能跑通模型和Harness共同演化的循环，才有机会长出自己的Claude Code

结语

DeepSeek官网那句 "Model + Harness = Agent" 正在成为行业共识。控制层不再只是模型的附属品，而是一个独立的产品维度。没有Harness，模型只是能力；有了Harness，模型才开始变成能运行、能交付、能持续迭代的产品。