干掉 .md?兜里 Token 不够,没法和 Karpathy 共情
文章核心观点
背景:Markdown 过时之争
近日,围绕 Markdown 是否已经过时的讨论在开发者社区持续升温。引发热议的起因来自 Claude Code 团队成员 Thariq 发布的一篇文章:《The Unreasonable Effectiveness of HTML》。文中提出一个颇具新意的观点:在 AI Agent 时代,HTML 正在成为比 Markdown 更高效的人机协作媒介。
Theo 的五大核心理由
知名技术 YouTuber、Ping Labs CEO、t3.gg 创始人 Theo Browne 发布长达 30 多分钟的视频,系统性阐述了自己为何开始逐渐放弃 Markdown,总结出 HTML 优于 Markdown 的五大核心理由:
1. 更高的信息密度
一个 HTML 文件可以承载表格、设计插图、代码、图像、空间工作流和交互组件。Theo 特别指出,模型在输出图像方面依然表现糟糕。
2. 视觉清晰,易于阅读
随着 Claude 处理的工作日趋复杂,它产出的规范和计划也越来越庞大。Theo 坦言,自己通常不会真正阅读超过 100 行的 Markdown 文件,也无法让团队中的任何人去读。但 HTML 文档可以通过标签页、插图、链接等方式组织成清晰的结构,甚至支持移动端响应式布局。
3. 便于分享
Markdown 文件在大多数浏览器中无法良好原生渲染,通常需要以附件形式发送。而 HTML 文件只需上传到 S3 即可生成链接,同事可在任何设备上打开并引用。
4. 强大的交互能力
HTML 允许用户与文档进行双向交互,例如添加滑块、下拉菜单来调整设计或算法参数,并将更改复制回提示词中,粘贴回 Claude Code 继续操作。
5. 令人愉悦的创作体验
Theo 强调,用 HTML 制作文档更有趣,让他感觉更投入、更专注。
Karpathy 的判断:未来属于视觉输出
AI 领域知名人物 Karpathy 也公开表态支持这一做法,认为直接要求模型将回复结构化为 HTML 格式非常有效。
Karpathy 进一步提出一个判断:未来,人类对 AI 的输入会越来越偏向语音,而 AI 对人类的输出,则会越来越偏向视觉。
原因很简单。人脑近三分之一的处理资源用于视觉系统。视觉天然拥有更高的信息吞吐能力。在他看来,Markdown 只是从纯文本向视觉化过渡的第一站,而 HTML 只是中间阶段。
更远的未来,AI 输出可能直接演化为:实时交互式模拟、动态视觉界面、神经生成视频、完全无代码渲染层,换句话说,HTML 并不是终点,而只是迈向下一代 AI 交互界面的过渡形态。
社区质疑:Token 成本与实用性
尽管整体支持 HTML,Theo 并未全盘接受 Claude Code 团队的论述。他在视频中多次提出质疑。总结起来,主要缺陷有两个:太费 Token、版本控制不太行。
社区评论中,最具代表性的质疑集中在 Token 成本问题上。一位用户名为 Victor-Bash 的网友调侃称:
这简直就是一种教你如何用双倍 Token、更快填满上下文窗口的方法。
这条评论迅速获得大量点赞,成为讨论区热评之一。
另一位网友则更直接地将其戏称为:Big Token 的阴谋。
还有用户猜测,这类论调的本质,是在变相推动更多模型调用成本:
让我猜猜,这会烧掉更多 Token,也让平台赚更多钱。
结论:Markdown + HTML 的混合模式
Theo 最终并未给出明确答案。他承认,彻底抛弃 Markdown 仍显激进。但他认为,这场讨论的真正意义,不应该是 HTML 是否取代 Markdown,而是开发者终于开始重新思考一个长期被忽视的问题:在 AI 原生时代,人与模型之间究竟应该通过什么样的界面协作。
在不少评论者看来,这并不是 Markdown vs HTML,而应该是:Markdown + HTML。
正如一位评论者的总结:真正有价值的那一半案例,本来也不该用 Markdown。