AIGPU算力基础设施
硅谷深陷算力荒:H200一夜涨价30%,H100抢到缺货,Karpathy也未能幸免
收录于 2026/5/25 08:57:30
核心要点
- 算力荒蔓延:连站在算力中心的人都要排队。英伟达研究团队负责人找黄仁勋申请训练卡,被告知"那些卡已经卖掉了"
- 价格暴涨:H100一年期合约租金半年涨近40%,H200现货价格甚至比新一代B200还贵,一夜涨幅29%
- 利用率悖论:高端GPU紧缺,但企业GPU集群平均利用率只有5%左右,FOMO导致囤积性囤积
- 旧卡成刚需:H100/H200因生态成熟、确定性强,反而比更新更强的B200更抢手
- 算力民主化受阻:算力正在从基础设施变成一种"筛选机制",筛掉没有预算、没有配额、没有长期合同的群体
一、H100抢不到,H200一夜涨价30%
RunPod、Azure、Google Colab 等平台普遍显示 H100 不可用或启动失败。SemiAnalysis 数据显示,H100 一年期合约租金从 2025年10月的 $1.70/小时涨到 2026年3月的 $2.35/小时。
lambda 的报价已上浮到 4 美元+/小时,是两年前的两倍。H200 现货价格从 $4.96/GPU小时涨到 $6.40,涨幅29%,比新一代 B200($5.68)还贵。
旧卡不降反涨的原因:
- H100/H200 生态成熟,确定性高
- 推理、Agent、RL后训练、自动评测、小模型复现等海量需求对"最新最强"不敏感
- 新一代 B200 需要时间消化到框架、集群、调度和成本模型里
二、5%的利用率和B200的倒挂
Cast AI 报告显示,不少企业 GPU 集群平均利用率只有 5% 左右。马斯克的兆瓦级算力中心 Colossus MFU(模型算力利用率)仅 11% 左右。
利用率低的真相:
- 不是意识不到浪费,而是不敢放手
- 云厂商销售话术:"你要的卡现在只剩36张了,只能签一年长约。不要的话,后面还有五家排队等着呢"
- 芯片不只是产能短缺,更是流动性短缺——困在长合约里,但就是不在普通开发者能点开购买的页面上
三、AI民主化,卡在了算力门槛上
Karpathy 录制 nanochat 教学视频时意识到:如果实验的第一步是让学员"从云平台启动一台8×H100的服务器",那么绝大多数人将倒在起跑线上。
算力不平等的根源:
- Google 研究员因拿不到 TPU 配额而离职创业
- 谷歌挽留员工的筹码是——更多 TPU 算力卡
- 代码可以开源,但 H100 不能 fork
真正的 AI 研究不只是看懂代码,还得能跑通实验、复现结果。如果每次实验的前提都是拿到一组昂贵且不稳定的 GPU,那么开源的平等就会被算力的不平等重新抵消。
四、国内开发者的双重压力
- 某云 H100 排期已到 2027 年第一季度
- 高端卡获取仍受政策影响,国产算力替代正在加速
- CUDA 体系切换的工程成本真实存在:适配层、代码改动、调试周期
算力底盘从来不是宏大叙事,而是非常具体的体验——实例能不能启动、价格扛不扛得住、实验结果能不能复现。
结论
今天 AI 圈真正稀缺的,也许不是最新的芯片,而是普通人能稳定拿到、马上用起来、跑出结果的有效算力。算力正在从基础设施变成一种筛选机制——筛掉没有预算、没有配额、没有长期合同的群体,这才是 AI 民主化最尴尬的现实。