2026世界杯滚球体育中国官网硅谷深陷算力荒：H200今夜加价30%，H100抢到缺货，Karpathy也未能避免

发布日期：2026-05-24 09:34 来源：未知作者：admin 浏览次数：

作家｜四月

2026 年 5 月的硅谷，关于 AI 算力的“饥馑”和心焦，正达到一个前所未有的高度。

哪怕那些站在算力中心的东说念主，也不得不开动为算力列队。

在英伟达，认真应用深度学习谈论团队的 Bryan Catanzaro 找黄仁勋肯求训诫卡。最近大家一直衔恨卡不够用，受限太多。

“不好酷好，那些卡也曾卖掉了”，这是老黄给出的回话。

Catanzaro 是英伟达的大元勋。十多年前，恰是他钟情到，GPU 迎来了首批 AI 买家——谈论员，且简直荒诞扫货。基于这个细察，老黄才下定决心把整间公司押注 AI 赛说念。

当年帮英伟达赌对算力卡的东说念主，现时却买不到自家的 GPU 了。

而比“卖铲子的没铲子了”更戏剧性的事，还发生在谷歌。

客岁夏天，DeepMind 的谈论员 Andrew Dai 判断，视觉推理是个值得作念的认识。于是向公司里面提了一批 TPU 的资源需求。

张开剩余93%

但肯求迟迟未批。拒却的原理，倒不是谈论认识不够好，而是技俩不可为下一代的 Gemini 管事。其时的里面原则是，资源应该优先流向付费客户和旗舰模子。

“在谷歌里面，每一块 TPU 的背后，齐有三位竞争者”，华盛顿大学策画机系的荣誉教授 Oren Etzioni 聊到。本质很雕悍，若是你的技俩不可径直带来收入，你即是在和付费客户抢资源。

Dai 最终领受下野创业。和他作念出雷同领受的，还有 Anna Goldie。

酷好的是，谷歌用来遮挽 Goldie 的筹码不是加薪，也不是期权，而是——更多的 TPU 算力卡。

但 Goldie 照旧走了，还拿到了 3.35 亿好意思元的融资，“这笔钱能买到的算力，和当初 DeepMind 遮挽我开出的条目，简直十分。”

当大厂围墙内的算力造成一种“组织权限”，出走就成了独一解。

而在围墙除外，沉寂开辟者和谈论员面对的，是比“GPU 短缺”更难的处境：连卡齐租不到。

这事也曾垂死到什么历程了呢？

这两天，AI 大神 Andrej Karpathy 齐忍不住发帖吐槽。他暗示，在录制 nanochat 教学视频时，才一忽儿刚烈到，若是实验的第一步是，让学员“从云平台览动一台 8×H100 的管事器”，那么绝大部分东说念主将倒在起跑线上。

有大神出来喊话，驳斥区速即造成大型比惨现场。

1H100 抢不到，H200 今夜加价 30%

看这话问得，显著是本身盟军无疑了。

有东说念主补刀，188bet体育app中国官网其实确实的第一步，还不是启动 Server，而是求爷爷告奶奶等 quota approval。现时大大宗的凡俗用户，是连 8×H100 的预审批权限齐莫得的。

更有开辟者径直晒后台截图：RunPod 上多种 GPU 型号清晰 unavailable；Azure 上 H100 编造机启动失败，教唆 capacity 不及；Google Colab 领受 GPU 后，被系统自动降档到 G4。

Rohan Bansal 看着账户里仅存的两个 H100 实例，发了条推文：“holding on for dear life”。

若是说资源紧缺势必导致价钱上升，尚可意会。但这加价的姿势不免也有些诡异。

闲居的逻辑是，新一代出来，旧款降价。B200 也曾踏实供货，四年前的 H100 也理当降价。

现货市集更夸张，lambda 的报价已上浮到 4 好意思元 +/ 小时，是两年前的两倍。而 H200 的现货价钱以至比新一代 B200 还要贵。"这价钱是两年前的两倍还多，并且持续很难抢到，要写剧本盯着 API 才有契机。"

图注：从 4.96 好意思元 / 小时涨到 6.40 好意思元 / 小时，涨幅 29%；而更新一代的 B200 为 5.68 好意思元 /GPU 小时。

25% 的诈欺率和 B200 的倒挂

一边是高端 GPU 紧缺，一边却是算力中心里的诈欺率低得令东说念主发指。

Cast AI 的阐昭彰示，不少大企业 GPU 集群的平均诈欺率唯有 5% 傍边。此前，马斯克的兆瓦级算力中心 Colossus 的 MFU（模子算力诈欺率）仅为 11% 傍边。

其实并不是企业刚烈到不到算力资源的浪费，而是不敢戒指。

列队几个月，云厂商销售一忽儿打电话：“你要的卡现时只剩 36 张了，只可签一年的长约。不要的话，2026世界杯滚球体育中国官网后头还有五家列队等着呢。”

这时候，问题也曾不是“公司是否需要租用这样长技巧的芯片”，而是“我敢不敢错过这笔订单”。

先签下来，哪怕闲置也不开释，因为交出去的算力卡可能就再也拿不追思了。

芯片不仅仅产能短缺，更是流动性短缺：它卡在企业的算力长约里，困在云厂商的容量池里，但即是不在凡俗开辟者今晚能点开购买的页面上。

短缺制造畏俱，畏俱制造囤积，囤积制造更深的短缺。

而这种流动性的劳苦，也放大了另一个结构性问题：为什么偏巧是 H100/H200 被推上了天价，以至比新一代 B200 还贵？

ag最新app下载官方网站

因为算力市集从来不是按“谁更新”来订价，而是按“谁更好用、更好接入”来订价的。

往日大家抢 GPU，念念象中的场景是巨头训诫下一代大模子，固然要追求极致先进。但现时，销耗 GPU 的地点变多了：推理管事、代码 Agent、RL 后训诫、自动评测、小模子复现、教学实验，齐在执续吃算力。

关于这些海量需求来说，B200 代表的下一代性能上限并不是首选。

作念工程的东说念主最懂：起初进不等于最佳用，真刚巧钱的是细目性。

H100/H200 奢靡强，且生态奢靡闇练。你用 H100 跑，别东说念主的 benchmark 亦然 H100；你用 H200 作念推理，调参教授也曾有东说念主踩过坑。

比拟之下，新一代芯片再强，也需要技巧消化到框架、集群、转机和老本模子里。

训诫市集还没透顶切到 Blackwell，推理和后训诫市集又把需求重重复加上来。旧卡本该退场，却因为“细目性”成了刚需。

3AI 民主化，卡在了算力门槛上

这一轮的芯片荒，和往日还不太一样。

往日聊缺芯，是顶级 AI Lab 的武备竞赛，巨头谁抢到更多 GPU，谁就能训诫更大模子。但这一次，心焦正在往下千里。

Karpathy 录教程要先计议开辟者能不可拿到 8×H100；LocalLLaMA 社区接头能不可用腹地 Mac 硬跑；高校谈论员缅念念拿不到算力，小团队缅念念扩容被大客户挤掉。

这背后也曾不是“我要训诫 GPT-5”的贪念，而是一个更朴素的问题：我仅仅念念复现一个实验，为什么第一步就造成抢算力了？

AI 开源这几年如实裁减了许多门槛。模子权重不错下载，代码不错 fork。但算力把另一扇门关上了。

代码不错开源，但 H100 不可 fork。

确实的 AI 谈论从来不仅仅看懂代码，还得你能跑通实验、复现效果，调参、失败，以及好屡次的再重来。

若是每次实验的前提，齐是拿到一组不菲且不踏实的 GPU，那么开源的对等，就会被算力的不对等从头对消。

从 Google 谈论员下野创业，到英伟达里面争 GPU，然后是 Karpathy 的教学视频卡在 8 张 H100，它们指向并吞件事：算力正在从基础门径，造成一种筛选机制。

它筛掉的无意是莫得念念法的东说念主，而是莫得预算、莫得配额资源、莫得永久条约的群体。

这才是 AI 民主化最狼狈的本质：模子越来越灵通，但能跑起来的东说念主，可能并莫得变多。

4国内开辟者的痛：过渡期的双重压力

把视野拉归国内，若是说国际开辟者是在闇练生态里抢 H100/H200 现货；那么国内开辟者面对的，则是过渡期的多重压力锻练，要在新的算力结构里找"能用且好用"的解法。

某云 H100 排期已到 2027 年第一季度，更多的云平台雷同靠近高端卡供应瓶颈，"有钱也租不到"是确实的用户响应。

与此同期，高端卡的赢得仍然受策略影响，固然国产算力替代正在加快。但从 CUDA 体系切换的工程老本是确实存在的，适配层、代码改变、调试周期，对小团队而言不是简易的迁徙。

其实，大家底层的处境不尽疏浚。算力底座从来不是一个纷乱词，而是曲常具体的体验——实例能不可启动，价钱扛不扛得住，实验效果能不可复现。

今天 AI 圈确实稀缺的，也许不是最新的芯片，而是凡俗东说念主能踏实拿到、立时用起来、跑出效果的有用算力。

参考聚首：

Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power（https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/）

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index（https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity）

FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing（ https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing ）

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance（ https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance ）

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index（https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity）

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance（ https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance ）

声明：本文为 AI 前方原创，不代表平台不雅点2026世界杯滚球体育中国官网，未经许可不容转载。

发布于：北京市

上一篇：上一篇：滚球体育app2026世界杯官方版下载口碑可以的AI数字东说念主品牌企业的团队实力

下一篇：下一篇：2026世界杯滚球体育中国官网别被“抽奖”忽悠瘸了：一份违反消费目的PUA的硬核生计指南

2026世界杯滚球app

2026世界杯滚球体育中国官网 硅谷深陷算力荒：H200今夜加价30%，H100抢到缺货，Karpathy也未能避免

2026世界杯滚球体育中国官网硅谷深陷算力荒：H200今夜加价30%，H100抢到缺货，Karpathy也未能避免