·

2026世界杯滚球app

2026世界杯滚球APP

2026世界杯滚球体育中国官网 硅谷深陷算力荒:H200今夜加价30%,H100抢到缺货,Karpathy也未能避免

发布日期:2026-05-24 09:34 来源:未知 作者:admin 浏览次数:

2026世界杯滚球体育中国官网 硅谷深陷算力荒:H200今夜加价30%,H100抢到缺货,Karpathy也未能避免

作家 | 四月

2026 年 5 月的硅谷,关于 AI 算力的“饥馑”和心焦,正达到一个前所未有的高度。

哪怕那些站在算力中心的东说念主,也不得不开动为算力列队。

在英伟达,认真应用深度学习谈论团队的 Bryan Catanzaro 找黄仁勋肯求训诫卡。最近大家一直衔恨卡不够用,受限太多。

“不好酷好,那些卡也曾卖掉了”,这是老黄给出的回话。

Catanzaro 是英伟达的大元勋。十多年前,恰是他钟情到,GPU 迎来了首批 AI 买家——谈论员,且简直荒诞扫货。基于这个细察,老黄才下定决心把整间公司押注 AI 赛说念。

当年帮英伟达赌对算力卡的东说念主,现时却买不到自家的 GPU 了。

而比“卖铲子的没铲子了”更戏剧性的事,还发生在谷歌。

客岁夏天,DeepMind 的谈论员 Andrew Dai 判断,视觉推理是个值得作念的认识。于是向公司里面提了一批 TPU 的资源需求。

张开剩余93%

但肯求迟迟未批。拒却的原理,倒不是谈论认识不够好,而是技俩不可为下一代的 Gemini 管事。其时的里面原则是,资源应该优先流向付费客户和旗舰模子。

“在谷歌里面,每一块 TPU 的背后,齐有三位竞争者”,华盛顿大学策画机系的荣誉教授 Oren Etzioni 聊到。本质很雕悍,若是你的技俩不可径直带来收入,你即是在和付费客户抢资源。

Dai 最终领受下野创业。和他作念出雷同领受的,还有 Anna Goldie。

酷好的是,谷歌用来遮挽 Goldie 的筹码不是加薪,也不是期权,而是——更多的 TPU 算力卡。

但 Goldie 照旧走了,还拿到了 3.35 亿好意思元的融资,“这笔钱能买到的算力,和当初 DeepMind 遮挽我开出的条目,简直十分。”

当大厂围墙内的算力造成一种“组织权限”,出走就成了独一解。

而在围墙除外,沉寂开辟者和谈论员面对的,是比“GPU 短缺”更难的处境:连卡齐租不到。

这事也曾垂死到什么历程了呢?

这两天,AI 大神 Andrej Karpathy 齐忍不住发帖吐槽。他暗示,在录制 nanochat 教学视频时,才一忽儿刚烈到,若是实验的第一步是,让学员“从云平台览动一台 8×H100 的管事器”,那么绝大部分东说念主将倒在起跑线上。

有大神出来喊话,驳斥区速即造成大型比惨现场。

1H100 抢不到,H200 今夜加价 30%

看这话问得,显著是本身盟军无疑了。

有东说念主补刀,188bet体育app中国官网其实确实的第一步,还不是启动 Server,而是求爷爷告奶奶等 quota approval。 现时大大宗的凡俗用户,是连 8×H100 的预审批权限齐莫得的。

更有开辟者径直晒后台截图:RunPod 上多种 GPU 型号清晰 unavailable;Azure 上 H100 编造机启动失败,教唆 capacity 不及;Google Colab 领受 GPU 后,被系统自动降档到 G4。

Rohan Bansal 看着账户里仅存的两个 H100 实例,发了条推文:“holding on for dear life”。

若是说资源紧缺势必导致价钱上升,尚可意会。但这加价的姿势不免也有些诡异。

闲居的逻辑是,新一代出来,旧款降价。B200 也曾踏实供货,四年前的 H100 也理当降价。

现货市集更夸张,lambda 的报价已上浮到 4 好意思元 +/ 小时,是两年前的两倍。而 H200 的现货价钱以至比新一代 B200 还要贵。"这价钱是两年前的两倍还多,并且持续很难抢到,要写剧本盯着 API 才有契机。"

图注:从 4.96 好意思元 / 小时涨到 6.40 好意思元 / 小时,涨幅 29%;而更新一代的 B200 为 5.68 好意思元 /GPU 小时。

25% 的诈欺率和 B200 的倒挂

一边是高端 GPU 紧缺,一边却是算力中心里的诈欺率低得令东说念主发指。

Cast AI 的阐昭彰示,不少大企业 GPU 集群的平均诈欺率唯有 5% 傍边。此前,马斯克的兆瓦级算力中心 Colossus 的 MFU(模子算力诈欺率)仅为 11% 傍边。

其实并不是企业刚烈到不到算力资源的浪费,而是不敢戒指。

列队几个月,云厂商销售一忽儿打电话:“你要的卡现时只剩 36 张了,只可签一年的长约。不要的话,2026世界杯滚球体育中国官网后头还有五家列队等着呢。”

这时候,问题也曾不是“公司是否需要租用这样长技巧的芯片”,而是“我敢不敢错过这笔订单”。

先签下来,哪怕闲置也不开释,因为交出去的算力卡可能就再也拿不追思了。

芯片不仅仅产能短缺,更是流动性短缺:它卡在企业的算力长约里,困在云厂商的容量池里,但即是不在凡俗开辟者今晚能点开购买的页面上。

短缺制造畏俱,畏俱制造囤积,囤积制造更深的短缺。

而这种流动性的劳苦,也放大了另一个结构性问题:为什么偏巧是 H100/H200 被推上了天价,以至比新一代 B200 还贵?

ag最新app下载官方网站

因为算力市集从来不是按“谁更新”来订价,而是按“谁更好用、更好接入”来订价的。

往日大家抢 GPU,念念象中的场景是巨头训诫下一代大模子,固然要追求极致先进。但现时,销耗 GPU 的地点变多了:推理管事、代码 Agent、RL 后训诫、自动评测、小模子复现、教学实验,齐在执续吃算力。

关于这些海量需求来说,B200 代表的下一代性能上限并不是首选。

作念工程的东说念主最懂:起初进不等于最佳用,真刚巧钱的是细目性。

H100/H200 奢靡强,且生态奢靡闇练。你用 H100 跑,别东说念主的 benchmark 亦然 H100;你用 H200 作念推理,调参教授也曾有东说念主踩过坑。

比拟之下,新一代芯片再强,也需要技巧消化到框架、集群、转机和老本模子里。

训诫市集还没透顶切到 Blackwell,推理和后训诫市集又把需求重重复加上来。旧卡本该退场,却因为“细目性”成了刚需。

3AI 民主化,卡在了算力门槛上

这一轮的芯片荒,和往日还不太一样。

往日聊缺芯,是顶级 AI Lab 的武备竞赛,巨头谁抢到更多 GPU,谁就能训诫更大模子。但这一次,心焦正在往下千里。

Karpathy 录教程要先计议开辟者能不可拿到 8×H100;LocalLLaMA 社区接头能不可用腹地 Mac 硬跑;高校谈论员缅念念拿不到算力,小团队缅念念扩容被大客户挤掉。

这背后也曾不是“我要训诫 GPT-5”的贪念,而是一个更朴素的问题:我仅仅念念复现一个实验,为什么第一步就造成抢算力了?

AI 开源这几年如实裁减了许多门槛。模子权重不错下载,代码不错 fork。但算力把另一扇门关上了。

代码不错开源,但 H100 不可 fork。

确实的 AI 谈论从来不仅仅看懂代码,还得你能跑通实验、复现效果,调参、失败,以及好屡次的再重来。

若是每次实验的前提,齐是拿到一组不菲且不踏实的 GPU,那么开源的对等,就会被算力的不对等从头对消。

从 Google 谈论员下野创业,到英伟达里面争 GPU,然后是 Karpathy 的教学视频卡在 8 张 H100,它们指向并吞件事:算力正在从基础门径,造成一种筛选机制。

它筛掉的无意是莫得念念法的东说念主,而是莫得预算、莫得配额资源、莫得永久条约的群体。

这才是 AI 民主化最狼狈的本质:模子越来越灵通,但能跑起来的东说念主,可能并莫得变多。

4国内开辟者的痛:过渡期的双重压力

把视野拉归国内,若是说国际开辟者是在闇练生态里抢 H100/H200 现货;那么国内开辟者面对的,则是过渡期的多重压力锻练,要在新的算力结构里找"能用且好用"的解法。

某云 H100 排期已到 2027 年第一季度,更多的云平台雷同靠近高端卡供应瓶颈,"有钱也租不到"是确实的用户响应。

与此同期,高端卡的赢得仍然受策略影响,固然国产算力替代正在加快。但从 CUDA 体系切换的工程老本是确实存在的,适配层、代码改变、调试周期,对小团队而言不是简易的迁徙。

其实,大家底层的处境不尽疏浚。算力底座从来不是一个纷乱词,而是曲常具体的体验——实例能不可启动,价钱扛不扛得住,实验效果能不可复现。

今天 AI 圈确实稀缺的,也许不是最新的芯片,而是凡俗东说念主能踏实拿到、立时用起来、跑出效果的有用算力。

参考聚首:

Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing( https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing )

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance( https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance )

Even Nvidia’s own research teams can’t get enough GPUs amid the race for AI computing power(https://fortune.com/2026/04/09/nvidia-gpu-shortage-impacts-even-nvidias-own-research-teams-bryan-catanzaro-eye-on-ai/)

The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index(https://newsletter.semianalysis.com/p/the-great-gpu-shortage-rental-capacity)

FOMO is why enterprises pay for GPUs they don't use — and why prices keep climbing( https://venturebeat.com/infrastructure/fomo-is-why-enterprises-pay-for-gpus-they-dont-use-and-why-prices-keep-climbing )

https://semianalysis.com/gpu-pricing-index/

Nvidia A100 vs H100 vs B200 GPU Rental Price and Performance( https://ornn.com/insights/nvidia-a100-vs-h100-vs-b200-gpu-rental-price-and-performance )

声明:本文为 AI 前方原创,不代表平台不雅点2026世界杯滚球体育中国官网,未经许可不容转载。

发布于:北京市