九游体育(NineGameSports)官网 AI数据中心, 投资崩溃点在何处?


本文将基于GPU、HBM和电力成本,反向推算出“东谈主工智能数据中心投资的崩溃点”。
对东谈主工智能数据中心的投资昭彰已达到前所未有的水平。微软、谷歌、亚马逊和Meta等超大规模数据中心巨头竞相每年投资数千亿好意思元。据TrendForce预测,到2026年,这四大超大规模数据中心巨头的总投资额将高达7550亿好意思元(图1)。按1好意思元兑160日元的汇率计较,这很是于约120.8万亿日元,卓越了日本2025财年的国度预算(一般账户预算总数约为115万亿日元,数据来源:日本财务省)。

图1:前 4 大超大规模数据中心运营商对数据中心的随性成本投资
之是以需要如斯多量的投资,是因为东谈主工智能做事器中使用的AI半导体价钱飞涨。以率先的AI半导体制造商NVIDIA的GPU为例,其目下的旗舰架构“Blackwell”中,单颗“B200”GPU的价钱在500万至800万日元之间,一台配备8颗B200 GPU的“DGX B200”做事器的价钱在4000万至7000万日元之间,而基于该做事器的AI机架的价钱则高达数亿至10亿日元(图2)。由于构建AI数据中心需要多量部署这些AI机架,因此每个超大规模数据中心运营商的投资额齐卓越1000亿至2000亿好意思元。

图2:NVIDIA GPU AI 做事器和数据中心(Hopper、Blackwell、Rubin)的订价结构
然则,这也曾超出了“增长投资”一词所能评释注解的规模,而更像是“为了竞争而进行的军事开垦”。
在这种情况下,有一个很少被径直磋议的枢纽问题:“这项投资真的不错收回成本吗?”诚然东谈主工智能飞扬强调的是强壮的需乞降技能翻新,但关于成本密集型行业来说,最终的问题是投资能否收回成本。
本文将东谈主工智能数据中心的成本结构说明为三个要素:GPU、宽带内存(HBM)和电力。此外,本文垄断微软和谷歌公开的实践数据,对面前东谈主工智能投资的收入结构进行了定量分析。基于此分析,本文试图估算“崩溃线”,即投资无法收回的临界点。
请端庄,分内析侧重于GPU基础步调按小时计费带来的直继承入,并不包括东谈主工智能带来的曲折收入(举例搜索告白质地擢升或SaaS价值加多)。阅读本文时,请记起这少许。
通达天窗说亮话地说,好意思国超大规模数据中心运营商在东谈主工智能数据中心看似随性的投资很可能也曾注定失败。借用动漫《北斗神拳》中健次郎的一句名言:“你也曾死了。”
从微软和谷歌的案例看投资规模的现实
图3以量化形态展示了微软和谷歌的实践投资规模。基于这些数据,它充分评释了微软和谷歌(Alphabet 的子公司)在数据中心规模的投资规模之遍及令东谈主防备。

图3:微软和谷歌的实践投资规模
微软的案例
字据微软2025财年年度呈报,成本开销(不包括固定钞票和开垦)瞻望将达到645亿好意思元。此外,该公司暗意,投资(主要用于东谈主工智能基础步调)瞻望将卓越800亿好意思元。
与微软云业务1680亿好意思元的营收比较,成本开销约占营收的38%,或字据公司声明约为48%。经常情况下,在自若的基础步调业务中,成本开销很少卓越营收的30%,因此这一比例极其陌生。
更庞大的是,折旧用度已达220亿好意思元。这意味着当年的投资职守也曾脱手影响公司的损益,况兼这种职守在畴昔几年可能会持续加多。此外,如上图1所示,微软2026年的成本开销瞻望将达到1900亿好意思元,约为上年的2.4倍。因此,微软的利润和亏空瞻望将大幅下降。
谷歌的案例
与此同期,谷歌母公司Alphabet正在进行更大规模的投资。其2025年的成本开销达到914亿好意思元,其中大部分将用于做事器和数据中心等技能基础步调。比较之下,谷歌云的年收入约为588亿好意思元,买卖利润约为139亿好意思元。
天然,这914亿好意思元的成本开销不仅复旧云计较业务,也复旧公司范围内的基础步调,举例搜索引擎和东谈主工智能相关平台。然则,即使其中一半用于云计较做事,也仍然高达约457亿好意思元,约占云计较销售额的80%,约为买卖利润的3.3倍。即便琢磨到这少许,昭彰目下的投资规模与传统的答复模式存在显耀偏差。
此外,与微软肖似,谷歌2026年的合座成本开销瞻望将达到1800亿至1900亿好意思元,约为上一年的2.4至2.5倍。鉴于如斯高的成本开销水平,不难念念象,收回对云计较业务的投资将变得愈加用功。
东谈主工智能数据中心的成本结构
这项多量投资的原因在于东谈主工智能数据中心私有的成本结构。来源,咱们将估算东谈主工智能数据中心的成本结构和商场范围(图4)。

图4:AI 数据中心的成本结构和商场范围
来源,咱们来望望GPU。目下的AI基础步调真的十足依赖于NVIDIA的GPU。举例,H100系统的单价料想在2.5万好意思元到4万好意思元之间,具体价钱取决于成就,而一个包含8个H100的做事器机架价钱将达到约300万好意思元。此外,GB200系列的机架价钱瞻望将高潮至数百万好意思元(约350万好意思元到550万好意思元)。
另一个庞大身分是投资对象不是单个GPU,而是“集群单元”。在目下的AI数据中心,每个集群部署数千到数万个GPU已是司空见惯,单个集群的投资额从数亿好意思元到约7亿好意思元不等。
其次是HBM显存。在H100和GB200芯片中,每个GPU经常配备6到8个HBM堆栈。HBM的单价会字据代数和合约条件而有所不同,但据称HBM3/3E的单价在1000好意思元到1500好意思元之间。因此,每个GPU的HBM成本约为10000好意思元,这在GPU价钱中占了很是大的比例。
更庞大的是供应限度。HBM商场真的十足由三家公司主导:SK海力士、三星电子和好意思光科技。极度是,据称SK海力士在先进HBM商场占有卓越50%的份额。这种供应勾搭度造成了一种扼制价钱下降的结构。
第三,还有功耗问题。东谈主工智能数据中心的功耗比传统云平台高出几个数目级(图5)。举例,H100 的 TDP(注:热规划功耗,指冷却芯片所需的料想最大发烧量)约为 700W,而 GB200 的 TDP 则在 1kW 级别。淌若成就一个包含 10,000 个 GPU 的集群,仅 GPU 本身的功耗就将达到 10MW,加上收集和冷却等其他功耗,总功耗将达到20-30MW。

图5:东谈主工智能数据中心的年度功耗和总成本
回到图5的评释注解,换算成年耗电量,一个20兆瓦的系统需要20兆瓦×24小时×365天≈1.75亿千瓦时/年。假定电价为0.14好意思元/千瓦时,则年电费约为2500万好意思元。实践上,琢磨到冗余成就和冷却损耗,成本达到每年3500万好意思元傍边的情况并不罕有。
因此,GPU(成本开销)、HBM(供应限度)和电力(运营开销)这三个要素齐会跟着规模的扩大呈指数级增长。末端,东谈主工智能基础步调的成本仍然居高不下,况兼似乎很难像当年那样通过规模延长来诽谤成本。
传统的收复模式不成行
传统云基础步调受益于规模经济,这收货于做事器单元成本的握续下降和垄断率的提高。摩尔定律和臆造化技能的向上使得单台做事器大约跟着时候的推移“以更低的成本贬责更多做事”,这为收复模子提供了复旧。然则,东谈主工智能数据中心的情况则天悬地隔。图6展示了其成本结构的前提条件,图 7则展示了基于这些条件计较出的东谈主工智能数据中心收复线。

图6:AI 数据中心收复模子计较的假定

图7:AI 数据中心投资回收期计较
假定启动投资7亿好意思元用于开垦一个领有1万个GPU的集群(包括GPU、做事器、收集和冷却系统),并出于司帐方向将其摊销在5年内,则每年的摊销用度为1.4亿好意思元。加上3500万好意思元的电力成本和3500万好意思元的运营成本(赞佩、东谈主员成本、数据中心房钱等),每年的总成本约为2.1亿好意思元。
由此可知,收复所需的每个GPU 的计费成本不错用以下公式暗意。
所需计费成本= 年度总成本 ÷ (GPU 数目 × 8760 小时 × 平淡运行时候)
假定运行率为70%,2.1亿好意思元 ÷ (10,000 × 8,760 小时 × 0.7) ≈ 约 3.43 好意思元/GPU 小时
换句话说,除非每块GPU在接近恒定的运行条件下每小时至少产生3.43好意思元的收益,不然投资无法收回。这是“下限”,而非“平均值”,淌若垄断率下降,所需的单元成本还会更高。
然则,在实践商场中,生成式东谈主工智能推理的价钱正在速即下降。举例,据报谈,大规模话语模子(LLM)的应用法子编程接口(API)价钱在2023年至2025年间将降至原价的十分之一以下。此外,开源模子的激增进一步加重了价钱竞争。
枢纽在于,尽管API价钱大幅下降,但GPU、HBM和电力成本实践上却在高潮。此时,传统的收复模式已不再可行。东谈主工智能基础步调正在从“规模越大,上风越昭彰”的模式转向“规模越大,固定成本风险越高”的模式。那么,收复会在什么规模下变得不成能呢?让咱们基于微软和谷歌的真正数据来分析收复条件
回收线的现实
正如前文所述,微软每年握续投资600亿至800亿好意思元,而到2025年,其折旧用度已卓越200亿好意思元。淌若微软试图用微软云的运渔利润来支付这220亿好意思元的折旧用度,将会大幅诽谤其云业务的运渔利润率。另一方面,谷歌云业务的运渔利润为139亿好意思元,九游体育(NineGameSports)官方网站而其仅云业务的成本开销就高达约457亿好意思元,这意味着即使按单年计较,其投资额也卓越了运渔利润的三倍。
这标明存在结构性问题。东谈主工智能基础步调必须保握极高的投资答复率才能盈利。然则,现实情况是,东谈主工智能做事的价钱正不才降,GPU和HBM的成本仍然很高,而电力成本却在上升。
在上述三个身分同期作用的环境下,投资回收的条件会速即恶化。不错说,面前的AI投资也曾参预了一种结构性逆境:除非同期终了极高的垄断率和极高的单价,不然很难收回投资。
投资为何仍需持续
那么,这种对成本开垦的随性投资会放缓吗?谜底是抵赖的。
微软剩余践约义务约为3680亿好意思元,标明商场需求仍然卓越供应。谷歌也明确暗意,策划进一步扩大成本开销,以自满东谈主工智能和云计较的需求。枢纽在于,这两家公司齐不是因为预期大约收回投资才进行投资的。相悖,它们是被动持续投资的,因为罢手投资就意味着在竞争中过期。
面前的东谈主工智能投资也曾从追求利润最大化治愈为发愤幸免失败。咱们应该将东谈主工智能投资视为也曾参预“陡然战”阶段,而非“增长”阶段。
开云kaiyun体育app登录入口惟一这种结构握续下去,东谈主工智能飞扬就会持续延长,但其里面会集合一种无法调停的风险神色的“诬蔑”。这种诬蔑会在某个节点倏得泄闪现来。这等于下一章将要进展的“崩溃线”。
探索崩溃线
如上所述,判断东谈主工智能投资的可握续性不仅需要琢磨GPU的数目,还需要琢磨HBM、电力以及统共电力基础步调。本文将以一个领有10000个GPU的集群为例,定量地展示投资回收在何种规模下将变得不成能——即所谓的“崩溃线”。
从GPU数目倒推,HBM和功耗按如下形态加多:
来源,咱们假定一个由10,000 个 GPU 构成的集群。图8娇傲了每个集群所需的年功耗以及所需的等效核电站数目。

图8:故障线所需功耗的物理规模
假定每个GPU配备8个HBM堆栈,则所需的HBM总量将达到80,000个堆栈。每个堆栈24GB,共计约为1.92PB。此外,就功耗而言,假定每个GPU的功耗为1kW,而统共步调(包括冷却、变电站和收集负载)的功耗约为其两倍,则一个领有10,000个GPU的集群的步调负载约为20MW。
年耗电量约为175.2吉瓦时(GWh),除以一座1吉瓦级核电站以90%负荷运行的年发电量,很是于约0.022座反馈堆的发电量。反过来说,这意味着一座核电站只可自满约45个地方的用电需求,淌若东谈主工智能集群大规模延长,不新建核电站将无法自满需求。
收歇线的界说
如上所述,假定一个领有10,000个GPU的集群,启动投资7亿好意思元,分5年摊销,年运营成本3500万好意思元,年电力成本约为3500万好意思元,则年度总成本约为2.1亿好意思元。在这种情况下,盈亏均衡条件不错用第三章中刻画的以下公式暗意。
所需计费成本= 年度总成本 ÷ (GPU 数目 × 24 小时 × 365 天 × 平淡运行时候)
假定垄断率为70%,则每 GPU 小时的计费成本约为 3.43 好意思元。本文将此称为“临界点”。换句话说,一朝 AI 做事价钱低于此水平,或者垄断率低于此假定值,投资就无法收回成本。
需要端庄的是,出于司帐方向而弃取的5年摊销期相关于NVIDIA GPU的技能周期(经常每两年傍边更新换代一次)而言是一个较为乐不雅的假定。在后文所述的崩溃气象③中,咱们将分析这种裁汰的摊销期对收入结构的影响。
崩溃倏得发生
在典型的基础设履行业中,利润率会逐步下降。然则,在固定成本极高的AI数据中心,一朝利润率低于某个水平,盈利才智就会速即恶化,原因有以下三点。
第一,GPU 和 HBM 的启动投资巨大且固定。
第二,电力和冷却负荷很高,况兼隐敝易诽谤。
第三,另一方面,由于竞争,所需的计费单元价钱(商场价钱)将会下降。
因此,东谈主工智能投资的恶化进程并非线性而非线性。换句话说,并非“情况逐步恶化,然后变得愈加用功”,而是“一朝越过某个临界点,损失就会倏得变得巨大”。这等于收歇线的实质。
目下,让咱们定量计较东谈主工智能数据中心发生故障的三种场景。每种场景的共同条件如图9所示。

图9:计较 AI 数据中心故障线的常见条件
三种崩溃气象
图10娇傲了三种故障场景的仿真末端。

图10:东谈主工智能数据中心发生故障的三种场景模拟
第一,软件崩溃。
最有可能出现的情况是东谈主工智能公司之间张开强烈的价钱竞争。淌若计费价钱降至每GPU小时2.90好意思元,垄断率降至65%,则所需计费价钱将高潮至3.69好意思元,导致每年损误期4490万好意思元。然则,如图10所示,诚然现阶段并未出现透顶崩溃,但利润已十足隐藏,投资复苏也悄然走向失败。即使名义需求得以保管,里面成本后果也在急剧下降。
第二,硬件崩溃。
下一个风险是电力、制冷和安设等实践成本的高潮。淌若3好意思元的计费率和55%的垄断率,再加上电价高潮和步调负荷加多,所需的计费率将跃升至4.7好意思元,导致每年约8170万好意思元的损失。图10 娇傲,在此阶段,赤字急剧扩大。这是一个典型的例子,评释基础步调成本而非需求奈何蹂躏盈利才智。
第三,金融崩溃。
最严重的后果是财务上的崩溃。即使计费率为每间3.20好意思元,入住率为60%,由于折旧期裁汰(从5年裁汰到4年)以及8%的成本成本,实践计费率也需达到每间5.73好意思元,导致每年亏空约1.33亿好意思元。因此,如图 10 底行所示,此阶段的损失已达到无法承受的水平(每年 1.33 亿好意思元)。这种情况的实质在于,成本商场在开垦发生物理故障之前就认定该项投资“无法收回”。
失效以“非线性”形态发生
图11娇傲了AI 数据中心垄断率与所需计费成本之间的关系。需要端庄的是,这种关系并非线性关系。

图11:AI 数据中心将出现故障的规模
入住率为70% 时,所需单元成本约为 3.43 好意思元;但当入住率降至 60% 时,所需单元成本将上升至近 4 好意思元;淌若入住率进一步降至 50%,所需单元成本将跃升至近 5 好意思元。
图11 所示的“崩溃区域”直不雅地展示了这种非线性关系。商场价钱区间(2.5 至 3.0 好意思元:基于 AWS、Azure、Lambda Labs 等平台的 H100/H200 小时费率范围)也曾跌入该区域深处,目下的 AI 做事价钱很可能已从结构上低于盈亏均衡点。
功耗限度:东谈主工智能是一个国度基础步调问题
更庞大的是,东谈主工智能投资的规模化径直依赖于电力基础步调。如图12所示,10,000 个 GPU 大致需要 20 兆瓦 (MW) 的电力,100,000 个 GPU 需要 200 兆瓦 (MW) 的电力,而 1,000,000 个 GPU 则需要 2,000 兆瓦 (MW)(= 2 吉瓦 (GW))。这意味着不仅需要扩建数据中心,还需要扩建电力供应基础步调本身。

图12:功耗从 10,000 个 GPU 到 100,000 个 GPU 再到 1,000,000 个 GPU 急剧加多
淌若咱们把这些电力调动为核能:
10,000 个 GPU 的集群:0.02 个单元
100,000 GPU 集群:0.2 个单元
百万GPU集群:2.2个单元
东谈主工智能投资的延长昭彰等同于电力基础步调的延长。东谈主工智能数据中心不再只是是IT行业的问题,而是也曾演变为波及电力、地皮和开垦才智的“国度供给才智问题”。
东谈主工智能投资面对的“崩溃”
目下对东谈主工智能数据中心的投资不仅无利可图,况兼在物理上也难以握续。商场价钱下落、垄断率下降、电力成本高潮或成本商场收紧——哪怕其中任何一个身分齐可能立即导致数据中心崩溃到临界点。况兼,这种崩溃不会逐步发生,而是在跨越某个临界点后倏得爆发。这不再只是是半导体行业的问题,而是关乎国度电力供应才智的问题。
2026年4月3日,日本首相高市早苗会见了好意思国大型超大规模数据中心运营商微软总裁布拉德·史小姐,并对该公司在日本数据中心投资约100亿好意思元暗意接待。然则,正如本文所示,此类投资不仅无利可图,况兼耗电量巨大,其结构还会给国度基础步调带来职守。在东谈主工智能飞扬的背后,有必要从容地评估日本将要付出的代价规模。
*声明:本文系原作家创作。著作内容系其个东谈主不雅点,本身转载仅为共享与磋议,不代表本身吟唱或招供,如有异议,请关系后台。
念念要赢得半导体产业的前沿洞见、技能速递、趋势领悟九游体育(NineGameSports)官网,怜惜咱们!