
[文/不雅察者网专栏作家唐晓甫]
最近,AIAgent(AI智能体/助理/助手)成为一个特地热点的话题。作为一个历久追踪AI发展、但一经健忘怎么编程的东谈主,我也在一直追逐前沿动态,试图愈加高效地学习使用AIAgent,拓展我方的智力范畴。
于是继5月份,我和AI一皆从零运行,低效手搓出一个功能不全的通俗版Agent后,我把眼神投向了一经颇具限制的锻练Agent,选拔了一又友推选的新兴开源Agent——Hermes,然后将API(应用法子编程接口)遴选为我的老一又友DeepSeek。
天然,开了高权限的Agent聪颖的事情确乎特地多,不仅能和你搞出聊天bot、相对高成果地编程、对好多参数配置进行一句话修改,还能模拟键鼠绕过传统的反爬虫法子,读取不少东西。天然这个经过也并非一帆风顺,也会出现改错东西致使软件崩溃的情况,举例我在修改bot参数的时候,Agent会巧合篡改蓝本的API信息、况且没事就切换输入法繁简体,还挺窘态的。
令东谈主惊奇的廉价
只不外最让我巧合的照旧DeepSeek,由于我本来对编程一经忘得差未几了,土产货也莫得好多编程器用和软件包,每次在调试法子的时候,我给出的教唆词都比拟暗昧,导致精细颐养时浮滥好多词元。于是在一次次约束地为土产货Agent界面功能升级、自动输出skill以及编程的经过中,悄然无声,我的词元破钞量在短期间内达到了相对巨大的数字——4.5亿。

我不太明晰这个数字意味着什么,尤其是我的第一选拔一直是DeepSeek,莫得使用过其他公司的官网API,我并不知谈这背后障翳着中好意思AI大模子最中枢的互异之处。我仅仅稀里隐隐地查了一下账单,发现我四天浮滥4.5亿词元的扫尾是——我只消为此付出35块钱。
到这时,我才倏得思起来,我是不是不错问问ChatGPT,4.5亿词元意味着什么。于是我向ChatGPT建议了这个问题:4.5亿词元是不是好多?然后它给出了答复:

是的,4.5亿词元特地多。直不雅说:
1.内容量级很大
4.5亿词元大要终点于:
英文:约3亿多个英文单词
汉文:可能约3亿到4.5亿个汉字/字符级内容
如若一篇长稿按1万词元算,概况是4.5万篇长稿,如若一册书按10万到20万词元算,概况是2250到4500本书
2.API成本也不小
按OpenAI刻下官方价钱,GPT-5.5圭臬API是输入$5/100万词元,输出$30/100万词元;GPT-5.4mini是输入$0.75/100万词元,输出$4.50/100万词元。是以4.5亿词元=450个“百万词元”。
论断:
4.5亿词元一经不是等闲个东谈主使用量,而是中大型内容处理、批量选录、数据清洗、常识库构建、批量翻译/改写这类样子级用量。
由于ChatGPT的这个答复超出了我的预期,我就问了一下,4亿词元(还不是4.5亿)用好意思国的API要几许钱?谜底再次让我诧异。



把柄ChatGPT、Gemini和Claude的说法,即便在最低廉的情况下,用GPT-5.4nano全输入4亿词元,也要80好意思元。而如若是全输出,最贵的GPT-5.5会收费1.2万好意思元。不错这样说,即便按好意思国主流模子中最低廉的报价贪图,处理4.5亿词元的成本,表面上也会是我此次DeepSeek浮滥举止所花成本的约17.5倍。
然后我思了思,也许是因为我的缓存射中比拟高的原因(DeepSeek亦然出了名的缓存射中高),是以导致收费很低。于是我问了一下,如若缓存射中率达到99%(昭彰泛泛情况下是不行能的),4亿词元我要花几许钱?谜底如下:



咱们不错看到,哪怕是我把缓存射中率提到99%,不管是ChatGPT、Gemini照旧Claude的旗舰大模子的收费圭臬都显贵高于DeepSeek,以至高于DeepSeek几十倍收费依旧是常态。
天然,此次Agent实验经过中,我莫得效什么专门的编程软件,也莫得调用现成的器用库、多内行Agent或者Skill库,莫得效Codex或者ClaudeCode中转CCSwitch畅通DeepSeek,也知谈DeepSeek在处理一些问题的时候会特地顽皮且破钞词元,是以我此次仅仅单纯比拟词元的价钱。
也许有东谈主以为这样单纯追求廉价真谛有限。因为在AI狂飙突进的叙事下,似乎极致的性能才是一切的中枢,谁能率先已毕AGI,谁就能拿到怒放下一个时间的钥匙,然后在通宵之间带来坐褥力的飞升和好意思丽的进化,是以一切高参加都是值得的。
这里咱们先抛开DeepSeekV4Pro自己的Agent性能,以及国东谈主是否不错围绕DeepSeek等国产大模子创造更高效的VibeCoding生态等问题不谈,而是愈加精致地从价钱和财务的角度留情2026年上半年的AI生态,就会发现,所谓“一切高参加都是值得的”之类的论断似乎太果决了。
好意思国公司也无法承受越来越长的好意思国AI账单了
一些不太留情AI的一又友可能会产生这样的印象:即便少见据标明中国模子的性价比远高于好意思国家具——举例,东谈主工智能基准测试公司ArtificialAnalysis在相易10项评估中对比各实验室最强模子后发现,Anthropic的Claude成本高达4811好意思元,OpenAI的ChatGPT为3357好意思元,而DeepSeek仅需1071好意思元,Kimi为948好意思元,智谱的GLM更是低至544好意思元,Claude的成本险些是其中最低廉的中国决策的九倍。
同期,中国模子的调用词元数目已阶段性位居全国第一,把柄OpenRouter数据,3月底至4月初中国模子的词元调用占比一度接近48%,况且在2026年4月以来的大多数周中都逾越了好意思国模子,单周调用量以至一度达到好意思国模子的4.28倍。
尽管如斯,咱们一般照旧会默许,好意思国公司不仅会将业务留给好意思国AI大模子,而且好意思国巨头们对于AI词元的需求,至少目下是近乎无上限的。关联词事实上,咱们错了,而且大错特错。
最初,好意思国公司目下也在大限制行使中国的AI大模子。不仅用得多,以至还直连官网。这里咱们不错望望有名财务自动化平台与企业开销贬责软件Ramp对于DeepSeek的两篇报谈。第一篇是发布于2025年3月7日的《ArebusinessesactuallyusingDeepSeek?》,里面提到,把柄其企业支付数据估算,甩掉2025年1月底,一度有0.3%的好意思国企业使用过DeepSeek。

关联词在6月3日发布的《TopSaaSVendorsonRamp(June2026)》中,Ramp首席经济学家AraKharazian在文中暗示,DeepSeek在当月登上Ramp“trendingsoftwarelist”的榜首。更迫切的是,Ramp迥殊说明,这不是企业自建开源模子的盘曲使用,而是企业正在径直向DeepSeek付款,况且通过DeepSeek径直发送和接管数据。也即是说,诚然莫得给出明确数据,关联词一经有一定比例的好意思国企业运行通过官方API渠谈采购DeepSeek的服务,而不仅仅下载开源权重或通过第三方平台盘曲使用。
开云体育app2026世界杯中国官方下载如若这仅仅袖珍企业运行嫌弃好意思国大模子收费太贵的话,那么另外的一些报谈则可能更值得警惕:好意思国顶级企业运行法则职工对词元的破钞。
5月,好意思媒《华尔街日报》就报谈,不少大公司数月前对AI应用的广宽见地仍是“越多越好”。因此,当模子开发商提供无尽量订阅模式时,部分企业职工便尽可能破钞算力,以说明注解我方紧跟AI高潮。关联词,跟着无尽量订阅模式被按词元收费的模式取代,以及词元的单价飙升后,企业在行使AI方面的开销也将随之大增。
有公司一经评释称自家AI开销增多了一到两倍,而Uber在4个月就一经用已矣AI的全年度预算。Meta、微软、Salesforce等企业的本事阁下也建议新举止,以确保职工使用AI有助于提高坐褥力,或减少部分职工使用特定器用的权限。亚马逊也在5月奉告职工,旗下可用于追踪职工词元破钞情况的“Kirorank”榜单已罢手服务。该榜单的诞生初志是推动AI在业务场景的应用,关联词事与愿违,部分职工为追求更高的名次和绩效,将AI智能体作为不计成本的“烧词元”器用,导致公司算力资源被浮滥。
同期,九游体育(NineGameSports)官网老牌企业也运行法则自家职工对于词元的需求。Walmart也被报谈对里面AI编程器用建立词元数目法则,用来减少重叠性“vibecoding”和阻抑成本。
这股民俗以至延长到了一直在炒作AI需求的华尔街。BusinessInsider报谈称,JPMorgan、毕马威等公司一经建立了追踪职工AI使用机制;其中JPMorgan工程师的AI使用情况会被里面纪录和分类(包括GitHubCopilot、Claude等器用)。
摩根大通的首席数据与分析官在2026年6月初的纽约科技周上公开阐述,部分职工使用大模子产生的词元成本,一经逾越了其个东谈主薪水。作为在群众及北好意思领有巨大投行业务的欧洲最大银行之一,法国巴黎银行CIB的首席AI官在巴黎MistralAI峰会期间暗示,他一经不再把“每天破钞数十亿词元”作为首要方针,而是更景仰推行产出、成果进步和收入影响。
愈加扎心的是,这些被破钞的词元并莫得升沉为坐褥力,把柄初创企业EntelligenceAI集聚的2000多家使用高档AI编程器用公司的数据,发现唯有18%的词元开销升沉为了能够触及委果用户的已录用编码家具。
而这时候,咱们不妨来望望近期的一个例子,《崩坏》系列AINPC&Gameplay本事团队认真东谈主郑星河在2026阿里云峰会上,巧合间表现了里面Agent尝试的成本。团队有个工程师为测试多智能体合作,搭建了几十个AIAgent,莫得建立词元破钞上限就放工离开。扫尾智能体连气儿运行13小时,破钞了价值200万元东谈主民币的词元。他还对共事开打趣说,如若你是一个沉寂游戏开发团队,那一晚上一经歇业了。(200万元东谈主民币都够好多编程小团队一年以上工资了。)

接连出现的成本失控事件,正在迫使统统企业直面AI实验室此前刻意掩饰的中枢问题:这项本事究竟是否充足有效,值得参加这样高的成本?
从创新逻辑看,本事发展本就建立在多量试错的基础上,但当试错自己一经领有极高的成本,以至有拖垮样子的风险时,越来越多企业运行从头臆度这条本事阶梯的合感性。Ramp首席经济学家AraKharazian指出,刻下多量好意思国企业的AI开销一经濒临巨大成本压力;在奋斗词元破钞、远低于预期的投资答复率双重挤压下,不少企业运行主动寻找OpenAI、Anthropic的平价替代决策,而DeepSeek极低的词元订价,恰好给这类尝试和创新提供了低成本试错的空间。
关联词从好意思国政府的角度来看,AI从来不仅仅工程上的问题,也不仅仅金融上的问题,它还波及好意思国的好意思元霸权以及所谓“第四次工业创新”的好意思梦。
好意思国“AI金融学”一经正面际遇了那堵墙
对于好意思国来说,金融端对词元需求的叙事刚巧相背。在好多东谈主的叙事中,好意思国的高品级AI推理是稀缺的、高价的AI硬件是供应不及的、高价词元是不错被企业无尽消化的、高估值是不错由无尽增长的推理需求撑执的,而且即便词元价钱高企,其参加产出终将会扩大,而AI公司也不错靠繁盛的闭源API,历久收割群众企业并得回盈利。
为此,他们试图将词元与“高品级推明智力的计量单元”相挂钩:越复杂的推理、越长的高下文、越多的Agent调用,就越需要高端GPU、数据中心、电力、云服务和闭源模子智力。这个叙事撑执了AI基础设施的广宽成本开支预期。高盛的基准模子估算,AI策划年度成本开支可能从2026年的7650亿好意思元,增长到2031年的1.6万亿好意思元;摩根士丹利也估算,到2028年前后将有近3万亿好意思元AI基础设施投资流入群众经济。
随后通过这种挂钩以及对稀缺算力的把持,好意思国一直试图将算力和好意思元挂钩,从汉典毕新时间好意思元霸权体系的基础,也即是“算力好意思元”。要不是中国也发展出了我方的AI产业链、开源了我方的AI大模子,况且永恒只过期好意思国AI半年到一年的期间,早就运行加快“算力好意思元”体系以偏执至关迫切的算力期货机制开采,而不是拚命地迭代我方的闭源AI体系了。要知谈迭代一次AI,沿着ScalingLaw扩大参数长短常烧钱的。如若莫得背面的追逐,好意思国东谈主全都不错达成一种认识,慢慢收回我方的前期投资之后再鼓动AI大模子的发展。
而目下,好意思国的AI策划成本开支一经达到了一个惊东谈主的地步,把柄2026年6月初的公开财报和投行估算,好意思国AI策划成本开支一经进入“准国度级基建投资”限制:一年7000亿到8000亿好意思元量级,畴昔数年累计数万亿好意思元。阛阓媒体汇总中,四大科技公司Amazon、Microsoft、Alphabet、Meta在2026年悉数成人性开销预估为约7250亿好意思元,较2025年的约4100亿好意思元增长约77%。这一经逾越好多国度一整年的财政开销,也与好意思国的年度国防预算相失色。
把柄公开数据,仅Amazon、Microsoft、Alphabet、Meta四家公司2026年的AI/数据中心策划成本开支,就终点于好意思国全年私东谈主国内总投资的约13%,终点于好意思国全年私东谈主非住宅固定投资的约16%。
这一比例是历史级别的,以至比互联网泡沫末期的比例更大。2000年好意思国信息产业成本开支为1642亿好意思元,占当年有雇员企业成本开支的14.9%;不错说,这是当代好意思国成本主义史上冷落的,以至不错说接近史无先例的纠合式投资波浪。
更有益思意思的是,好意思国M2从2025年4月的21.7757万亿好意思元,上升到2026年4月的22.8045万亿好意思元,一年增多约1.0288万亿好意思元。这意味着,仅四大AI的成本开销即是当年一年好意思国M2增量的70.5%。这说明AI基础设施开采一经成为接纳阛阓流动性、重塑成本配置和撑执高估值叙事的核神思制之一。
好意思国一经AllinAI。
是以好意思国赶快濒临的下一个问题是:好意思国东谈主多久能收回我方的投资?畴昔的流动性还够吗?在中国大模子一经渗入进好意思国公司责任环境的今天,在好意思国成本一经把AI策划成本开支预期打满的今天,在好意思国密歇根大学消费者信心指数创下自1952年造访以来历史新低的今天,在好意思国濒临高通胀、高利率的今天,本轮好意思国的AI产业链以及高卑劣产业链还能烧多久的钱呢?他们确实还能无尽彭胀式(保执高增速)地烧钱吗?以及最迫切的问题,AI算力尤其是推理算力确实缺吗?
至少从我得到的音书看,似乎推理算力(西席算力依旧相对紧缺),群众一经有了短期相对多余趋势。微软CEONadella以至公开承认,刻下瓶颈不是“莫得芯片”,而是莫得充足电力和一经准备好的数据中心外壳,导致部分芯片处于“在库存里但插不上电”的状况。这意味着AI基础设施的管制正在从“买不买得到GPU”,转向“有莫得电、有莫得机房、有莫得冷却、有莫得委果负载把GPU用满”。而CastAI《2026年Kubernetes优化评释》则指出,把柄其对多量未优化Kubernetes集群的分析高傲,GPU平均利用率唯有约5%,CPU平均利用率约8%,内存约20%。
诚然,咱们不错明确,AI细目是畴昔最迫切的发展方针之一,关联词正如经典模子Gartner本事锻练度弧线所展现的那样,咱们脚下正在履历的,似乎是本轮AI产业链从本事萌芽期到交易化考证的阶段。

更要津的是,好意思国经济一经出现了光显的“双层结构”:AI策划成本开支、数据中心开采和高端开采投资仍在高速彭胀,并成为GDP增长和成本阛阓估值的中枢撑执;但在AI以外,传统消费、服务业干事、制造业干事、白领岗亭、利率明锐行业和中小企业部门一经显贵放慢,部分方针呈现阑珊特征。好意思国正在进入一种由AI投资避讳的结构性停滞状况。

咱们不错看一张比拟经典的图片:标普500指数与好意思国休闲率的走势图。传统上,好意思国股市接续会在休闲率见底并运行上行后进入更脆弱阶段,因为干事恶化最终会传导到消费、企业盈利和信用周期。但本轮AI行情中,这一传统联系出现了光显分化:休闲率一经从周期低位抬升至4.3%,但标普500仍处在历史高位隔邻。AI行情暂时把“干事走弱”升沉为“降息预期”,又把“成本开支彭胀”升沉为“盈利增长预期”,从而避讳了传统经济部门的疲弱。
尤其是,在好意思国AI巨头广宽将基于AI发展的裁人视作一种要紧利好的配景下,这种分化正在演形成为本轮AI周期最大的风险:AI叙事必须说明注解我方能够创造充足坐褥率、利润乃至干事;不然两条分化的线条会从头拘谨,但概况率不是以休闲率下落的方法,而是以标普500补跌的方法拘谨。
是以一切又回到了阿谁问题:“好意思国的高品级AI推理是稀缺的,高价的AI硬件是供应不及的,高价词元不错被企业无尽消化,高估值不错由无尽增长的推理需求撑执且即便词元价钱高企,其参加产出终将会扩大,而AI公司也不错靠繁盛闭源API历久收割群众企业并得回盈利。”——这个叙事还能执续吗?
至少在我看来,这个问题很难。因为流动性短期上限正在被锁死,而低廉、性能仅次于好意思国大模子的中国大模子正在蚕食好意思国大模子的盈利预期上限。而且这种样子会让越来越多的东谈主,包括好意思国东谈主也包括广大的第三全国东谈主民,不错围绕着这个低廉但能用的生态孝顺我方的力量,毕竟有句老话:永远不要藐视开源的信仰。
而正如好多网友的说法相同,从好意思国的AI闭源模子角度来看,以DeepSeek为代表的、开源而廉价的中国大模子就像一个淘汰圈,闭源模子跑赢了DeepSeek莫得奖励,关联词跑输了,那就有刑事牵累,刑事牵累的扫尾即是,这个闭源模子会径直隐藏。
九游体育(NineGameSports)官网
Copyright © 1998-2026 九游体育(NineGameSports)官网™版权所有
技术支持:®九游体育(NineGameSports) RSS地图 HTML地图
技术支持:®九游体育(NineGameSports) RSS地图 HTML地图