2026年4月,AI行业正在经历一场集体性清醒。
这个月发生了一连串让开发者夜不能寐的事:腾讯云宣布AI算力相关产品价格统一上调5%,阿里云四天内连发三条涨价公告,智谱完成年内第三次提价,Anthropic将企业级产品从固定订阅转为按算力消耗计费。
而在这些涨价公告背后,更触目惊心的是行业研究机构SemiAnalysis的一组数据:英伟达H100 GPU一年期租赁价格从2025年10月的每GPU每小时1.70美元飙升至2026年3月的2.35美元,半年涨幅接近40%。
新一代Blackwell 8卡服务器的价格则从380万元直接跳升至500万元以上,涨幅达52%。
与此同时,中国日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿,两年间增长超过1400倍。OpenRouter平台数据显示,前十大模型在一周内的Token总调用量已达8.7万亿,算力资源的紧张程度前所未有。
一张已“服役”近四年的老卡不仅没有贬值,反而出现了全线售罄的局面——所有GPU类型的按需租赁容量完全售罄,到2026年8-9月的所有新增产能已被预订一空。
去年那位高调预测“英伟达崩盘”的“大空头”Michael Burry,如今的脸色恐怕不太好看了。但比Burry更需要焦虑的,是那些在这场算力大涨价中默默承受账单的企业们。

故事要从一个反直觉的现象说起。
Michael Burry在2025年11月做空英伟达,逻辑听起来非常合理:GPU生命周期也就2到3年,Blackwell系列已经出来了,谁还会要H100这种“老古董”?
旧卡必然贬值。这套逻辑放在任何一个传统芯片市场都成立——iPhone 15出来了,iPhone 12还值钱吗?
但市场给出了最打脸的回应。
根据SemiAnalysis发布的数据,H100一年期租赁价格在2025年10月见底后,进入2026年涨势显著加速。1月底率先突破2美元/小时/卡关口,2月单月环比涨幅达到15%到20%,到3月末已攀升至2.35美元/小时/卡,较半年前低点暴涨接近四成。
更令人震惊的是,同一时间Oracle等云平台上新一代B200的现货竞价价格高达14美元/小时,B100服务器的整机价格同比上涨了52%。
这背后是一个被大多数分析师低估的根本性变化——AI产业的算力需求结构正在经历一次无声的重构。
如果把2023到2025年看作大模型“训练军备竞赛”的时代,那2026年的关键字已经变成了两个字:推理。
曦望联席CEO王湛在一次访谈中提供了令人信服的数据:虽然训练算力的需求依然保持平稳,但整个2026年,AI推理计算的需求量将达到训练算力需求的4到5倍。
“这是推理算力第一次全面超越训练算力,而且超越得如此迅猛”。从市场反馈来看,2026年已被行业公认为“智能体元年”。随着大模型从“会聊天”进化为“会思考、会执行”的数字员工,推理需求迎来了爆发式增长。
Agent任务的Token消耗量是传统对话的多少倍?40到75倍。每一次智能体执行任务,都需要经历推理→行动→反思的循环,在完成一个任务的过程中会反复执行多次。
阿里云大模型平台的数据更直观:简单任务消耗约5到10次模型调用,复杂任务则需要10到30次以上。Agent场景下,完成一次复杂操作背后都是海量的Token在燃烧。
过去两年计算需求增长了1万倍——这不是AI行业的夸张修辞,是英伟达CEO黄仁勋在公开场合给出的精确数字。
2026年3月,国家数据局局长刘烈宏在中国发展高层论坛年会上透露,中国日均Token调用量已突破140万亿。较2025年底又增长了40%多。
当一个行业的Token消耗量以这种速度狂奔时,供需失衡是数学上的必然。所有GPU类型的按需租赁容量全线售罄,现货市场的供需紧张程度已经到了“H100半年内涨幅达40%,8-9月上线的产能已被预订一空”的地步。
大量2到3年前签署的H100租赁合约正以原价完成续约,部分合约甚至直接续约4年到2028年,只为锁定长期产能。
谁在烧钱,谁在烧不起?既然算力价格全面上涨,那到底谁在为它买单?
要回答这个问题,我们得先理解AI算力产业链的成本结构。
第一层是硬件采购方——租用算力的To B客户。大模型公司和AI应用企业是这一轮涨价中最直接的承压者。字节跳动2026年计划投入1600亿元,其中850亿用于采购AI芯片,750亿用于建设数据中心。
三大互联网巨头的AI基础设施投入合计达到840亿美元,较2025年大幅增长60%,预计将在2027年前完成部署。但疯狂烧钱的结果令人警觉——字节跳动2025年净利润同比暴跌超过70%。腾讯总裁刘炽平透露2025年的AI投入是180亿元,2026年“至少会翻倍”。

但这些巨头还不是最痛的。他们的业务盘子足够大,AI投入可以靠广告、电商、游戏等业务反哺对冲:内部用AI节省下的人力成本远超API直接费用。
字节跳动海外营收增长近50%,海外业务营收占比从2024年的25%上探到三成以上,创下历史新高——海外增长在一定程度上为国内疯狂开支做了托底。
对于它们来说,巨额AI资本支出更像是一场必须参与的“战略防御战”。真正的痛苦不在顶层,而在夹缝中。
第二层是AI应用公司。这才是本轮涨价中最煎熬的一群。如果说科技大厂在“烧钱换未来增长”,那AI应用创业者就是在“烧钱换眼前的用户”——而且烧得越来越疼。
投资经理们现在打开被投企业的账单,描述是“两眼一黑又一黑”。一位投过多家明星应用企业的投资人在交流中直言:“软件有一个算一个,商业模式都跑不通”。
为什么?我们来算一笔真实的账:
目前做Agent产品基本上绕不开Claude系列——在复杂推理和工具调用上,它是目前市场公认表现最好的模型之一。
但Claude Opus 4.6的API定价摆在那里:每百万输入Token 5美元,每百万输出Token 25美元。开启高速推理模式后,输出价格直接跳到每百万Token 150美元,是标准模式的六倍。
一位正在内测的Agent公司创始人在访谈中坦承:单用户的日成本已经达到100到200美元,换算下来,一个用户一个月的后端成本就在3000到6000美元之间。他们不是不想公测——是真的cover不住算力成本。
而进入2026年,整条赛道又向更耗钱的方向迈了一步。主动式Agent不等用户开口,自己去抓信息、判断优先级、在后台完成完整的决策链条。目前的数据是,Agentic应用的Token消耗大约是普通对话的5到30倍。
一家做TikTok视频创意分析的Agent公司,浏览和分析一条视频的成本就接近5美元,一天处理50条的话,光这一项动作就烧掉250美元——还没算后续的创意生成和优化。
他们最大的问题不是功能做不出来——而是“产品每往前推一步,成本就翻几倍”。
视频生成公司的情况同样触目惊心。做视频生成模型的团队,日常做模型迭代测试,哪怕只是测试一个细节改动,“跑一天下来大概要10万人民币”。每一次看起来在往前跳的能力跃升,对应的是成本的又一次累积跳涨。
2025年,创业公司还能融到钱,烧钱换增长的游戏还在转。但进入2026年,当投资人真正打开账单,逐行看清后端的成本结构后,大家发现了一件事:在目前的算力成本结构下,无论软件应用是什么方向,都跑不通良性的经营模型。
据IT桔子数据,2026年第一季度,已有超过10家AI应用初创公司停止运营或转型,样本覆盖约200家纯API创业公司。这不是AI行业的危机,这是商业化的大清算。
我们再看一个更令人脊背发凉的案例:OpenAI的财务数据揭示了AI行业一个恐怖的结构性悖论——2026年其推理成本预计将达到141亿美元,占营收的47%;2025年推理成本同比增长了三倍,直接导致毛利率从40%下降到33%,预计要到2030年才能实现正向现金流。
而Sora的案例更加残酷:日均运行成本1500万美元,年化烧钱54亿美元,但整个生命周期收入仅140万到210万美元,60天留存率趋近于零。
当全球最头部、最擅长讲故事、融资能力最强的AI公司都在被算力成本压得喘不过气时,普通创业者的处境可想而知。
这背后是AI行业难以化解的结构性困境:算力成本的指数级增长与用户付费意愿的线性增长之间存在着严重错配——一段10秒的视频,Sora的成本约1.3美元;而生成一段文字的成本仅约0.0003美元。
视频生成的算力消耗是文本的4000倍,但用户愿意为视频支付的价格,却可能不到文本的10倍。
最痛的不是大厂,也不是大模型厂商如果说AI应用公司是第一层承压的小兵,那**第三层——最底层接盘的那群人**,是中小型创业团队、出海开发者、AI自媒体创作者、以及普通C端用户。
他们是怎么暴露在这一轮涨价风暴中的?逻辑链条其实很清晰:
算力价格全面上涨→大模型API调用价格上涨(腾讯云最高涨463%)→生成式AI应用制作成本大幅上升→中小团队亏损运营或者退出市场→C端产品价格普涨,免费额度缩水。
3月份发生的“龙虾热”是一个标志性事件。OpenClaw爆火的背后,掀起了全民AI创业的浪潮。但紧随其后的就是供应商集体涨价。一位AI漫剧行业的创业者给自己团队算了一笔账:“原来做一分钟AI漫剧的算力成本低于100元,现在几乎涨到200元/分钟”。
为了控制开支,他不仅给每个小组分配算力额度、把Token使用量与员工绩效挂钩,还要带着团队凌晨三点开工。一个真实的数据是:白天出一条视频需要40多分钟,凌晨时段10分钟以内就能完成。
算力也开始有“早晚高峰期”了。这听上去魔幻,却是AI算力悄然商品化、稀缺化的真实写照。
更令人不安的是,这样的压力正在向上传导到消费者端。硅谷AI行业跟踪平台的数据显示,2026年以来App Store和Google Play上各类AI应用月活跃用户数出现集体下滑,头部应用的留存率处于历史低点。一个残酷的真相是:AI的能力正在大幅跃升,但用户愿意为其支付的价格,并没有跃升。
对AI自媒体创作者来说,最近的日子尤其难熬。大模型Chat产品开始限制提问次数和附件识别字符,此前一系列“7.9元”、“一杯奶茶钱”的尝鲜首月套餐也逐步悄然下架。
业界笑称,有人在GitHub上给OpenClaw点了颗星,结果没过两天,自己用AI写周报的账单就从几毛钱涨到了几十元。对企业来说,AI成本的上涨并非无法承受,但对独立的个人创作者来说,一次API调用的价格上涨就可能让一个副业项目彻底停摆。
数字鸿沟不再是能不能上网的问题——而是能不能用得起最新模型的差距。根据2026年2月全球主流API市场的价格调研,最低端模型与最高端旗舰之间的单价差距已扩大至33倍。能负担旗舰模型的机构将拥有更强的智识优势——Token鸿沟正在成为AI时代新的不平等断层线。

但靠涨价就能解决问题吗?涨价不是结果,而是行业从一个阶段进入另一个阶段的症候。
我在这一轮产业震荡中看到了两个不可忽视的信号,它们指向同一个方向:AI产业正在从烧钱换增长,转向真正的商业化竞争。
第一个信号是资本的集体“反水”。2026年前两个月,全球AI领域融资合计2200亿美元,但OpenAI、Anthropic、Waymo三家公司就拿走了1560亿美元,占比高达83%。与此同时,种子轮融资额同比下滑11%,早期项目的生存空间被急剧压缩。
知名风投机构Andreessen Horowitz在2025年的投资白皮书中写得很清楚:不再关注模型参数规模,只评估“算力投入产出比”——每1美元算力成本能否创造3美元以上的营收。
资本的态度从“普惠撒钱”转向“极度集中”——没有盈利模式的公司终将被市场抛弃。这个逻辑并不复杂:当所有人都意识到“参数规模”不是护城河,“算力成本与收益的比率”才是决定生死的核心指标时,整个行业的游戏规则就被彻底重写了。
第二个信号是技术路线的转向。如果说2024年的创业口号是“做中国的OpenAI”,那2025年变成“做AI时代的Shopify”——大家意识到真正的商业机会在垂直应用而不是基础模型。
2026年的主流口号则是“每一家公司都应该有自己的AI员工”。未来的竞争不再是比谁的参数多,而是比谁能用最低的Token成本解决最多的实际问题。
推理成本正在成为行业竞争的关键制高点。曦望董事长徐冰的表述非常直白,2026年人工智能推理计算需求将达到训练需求的4到5倍,而他的目标是将推理成本降至“百万Token一分钱”。英伟达也在GTC上强调“每瓦Token吞吐量”,成本已经倒逼成为了技术演进的核心推手。
谁来接住下一步?行文至此,一个更核心的问题浮出水面:这场算力涨价风暴除了让人焦虑,将会带来什么样的长期变局?
我的判断是:AI算力的涨价的终局不会是全民破产,而是会催生一个更高效的、更分层的AI基础设施市场。在未来的三到五年,这个市场将被四个力量重塑。
第一个力量:专用推理芯片的商业化爆发。随着推理需求全面超越训练,通用GPU“算力用不满”的痛点越来越突出。英伟达收购Groq推出LPU已是一个强烈信号——当所有算力厂商都转向卷“单位推理成本”时,整个行业的成本曲线将被彻底改写。国内首家纯推理GPU独角兽曦望已完成7轮融资、累计约40亿元,估值破百亿元。2026年将成为国内GPU出货量爬坡的大年。国产推理芯片的规模化落地,将直接在价格层面形成竞争,抑制算力价格的上涨空间。
第二个力量:端侧推理的大规模落地。当运行一个Agent的云端推理成本太高时,把部分算力搬到端侧执行就成了一种必然。据Counterpoint 2025年Q4报告,2026年全球端侧AI推理占比预计将从2024年的15%提升到35%。端侧推理不仅是技术路径的选择,更是创业公司面对云端算力涨价的唯一成本突围通道。
第三个力量:国家算力互联互通平台的全面建成。这不是一个理论构想。工信部已在2025年6月印发《算力互联互通行动计划》,明确目标是到2026年建立较为完备的算力互联互通标准、标识和规则体系,到2028年基本实现全国公共算力标准化互联,逐步形成具备智能感知、实时发现、随需获取的“算力互联网”。2026年2月,工信部进一步明确建立“1+M+N”国家算力互联互通节点体系,通过“统一标识、统一标准、统一规则”的运行机制,实现不同区域、不同主体、不同架构的算力资源的标准化互联和高效流动。算力使用将像水电一样便捷——这是算力资源的供给侧改革,将从制度层面解决算力资源错配问题。
第四个力量:商业模型的校正和成熟。涨价最大的附带效应,是强制要求整个行业从“开源优先”的思维惯性转向“效率优先”的理性思维。大模型厂商需要找到真正的可持续模型——不是靠垄断定价,而是靠芯片创新、成本优化和更强的商业化能力来创造价值。阿里云、腾讯云等头部厂商上调服务价格,本质上是一种成本重构后的价格修复。AI服务业不会再像前两年那样不计成本烧钱抢市场。商业化正在成为比参数竞赛更重要的命题。
从这个角度看,今天所有人在忍受的算力成本上涨,也许正是下一阶段AI产业成熟所必须付出的阵痛。毕竟,一个不需要思考成本和产出的行业,永远不可能长大。
最后的思考在这场Token大迁移的时代,算力已经从一种“技术栈的配角”变成了“商业模式的轴心”。谁能在算力成本上建立起真正的壁垒,谁就能在下一轮竞争中胜出。
回到开头的问题:“谁在为AI算力涨价买单?”
答案其实已经浮出水面:字节、阿里、腾讯这些大厂在买单,但它们赌的是战略卡位和全球化;AI创业公司和Agent开发者在买单,但他们希望在烧钱后找到商业闭环;个人创作者和C端用户也在买单,但每个人可能都没有完全意识到。到最后,所有人都在为这个逐渐变得昂贵的智能未来埋单。
但这一切并不意味着AI会淘汰掉谁。它只是告诉我们:AI的普惠之路不会像之前预想的那么快、那么便宜。它在提醒每一个从业者,是时候重新评估你的AI成本结构了——因为从2026年开始,算力不再是免费的狂欢,而是一笔要算清楚的生意。