硅谷大厂集体踩刹车:从“疯狂烧Token”到“严控用量”
核心结论:2025-2026年硅谷经历“Tokenmaxxing”狂热后,因成本失控、ROI不清,全面转向限流、分级计费、精细化治理,AI从“拼用量”回归“拼价值”。
一、什么是Tokenmaxxing?(烧钱狂潮)
- 2025年流行词:最大化Token消耗,把“用得多=数字化转型=创新”当KPI。
- 公司做法:设Token排行榜、配额、考核,鼓励员工拼命用AI。
- 员工行为:用企业级AI查天气、写生日祝福、闲聊,无效刷量。
- 畸形结果:Meta员工月耗50万美元Token;Uber4个月烧光全年预算;Salesforce年付Anthropic 3亿美元 。
二、为什么紧急刹车?(三大致命问题)
1️⃣ 成本爆炸,隐性损耗惊人
- 每花1美元Token:0.44美元修Bug、0.27美元重写代码、0.11美元审查,隐性损耗≈80%。
- 工程师用AI编码提速,但代码废弃/重写率+800%,越写越亏。
2️⃣ ROI黑洞:个人提效≠公司赚钱
- 仅14% CFO能看到AI投资有清晰可衡量回报。
- 员工写周报快3倍、代码量翻倍,但公司营收无增长。
- 本质:大家自动化讨厌的任务,而非赚钱的任务。
3️⃣ 烧Token≠创新,沦为数字浪费
- JPMorgan报告标题:《AI Token成本正在吞噬互联网利润》。
- Shopify、Spotify、Roku等财报:AI成运营支出最大压力。
- 投资人比喻:像开着所有灯衡量生产力,花钱≠产出。
三、大厂在做什么?(五大收紧动作)
1. 微软:停掉多数员工Claude Code许可
- 官方理由:成本失控;同时扶持自家OpenAI,战略+成本双重考量。
2. Meta:下线Tokenmaxxing排行榜
- 曾设“Claudeonomics榜”,垫底面临裁员;月耗50万美金员工出现,1个月紧急下架。
3. 亚马逊:叫停AI刷榜(Kirorank)
- 员工为排名执行无意义操作刷Token,算力成本飙升,直接关停。
4. 分级管控:按价值分配模型
- Salesforce CEO要做智能路由器:简单任务用小模型,复杂任务用顶级模型,拒绝一刀切。
- Uber:给工程师分级配额,核心业务优先,非核心限流 。
5. 计费模式革命:从“按用量”到“按结果”
- HubSpot:从按Token→按解决对话数/生成线索数计费。
- ServiceNow:同步调整,厂商与客户利益对齐。
四、行业转向:理性回归,还是寒冬前奏?
1. 共识:AI不是“免费加速器”
- 2026全球AI软件支出预计2.59万亿美元(+47%),但94%工程负责人表示关键ROI指标缺失。
- 核心矛盾:钱越花越多,却不知烧在哪、值不值。
2. 转折点:从“优化旧流程”到“重构商业模式”
- Fortune评论:Tokenmaxxing容易,重构工作流很难。
- 现状:多数公司用AI把旧工作做得更快,而非创造新价值,账单迟早逼回本质问题。
3. 未来:AI是“新思维框架”,不是“锤子”
- 终极拷问:AI对业务,是一把锤子(加速旧活),还是一套新思维框架(创造新活)?
- 结论:理性回归是必经阵痛,AI将从“烧钱竞赛”走向价值驱动、成本可控的健康发展。
Token经济 token成本 Token费用 aitoken 算力token token机制 token上限