AI 的战场,从来都不给人喘息的机会。
OpenAI 最近的动作,挺让人玩味的。
据科技媒体 testingcatalog 报道,GPT-5.6 极有可能在 6 月底之前发布,mini 版、标准版、Pro 版三管齐下,预测市场 Polymarket 上一度有八成的人押注 "本月内落地",合约交易量已经突破了百万美元级别。
然后,X 平台上说因内部问题推迟,概率一下子跌到三成不到。
一会儿涨,一会儿跌,节奏乱得像股票。
甭管发布时间怎么变,OpenAI 想打的牌,已经摆在台面上了。
首席科学家 Jakub Pachocki 对内部员工说,5.6 是对 GPT-5.5 的 "有意义的改进"。所谓有意义,上下文窗口从 100 万 tokens 扩到 150 万,足足涨了 43%,处理长任务的能力上了一个台阶。
词元效率再提升 10%到 15%,同样的费用,能跑更多活儿。
能力层面,更值得说的是 Agent 化的推进。
GPT-5.6 据报已能做视觉复刻,把设计稿还原为可运行代码;SVG 3D 生成,支持浏览器内旋转缩放;加上 Playwright 浏览器自动化,真实执行点击、输入、页面跳转。
有 X 网友说得很形象:"脑子还是同一个脑子,但已经长出手了。"
以前 AI 是给你出主意,现在 AI 能替你操作。
区别说大不大,说小真不小。
真正狠的地方,还是定价。
GPT-5.6 的 token 价格据报约为 Claude 系列的三分之一,OpenAI 当前定价本就比 Anthropic 低一半左右,5.6 出来后差距可能进一步拉开。
性能上,在智能体编码场景里,5.6 据称已能压住 Anthropic 旗舰级别,SVG 生成能力也被指超越 Claude 系列。
又便宜,性能又够用,企业客户迁移的理由已经呼之欲出了。
Anthropic 当然也没闲着。
Mythos Preview 在内部小范围运行,Fable 5 也在持续迭代。Claude 走的路数,更注重安全性和对齐质量,积累了一批讲究信任的企业客户。
但价格战打响之后,再好的口碑也要面对 "凭什么不换便宜的" 一道关。
社区的反应倒是挺分裂的。
焦急派在疯狂催更,GPT-5.5 最近的 "降智" 投诉到处都是,有用户已经在逼宫了:三天内 GPT-5.6 要是还没来,就不原谅你了。
冷静派则泼冷水,5.6 只是小版本迭代,参数规模不会大跳跃,真正的模型级突破得等 GPT-6,别被版本号骗了情绪。
两边说的其实都没错,只是读出了同一件事的两个截面。
焦急派的情绪来自真实的使用体验退步,说得通。冷静派的判断来自对 AI 发展规律的清醒感知,也说得通。
只是在 "5.6 到底算多大的事" 上,预期分叉得厉害。
从 GPT-5.4 到 5.5,大约六周。
5.5 到 5.6,预计延续类似节奏。Anthropic、Google Gemini 同期保持高频更新,6 月下旬已被圈子里称作 "AI 大事件周",压迫感像赶 deadline 的夜晚,随便哪家有个风吹草动都要扒一扒。
OpenAI 押的,是更低的价格、更快的迭代、更强的执行能力,让对手在追赶中先喘不过气。Anthropic 押的,是安全口碑和长期信任积累出来的客户黏性,认为短期价格攻势打不垮品牌壁垒。
谁赢谁输,现在还看不清楚。
GPT-5.6 发没发、发了之后比 5.5 强多少、对 Anthropic 形成的真实压力几何,仍然是一本糊涂账。预测市场给出了概率,Reddit 网友说了判断,内部消息也漏了一些,但最终答案还得等产品落地。
只有一点感觉确定:AI 领域现在的节奏,已经不允许任何一家慢下来了。
慢一拍,市场份额的形状就已经变了。
