群发资讯网

【偷师还是创新?Anthropic 的这场“蒸馏战争”,说穿了就是生意】快速阅读

【偷师还是创新?Anthropic 的这场“蒸馏战争”,说穿了就是生意】

快速阅读:Anthropic 指控 DeepSeek、Moonshot AI 和 MiniMax 通过 2.4 万个欺诈账号对 Claude 进行工业级蒸馏攻击,引发广泛讨论。多数观点认为,这场指控的真正目的,是在中国开源模型快速追赶之际,向投资人和美国政府讲一个“没有蒸馏就追不上”的故事。

---

先说蒸馏这件事本身。所谓知识蒸馏,就是用一个大模型生成的输出去训练另一个模型,让后者模仿前者的能力。Anthropic 说这三家中国公司生成了 1600 万次对话来榨取 Claude 的能力,用的是付费 API,但属于违反服务条款的欺诈行为。

问题来了:他们付钱了。

而 Anthropic 当初训练模型时,用的是从互联网上抓取的海量数据,从没付过任何人一分钱版权费。这个对比,让很多人觉得这场指控的道德底气实在站不住脚。有网友直接说,这是“小偷教育警察”。

更让人玩味的是时间节点。每逢有竞争对手准备发布重磅模型,Anthropic 就会适时推出一个新的恐慌叙事——要么是“AI 想要自我保护”,要么是“能力太危险不敢公开”,这次是“中国人在偷我们的模型”。有观点认为,这套操作的真实受众是华盛顿的监管者和硅谷的投资人,目的是在对手崛起之前,把“没有我们你们什么都不是”的叙事钉进人们的脑子里。

那中国模型到底有没有真正的创新?

DeepSeek 的论文发布频率和质量,在过去一年里让很多人重新评估了这个问题。新的注意力机制、MoE 架构优化、强化学习训练方法,包括后来被多家实验室借鉴的 Muon 优化器——这些都白纸黑字发表在公开论文里。有网友翻出一长串论文链接,讽刺地问:你们口中“只会蒸馏”的那些人,是在哪里发表这些研究的?

有观点认为,“蒸馏就不算创新”这个说法,其实是一种精心设计的叙事框架——它把技术能力的获取路径和技术本身的优劣混为一谈。一辆用别人图纸造出来的车,如果跑得更快、卖得更便宜,消费者不在乎它的图纸从哪里来。

成本这件事,才是真正让人坐不住的地方。

MiniMax 提供每年 100 美元的订阅计划,Anthropic 同等方案要每月 100 美元。如果一个蒸馏出来的模型能实现 Claude 八九成的性能,价格只有十二分之一,大多数普通用户根本不需要剩下那一两成的差距。价格战打响,护城河就开始缩水。

还有一个没什么人点出来的细节:Anthropic 大张旗鼓声称 Claude 是有独特“人格”的实体,是区别于竞争对手的核心卖点。如果这个人格可以被 1600 万次对话就蒸馏走,那这个故事本身就很难自圆其说了。

有网友还提到,Claude Sonnet 4.6 本身似乎也显示出蒸馏自 GPT-5.2 输出的痕迹——指控发出的同一时间。

所以这件事最后会走向哪里,暂时还没有答案。DeepSeek v4 据说即将发布,到时候咱再看。

---

简评:

这不是一场知识产权保卫战,这是一场定价权保卫战。当MiniMax用年费100美元提供Claude八成功能时,Anthropic真正恐惧的不是技术泄露,而是利润表上那个刺眼的对比。1600万次对话能蒸馏走的从来不是什么“独特人格”,而是那套本就建立在公共数据之上的概率分布。护城河最怕的不是有人偷水,而是有人发现河里的水本来就是公共的,只是你先围起来收了过路费。投资人需要故事,监管者需要敌人,而消费者只需要更便宜的选择。

---

www.reddit.com/r/LocalLLaMA/comments/1rd2x61/people_are_getting_it_wrong_anthropic_doesnt_care/