【偷师还是创新？Anthropic 的这场“蒸馏战争”，说穿了就是生意】快速阅读

【偷师还是创新？Anthropic 的这场“蒸馏战争”，说穿了就是生意】

快速阅读：Anthropic 指控 DeepSeek、Moonshot AI 和 MiniMax 通过 2.4 万个欺诈账号对 Claude 进行工业级蒸馏攻击，引发广泛讨论。多数观点认为，这场指控的真正目的，是在中国开源模型快速追赶之际，向投资人和美国政府讲一个“没有蒸馏就追不上”的故事。

---

先说蒸馏这件事本身。所谓知识蒸馏，就是用一个大模型生成的输出去训练另一个模型，让后者模仿前者的能力。Anthropic 说这三家中国公司生成了 1600 万次对话来榨取 Claude 的能力，用的是付费 API，但属于违反服务条款的欺诈行为。

问题来了：他们付钱了。

而 Anthropic 当初训练模型时，用的是从互联网上抓取的海量数据，从没付过任何人一分钱版权费。这个对比，让很多人觉得这场指控的道德底气实在站不住脚。有网友直接说，这是“小偷教育警察”。

更让人玩味的是时间节点。每逢有竞争对手准备发布重磅模型，Anthropic 就会适时推出一个新的恐慌叙事——要么是“AI 想要自我保护”，要么是“能力太危险不敢公开”，这次是“中国人在偷我们的模型”。有观点认为，这套操作的真实受众是华盛顿的监管者和硅谷的投资人，目的是在对手崛起之前，把“没有我们你们什么都不是”的叙事钉进人们的脑子里。

那中国模型到底有没有真正的创新？

DeepSeek 的论文发布频率和质量，在过去一年里让很多人重新评估了这个问题。新的注意力机制、MoE 架构优化、强化学习训练方法，包括后来被多家实验室借鉴的 Muon 优化器——这些都白纸黑字发表在公开论文里。有网友翻出一长串论文链接，讽刺地问：你们口中“只会蒸馏”的那些人，是在哪里发表这些研究的？

有观点认为，“蒸馏就不算创新”这个说法，其实是一种精心设计的叙事框架——它把技术能力的获取路径和技术本身的优劣混为一谈。一辆用别人图纸造出来的车，如果跑得更快、卖得更便宜，消费者不在乎它的图纸从哪里来。

成本这件事，才是真正让人坐不住的地方。

MiniMax 提供每年 100 美元的订阅计划，Anthropic 同等方案要每月 100 美元。如果一个蒸馏出来的模型能实现 Claude 八九成的性能，价格只有十二分之一，大多数普通用户根本不需要剩下那一两成的差距。价格战打响，护城河就开始缩水。

还有一个没什么人点出来的细节：Anthropic 大张旗鼓声称 Claude 是有独特“人格”的实体，是区别于竞争对手的核心卖点。如果这个人格可以被 1600 万次对话就蒸馏走，那这个故事本身就很难自圆其说了。

有网友还提到，Claude Sonnet 4.6 本身似乎也显示出蒸馏自 GPT-5.2 输出的痕迹——指控发出的同一时间。

所以这件事最后会走向哪里，暂时还没有答案。DeepSeek v4 据说即将发布，到时候咱再看。

---

简评：

这不是一场知识产权保卫战，这是一场定价权保卫战。当MiniMax用年费100美元提供Claude八成功能时，Anthropic真正恐惧的不是技术泄露，而是利润表上那个刺眼的对比。1600万次对话能蒸馏走的从来不是什么“独特人格”，而是那套本就建立在公共数据之上的概率分布。护城河最怕的不是有人偷水，而是有人发现河里的水本来就是公共的，只是你先围起来收了过路费。投资人需要故事，监管者需要敌人，而消费者只需要更便宜的选择。

---

www.reddit.com/r/LocalLLaMA/comments/1rd2x61/people_are_getting_it_wrong_anthropic_doesnt_care/

群发资讯网

【偷师还是创新？Anthropic 的这场“蒸馏战争”，说穿了就是生意】快速阅读

热门分类