梁文锋三次拒了美国邀请,有人说是硬气,有人说是傻,其实他根本没在跟谁较劲。
他只是把DeepSeek这摊事,一砖一瓦垒实在了中国自己的地基上。
2023年第一次被邀,是去斯坦福讲大模型训练;2024年又来,说要联合跑数据;到了2025年,直接递了外交豁免签证。前前后后,三十多次,有明的有暗的,有学术名头,也有“第三方中介”绕着弯子上门。但他一次都没松口。
不是傲,也不是躲。他自己说过一句大白话:“我们跑的是产线上的模型,不是PPT里的模型。”这话听着糙,但真。DeepSeek的R1模型,训练花了不到600万美元,而OpenAI同级别的模型,烧掉的钱翻了三四倍。不是省钱抠门,是国产芯片适配太 tight,逼着他们把算法一层层往下压、往实里写。
他们开源,但开得很有分寸。模型权重、推理接口、文档全放在GitHub上,全球开发者随便下。可训练时怎么调度千张昇腾卡?怎么让模型在钢铁厂高温噪音里稳稳识缺陷?这些,连华为内部都得签协议才能看。
复旦、清华、华为自己测模型,不用调参就跑得动,中小企业拿去直接接PLC、接MES系统,省了一半部署费。这不是运气,是天天泡在工厂里改出来的。美国实验室没这种产线噪声,也没这种“改不动就停工”的倒逼压力。
有人说他们封闭,可DeepSeek的GitHub星标数早超Llama,文档更新比很多美国团队还勤。开放不是为了显得大方,是让国产替代这件事,真的能落地、能省钱、能上手。
昇腾千卡集群2025年初就在东莞落地了,不是试点,是真干活。政策没喊口号,市场没画大饼,就一条:AI得进车间、进仓库、进电网调度室。梁文锋不去美国,不是不交流,是他知道,对方要的“交流”,是把你整套打法抄走,再用他们的云和芯片重打包卖回来。
他拒的从来不是人,是那种“先交底、再合作”的逻辑。技术主权不是喊出来的,是你手里有芯片、有场景、有成本优势,才能谈怎么开哪扇门、关哪扇窗。
三次拒绝,二十四道门,不是筑墙,是建桥。桥基打在中国工厂的地面上,桥面铺的是国际通用代码,栏杆焊的是底线。
梁文锋没写过多少论文,DeepSeek也没上过多少热搜。他们做的事,就俩字:落地。
落地,就是落地。





