黄仁勋9天前说“这是灾难”,今天DeepSeek V4就在华为芯片上跑通了
4月24日,DeepSeek正式开源V4系列模型。
参数规格很硬:旗舰版V4-Pro,总参数1.6万亿,激活参数49B;经济版V4-Flash,总参数284B,激活参数13B。两个版本全部标配100万token上下文,MIT协议完全开源。
但这都不是重点。真正让硅谷坐不住的是另一件事——
DeepSeek首次在官方技术报告中,把华为昇腾NPU和英伟达GPU写进了同一份硬件验证清单。V4系列已完整适配华为昇腾950PR芯片,核心代码从英伟达CUDA生态迁移到了华为CANN架构。这是全球第一个不依赖英伟达硬件的万亿级前沿开源大模型。
黄仁勋的“灾难”预言,9天就成真了
就在4月15日,英伟达CEO黄仁勋接受播客专访时说了句分量极重的话:“如果DeepSeek先在华为平台上发布,那对我们国家来说将是灾难性的。”当时不少人觉得老黄在制造舆论压力。然而天下武功唯快不破,从黄仁勋发出警告到DeepSeek V4正式发布,仅仅相隔9天。
老黄害怕的,根本不是华为多卖几块芯片。英伟达真正的护城河不是GPU算力本身,而是CUDA作为默认起点的软件生态位——全球数百万AI开发者都在这个生态里写代码,习惯了各种现成的算子库。英伟达的毛利率常年维持在72%到75%,这哪里是卖硬件,这分明是垄断性的“Nvidia tax”。
但DeepSeek V4偏偏在昇腾上跑通了——底层通信逻辑从头写,FlashAttention算子一行行手搓,内存管理和多卡调度全部重新设计。这不是给电脑换个硬盘那么简单,这是连地基图纸和承重墙一块儿重新盖了一遍。
它证明了一件事:不交CUDA税、不看英伟达脸色的平行技术路线,走得通。
历史总是惊人的相似
2003年,中国投入2.7亿美元参与欧洲伽利略卫星导航项目,结果核心技术不让碰,2007年被直接排除在决策之外。当时多少人说,脱离欧洲主流导航体系,中国卫星导航就凉了?结果呢,北斗不仅完成全球组网,2024年产业产值达到5758亿元人民币。而伽利略系统后期全线瘫痪,反过来求咱们搞频率兼容。
今天来看,从CUDA迁移到CANN,就是AI时代的“北斗副本”。
黄仁勋真正恐惧的,从来不是某一个模型版本——他恐惧的是“我定标准、你交学费”这套游戏规则正在一点一点的失效。大国博弈的生死局里,从来没有什么中间地带。核心技术,买不来,讨不来