群发资讯网

华为算力,非去全球不可

作者 | 由仪编辑 | 葛覃那个华为回来了,带着一身未痊愈的伤痕,又把自己一股脑扔进了全球算力的斗兽场。在2026年的巴

作者 | 由仪

编辑 | 葛覃

那个华为回来了,带着一身未痊愈的伤痕,又把自己一股脑扔进了全球算力的斗兽场。

在2026年的巴塞罗那通信展(MWC),除了通信领域的密集发布之外,华为首次于海外发布最新的Atlas950 SuperPoD,TaiShan950 SuperPoD等多个型号超节点产品及解决方案。

华为此举,在意料之外,也在情理之中。

AI算力,进入超节点时代

所谓“意料之外”,是因为海外和国内的产业环境全然不同,多数海外国家并没有来自外力的封锁,随时可以获得市面已有的成熟算力,行业对于华为也有担忧,在算力赛道处于追赶者的华为,凭什么敢直面全球竞争。

而所谓“情理之中”,是因为华为的基因本就是一家全球企业,早期华为做的是运营商生意,天然生长在全球电信市场,在已有20年历史的巴塞罗那通信展(MWC)上,从2G到5G,华为经历了从落后、并跑再到反超的全过程,华为对全球市场的体感,比任何人都更早、也更深刻。

大模型时代,中国企业可以在丰饶的单一市场打磨产品、可以在无数的行业场景验证模型、可以在熟悉的生态里构建壁垒,但如果没有真正全球化,所有能力仍然停留在内循环。

这也是为何,华为在打造算力产业生态的第一天起,就决定了要面向全球市场,即便后来遭遇封锁,算力铁幕骤然落下,华为面临着非理性的商业环境,但是华为也从来没有改变走向全球的目标。

当华为真正迈出第一步,这似乎昭示着一些新的变化。

过去十年,AI 经历了从“看懂世界”(感知)到“创造内容”(生成)的跨越,到了 2026 年,Agentic AI(智能体)的爆发,将这场竞赛推向了深水区,这背后的代价是,以往的算力模式正在失效。

万亿级参数、十万亿级数据训练已成标配,算力需求呈百倍级增长,模型长下文从“K级”提升到到“M级”,内存带宽的需求直接被拉高了 10 倍。算力产业一度走向服务器堆叠+以太网联接的路线,但是服务器之间带宽不足、时延大,集群规模越大,算力利用率反而越低。

以Meta 在 Llama 3.1 的训练为例,1.6 万片 H100 的超大规模集群,算力利用率并没有随规模线性增长,被带宽瓶颈和通讯时延蚕食殆尽。更大的问题是中断,在 54 天的训练周期里,集群中断了 419 次,平均每 3 小时就有一次故障发生。

半导体制造的红利已经见底,摩尔定律已经事实性失效,这正是“超节点”(SuperPoD)诞生的时代背景,华为看到了铁幕的一道裂隙。

华为如何消解算力代差

巴塞罗那 Fira Gran Via 会展中心的1号场馆,华为占据了绝大部分的空间,Atlas 950 等就展出在一个显眼的位置。

来自全球各地的运营商和企业高管们轮番驻足,他们关心算力规模与价格,最佳实践与交付周期,维护成本与软件生态,等等问题不一而足,其实本质问题只有一个——华为能不能满足未来的算力需求。

过去几年,全球算力市场呈现出凝固的稳定,几乎没有人能挑战英伟达的统治地位,凭借 CUDA 生态筑起的高墙,后来者几乎望而却步。

华为试图通过一套全新的互联协议与架构,将数千颗芯片凝结成一个“巨型单体计算机”,去对冲制程演进的放缓,去接住那个即便英伟达也开始感到吃力的、规模算力的疯狂时代。

华为计算产品线总裁张熙伟表示:“华为通过创新引领,打造开源开放的坚实算力底座,为世界提供新的选择。华为Atlas 950 SuperPoD超节点,基于灵衢互联创新,支持上千个计算节点像一台计算机一样工作。同时,华为坚持全面开源开放,支持业界主流开源社区和项目,匹配开发者习惯,让开发者深度挖掘算力潜能,加速AI创新。”

华为消解算力代差的解法,即灵衢协议(UnifiedBus)和超节点架构,以及开源开放构建生态。

2025年9月,华为正式发布面向超节点的互联协议灵衢(UnifiedBus),并基于灵衢推出超节点架构,打造超节点产品。

通过灵衢互联协议,华为把数万规模的计算卡,联接成一个超节点,能够像一台计算机一样工作、学习、思考、推理。目前华为已经开放灵衢技术规范,以便引入产业力量共建生态。

超节点最核心的三个特征,是大带宽、低时延、内存统一编址。

以Atlas 950 SuperPoD为例,具备超高性能,是面向超大型AI计算任务的最佳选择,从基础器件、协议算法到光电技术,通过系统级创新突破,实现长距离高可靠全光无损互联,柜间10倍提升的超大带宽,跨柜卡间往返时延从7μs降低到3μs的超低时延。其中,统一内存编址技术可实现超节点内NPU、CPU等6大组件平等互联,全量资源池化,提供百TB级内存池,支持以64卡为步长按需扩展,最大可实现8192卡无收敛全互联。

华为反复强调的一个词是“开放”,CUDA 不是一天建成的,打破高墙必须靠群众路线,华为正在努力匹配全球开发者的易用性习惯,有意识地抹平从英伟达生态迁移过来的阵痛。

目前华为全面开源CANN的算子库、通信库、RUNTIME、驱动等,同时,全面拥抱业界主流的开源社区和开源项目,CANN新特性、组件和开发计划等在PyTorch、vLLM、SGLang、xLLM、VeRL、Triton、TileLang等开源社区上首发。目前,在AI领域,华为已支持65+全球主流开源大模型,50+开源项目,代码贡献行超过37万行。

中国算力,正面进入全球叙事场

历史不会简单的重复,但往往押着同样的韵脚,一个好故事的开始,总是来自少数人的相信。

就像上世纪九十年代,华为刚刚踏上国际化征程的筚路蓝缕,彼时华为在国内深陷“七国八制”的激烈竞争,GSM、3G研发投入巨资却难收成本,被逼无奈只能向海外寻找生存空间。

1996年,华为创始人任正非亲自带队参加第八届莫斯科国际通信展,这是华为首次大规模亮相国际舞台,华为出海的第一单,仅仅向当地研究所卖出两个共计价值38美元的电源模块。

直至华为在全球市场立足,不变的是华为人对技术的坚守、对市场的耐心,为后来中国企业出海,留下了最珍贵的启示。

相似的出海和相似的展会,不同的时代背景,与其说华为在海外发布产品,不如说更像是一种姿态的宣告。

超节点和灵衢不是华为的私产,它是产业的“公道”,开放技术规范、支持全球主流开源社区,华为在巴塞罗那释放的信号再明确不过,它试图在全球算力版图上,为所有人提供算力另一极。

从全局来看,算力产品从来不是一块芯片那么简单,涵盖芯片、服务器、网络架构、散热系统、调度平台、软件生态等综合工程。华为愿意把这套体系整体呈现出来,它背后折射的是中国在AI基础设施层面的系统工程能力。

华为本次证明了,中国企业不仅能在本土市场构建完整算力体系,也已经具备在全球舞台上与主流技术体系对话的能力。

从应用维度看算力,算力竞争的终局,既在于硬件本身,也在于在生态。谁能让更多开发者、ISV、行业客户围绕其算力平台构建应用,谁就掌握长期话语权。不走出去,华为就无法把生态半径从国内延伸到全球,去争取开发者和合作伙伴的认可,这一步如果迈稳,未来将影响中国算力在全球AI产业中的地位。

如果从更大的层面观测,技术竞争表面是性能参数,深层是话语体系。谁来定义先进算力,谁来制定架构标准,谁来解释安全与合规?华为和中国算力产业链有望参与到全球AI叙事中。

华为的这一步,未必会立即改变市场格局,但是一个属于中国、也属于世界的算力新极点正在浮现。

评论列表

瞭望
瞭望 2
2026-03-10 16:07
嗨起来