华为算力，非去全球不可

作者 | 由仪

编辑 | 葛覃

那个华为回来了，带着一身未痊愈的伤痕，又把自己一股脑扔进了全球算力的斗兽场。

在2026年的巴塞罗那通信展（MWC），除了通信领域的密集发布之外，华为首次于海外发布最新的Atlas950 SuperPoD，TaiShan950 SuperPoD等多个型号超节点产品及解决方案。

华为此举，在意料之外，也在情理之中。

AI算力，进入超节点时代

所谓“意料之外”，是因为海外和国内的产业环境全然不同，多数海外国家并没有来自外力的封锁，随时可以获得市面已有的成熟算力，行业对于华为也有担忧，在算力赛道处于追赶者的华为，凭什么敢直面全球竞争。

而所谓“情理之中”，是因为华为的基因本就是一家全球企业，早期华为做的是运营商生意，天然生长在全球电信市场，在已有20年历史的巴塞罗那通信展（MWC）上，从2G到5G，华为经历了从落后、并跑再到反超的全过程，华为对全球市场的体感，比任何人都更早、也更深刻。

大模型时代，中国企业可以在丰饶的单一市场打磨产品、可以在无数的行业场景验证模型、可以在熟悉的生态里构建壁垒，但如果没有真正全球化，所有能力仍然停留在内循环。

这也是为何，华为在打造算力产业生态的第一天起，就决定了要面向全球市场，即便后来遭遇封锁，算力铁幕骤然落下，华为面临着非理性的商业环境，但是华为也从来没有改变走向全球的目标。

当华为真正迈出第一步，这似乎昭示着一些新的变化。

过去十年，AI 经历了从“看懂世界”（感知）到“创造内容”（生成）的跨越，到了 2026 年，Agentic AI（智能体）的爆发，将这场竞赛推向了深水区，这背后的代价是，以往的算力模式正在失效。

万亿级参数、十万亿级数据训练已成标配，算力需求呈百倍级增长，模型长下文从“K级”提升到到“M级”，内存带宽的需求直接被拉高了 10 倍。算力产业一度走向服务器堆叠+以太网联接的路线，但是服务器之间带宽不足、时延大，集群规模越大，算力利用率反而越低。

以Meta 在 Llama 3.1 的训练为例，1.6 万片 H100 的超大规模集群，算力利用率并没有随规模线性增长，被带宽瓶颈和通讯时延蚕食殆尽。更大的问题是中断，在 54 天的训练周期里，集群中断了 419 次，平均每 3 小时就有一次故障发生。

半导体制造的红利已经见底，摩尔定律已经事实性失效，这正是“超节点”（SuperPoD）诞生的时代背景，华为看到了铁幕的一道裂隙。

华为如何消解算力代差

巴塞罗那 Fira Gran Via 会展中心的1号场馆，华为占据了绝大部分的空间，Atlas 950 等就展出在一个显眼的位置。

来自全球各地的运营商和企业高管们轮番驻足，他们关心算力规模与价格，最佳实践与交付周期，维护成本与软件生态，等等问题不一而足，其实本质问题只有一个——华为能不能满足未来的算力需求。

过去几年，全球算力市场呈现出凝固的稳定，几乎没有人能挑战英伟达的统治地位，凭借 CUDA 生态筑起的高墙，后来者几乎望而却步。

华为试图通过一套全新的互联协议与架构，将数千颗芯片凝结成一个“巨型单体计算机”，去对冲制程演进的放缓，去接住那个即便英伟达也开始感到吃力的、规模算力的疯狂时代。

华为计算产品线总裁张熙伟表示：“华为通过创新引领，打造开源开放的坚实算力底座，为世界提供新的选择。华为Atlas 950 SuperPoD超节点，基于灵衢互联创新，支持上千个计算节点像一台计算机一样工作。同时，华为坚持全面开源开放，支持业界主流开源社区和项目，匹配开发者习惯，让开发者深度挖掘算力潜能，加速AI创新。”

华为消解算力代差的解法，即灵衢协议（UnifiedBus）和超节点架构，以及开源开放构建生态。

2025年9月，华为正式发布面向超节点的互联协议灵衢（UnifiedBus），并基于灵衢推出超节点架构，打造超节点产品。

通过灵衢互联协议，华为把数万规模的计算卡，联接成一个超节点，能够像一台计算机一样工作、学习、思考、推理。目前华为已经开放灵衢技术规范，以便引入产业力量共建生态。

超节点最核心的三个特征，是大带宽、低时延、内存统一编址。

以Atlas 950 SuperPoD为例，具备超高性能，是面向超大型AI计算任务的最佳选择，从基础器件、协议算法到光电技术，通过系统级创新突破，实现长距离高可靠全光无损互联，柜间10倍提升的超大带宽，跨柜卡间往返时延从7μs降低到3μs的超低时延。其中，统一内存编址技术可实现超节点内NPU、CPU等6大组件平等互联，全量资源池化，提供百TB级内存池，支持以64卡为步长按需扩展，最大可实现8192卡无收敛全互联。

华为反复强调的一个词是“开放”，CUDA 不是一天建成的，打破高墙必须靠群众路线，华为正在努力匹配全球开发者的易用性习惯，有意识地抹平从英伟达生态迁移过来的阵痛。

目前华为全面开源CANN的算子库、通信库、RUNTIME、驱动等，同时，全面拥抱业界主流的开源社区和开源项目，CANN新特性、组件和开发计划等在PyTorch、vLLM、SGLang、xLLM、VeRL、Triton、TileLang等开源社区上首发。目前，在AI领域，华为已支持65+全球主流开源大模型，50+开源项目，代码贡献行超过37万行。

中国算力，正面进入全球叙事场

历史不会简单的重复，但往往押着同样的韵脚，一个好故事的开始，总是来自少数人的相信。

就像上世纪九十年代，华为刚刚踏上国际化征程的筚路蓝缕，彼时华为在国内深陷“七国八制”的激烈竞争，GSM、3G研发投入巨资却难收成本，被逼无奈只能向海外寻找生存空间。

1996年，华为创始人任正非亲自带队参加第八届莫斯科国际通信展，这是华为首次大规模亮相国际舞台，华为出海的第一单，仅仅向当地研究所卖出两个共计价值38美元的电源模块。

直至华为在全球市场立足，不变的是华为人对技术的坚守、对市场的耐心，为后来中国企业出海，留下了最珍贵的启示。

相似的出海和相似的展会，不同的时代背景，与其说华为在海外发布产品，不如说更像是一种姿态的宣告。

超节点和灵衢不是华为的私产，它是产业的“公道”，开放技术规范、支持全球主流开源社区，华为在巴塞罗那释放的信号再明确不过，它试图在全球算力版图上，为所有人提供算力另一极。

从全局来看，算力产品从来不是一块芯片那么简单，涵盖芯片、服务器、网络架构、散热系统、调度平台、软件生态等综合工程。华为愿意把这套体系整体呈现出来，它背后折射的是中国在AI基础设施层面的系统工程能力。

华为本次证明了，中国企业不仅能在本土市场构建完整算力体系，也已经具备在全球舞台上与主流技术体系对话的能力。

从应用维度看算力，算力竞争的终局，既在于硬件本身，也在于在生态。谁能让更多开发者、ISV、行业客户围绕其算力平台构建应用，谁就掌握长期话语权。不走出去，华为就无法把生态半径从国内延伸到全球，去争取开发者和合作伙伴的认可，这一步如果迈稳，未来将影响中国算力在全球AI产业中的地位。

如果从更大的层面观测，技术竞争表面是性能参数，深层是话语体系。谁来定义先进算力，谁来制定架构标准，谁来解释安全与合规？华为和中国算力产业链有望参与到全球AI叙事中。

华为的这一步，未必会立即改变市场格局，但是一个属于中国、也属于世界的算力新极点正在浮现。

群发资讯网

华为算力，非去全球不可

评论列表

热门分类

华为算力，非去全球不可

评论列表

猜你喜欢

2003年，女工程师何庭波得知，华为芯片研发每年有24亿经费，惊叫道：“这么多，

全球公认智能驾驶系统前三名：1，华为乾崑ADS4.02，特斯拉FSD

华为！又是华为！中国华为，中华有为！！

余总，你又露馅了！3月14日，上海AWE消费展华为全场景展区，华为余承东和著名主

国产服务器核心矩阵曝光！自主可控算力时代的硬核力量全在这了！从华为系生态军团、

什么新技术，华为没发布之前，整个行业静悄悄的，甚至其他厂商连功能和名字都想不到这

不好意思，都是宣传华为，把你超了

热门分类