国产之光!摩尔线程进入万P时代

解读科技的数码哥 2024-07-09 05:24:47

在图形处理领域和人工智能加速领域,老黄的NVIDIA在全球已经确立了其无可争议的领导地位。

不过,在当前极度复杂行业背景下,我们迫切需要发展自己的游戏显卡和AI加速器。

万幸,摩尔线程,勇敢地扛起了这一历史重担。

他们不仅成功推出了国内首个千卡规模的国产算力集群,还进一步扩大了技术应用,实现了万卡级、万PetaFLOPs级和万亿级规模的算力扩展,为国产技术的发展树立了新的里程碑。

摩尔线程成立于2020年,致力于研发高性能GPU产品。初期,公司聚焦于核心技术的研发,逐步在图形渲染、计算加速等领域取得突破。

摩尔线程致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。

据解读哥了解,摩尔线程的核心研发团队和技术路线源自原英伟达全球副总裁、中国区总经理张建中及其团队。

摩尔线程还推出了以元计算为核心的MUSA架构GPU,旨在赋能下一代互联网应用。

摩尔线程,作为国产GPU的领军企业,其AI旗舰产品夸娥智算集群解决方案的升级,标志着国产GPU技术正式迈入了万卡万P时代。

夸娥智算集群的扩展,预计能够将训练效率提升至前所未有的水平,缩短训练时间,为超大规模基础大模型的训练提供了强有力的支持。

据摩尔线程官方数据显示,其智算集群具备每秒千亿亿次级别的计算能力,这在国际上也是屈指可数。

万卡集群的构建,并非简单的计算卡叠加,它是一个超级复杂的系统工程。

超大规模组网互联、集群有效计算效率、训练高稳定与高可用性等一系列技术难题,都是构建万卡集群必须面对的挑战。

摩尔线程通过自主研发的软硬件技术,全面整合了高性能GPU计算、高性能RDMA网络、高性能并行文件存储等全套技术,构建了一套完整的万卡集群解决方案。

其夸娥智算集群具备PB级的超大显存总容量和PB/s级的超高速卡间互联总带宽,实现了系统性协同优化,达到了超强的算力。

在AI模型训练的主战场上,万卡集群已成为最低入场券。国外科技巨头如谷歌、Meta、Grok等已经部署了数万甚至数十万张GPU加速卡的万卡集群。

而在国内,字节跳动、阿里巴巴等企业也在积极推动万卡集群的建设,如字节跳动搭建的12288张卡的训练集群,科大讯飞的超万卡集群算力平台“飞星一号”。

据了解,摩尔线程的夸娥智算集群不仅在技术上领先,更在稳定性和性能上表现出色。其平均无故障运行时间超过15天,周均训练有效率超过99%,远超行业平均水平。

这得益于摩尔线程自主研发的一系列可预测、可诊断的多级可靠机制,包括软硬件故障的自动定位与诊断预测,Checkpoint多级存储机制等。

摩尔线程的产品线涵盖了从芯片到算力卡,从一体机到节点集群的全栈式覆盖。MTT S4000加速卡和MCCX D800一体机等产品,都是专为大模型训练和推理设计,具备高性能和高稳定性。

同时,摩尔线程还提供了基于高效易用的MUSA编程语言、完整的CUDA生态兼容、自动化迁移工具Musify等,大大简化了开发者的迁移工作。

摩尔线程的战略签约项目包括与青海移动、青海联通、北京德道信科集团等的合作,共同推进万卡集群的建设和应用。

在生态建设方面,摩尔线程与国内外众多AI厂商、云厂商、科技厂商等建立了深入的合作关系,共同推动大模型训练、大模型推理、具身智能等不同场景和领域的持续创新。

跟华为一样,摩尔线程也是美国“实体清单”认证的贵宾。随着万卡万P时代的来临,希望摩尔线程撑起国产GPU的荣光。

0 阅读:6

解读科技的数码哥

简介:感谢大家的关注