光模块和高速铜缆新的需求增量

每日调研备忘录 2024-03-26 06:44:51

如果有帮助,请帮忙点击:关注、分享、点赞

事件:

英伟达GTCD大会上发布GB200 NVL72计算平台,较相同数量的H100性能提升30倍,成本和能耗降低25倍,GB200堪称史上最强AI芯片。

GB200 NVL72服务器,提供36个CPU+72个Blackwell GPU,及一体水冷散热方案,可实现总计720petaflops的AI训练性能或1,440petaflops的推理性能,其中,每个机架有18个GB200和9个NVLink交换机。一个机架可支持27万亿个参数模型。作为对比,GPT-4的参数模型约为1.7万亿。

GB200技术方案:

本次最大的技术升级亮点之一在于第五代NVLINK互联,NVSWITCH集成在服务器内部,NVLink Switch 系统使用9个NVSwitch机架+电缆盒(Cable cartridges)完成内部互连,可提高 18 个计算节点的并行模型效率。其中的Cable Cartridges全部采用铜互连方案,其内部具有5000根NVLink铜缆,合计长度超2英里。

GB200整体功率为120kW,采用铜互连方式替代光模块能够节省20kW功耗,铜缆的特点在于成本低、能耗小,但距离近、带宽小,成本是预计节约6倍左右,在短距传输领域可替代光模块 。

铜缆连接器又称为“高速连接器”、“高速铜连接”,可通过铜线直接传输电信号,高速线缆分为无源铜缆和有源光缆两类。

无源铜缆,即直连线缆或直连铜缆,是一种无源线缆。它以其低成本、低功耗和高可靠性等优点而受到青睐,通常被广泛应用于数据中心内同机柜或相邻机柜之间的数据传输。目前,无源DAC已成为高速线缆市场的首选产品。

相比之下,有源光缆(AOC),是无源铜缆技术的进一步发展。随着数据传输速率的不断提高,无源铜缆在长距离传输中会出现信号损耗过大的问题,这导致了有源光缆的出现。有源光缆的原理是在线缆的接收端加入具有特定能力的线性重驱动器(Redriver),以实现信号的均衡和整形中继,从而有效延长端到端的传输距离。

在实际应用中,DAC和AOC主要用于以太网数据通信。由于DAC的传输距离相对较短,它通常被用于机柜内设备间的互连;而AOC由于其较长的传输距离,适用于机柜间设备的互连。在考虑成本效益的情况下,DAC的性价比更高,在同等规格下,其价格仅为AOC的1/3至1/4。

高速铜缆市场成长性:

根据LightCounting的权威报告显示,高速铜缆作为一种用于服务器之间以及解耦合式交换机和路由器内部实现高速、高效互连的关键组件,其市场需求呈现显著增长态势。预测从2023年开始的五年期间,高速铜缆市场的年复合增长率将达到25%

同时3.20日博通也举办了投资人交流会,也着重强调了高速铜缆的作用,博通在会议中表示:

即便是最好的光学器件,每年的故障率也最少会有2%,同时光学元件在运行中还会产生较大的能耗和成本投入。鉴于这些挑战,博通在设计数据中心内部机架级别的交换解决方案时,倾向于优先采用铜缆连接技术。当前,博通的技术实力已经允许在一定范围内,通过铜缆实现最高4米的有效连接距离,从而在机架内部设备间实现高效、低成本的数据传输。

在超出铜缆连接所能覆盖的距离范围时,例如在数据中心内部的长距离传输需求或是跨机架数据交换情况下,就必须依赖于光连接技术。

GB200对光模块市场的影响

本次推出的GB200 NVL72单个机柜仅仅能满足小型算力需求的客户,对于大部分客户来说,肯定不仅仅使用单个机柜,必须采购多个机柜,多个机柜使用的话,需要大宽带的光连接,需要更高速率的光模块,特别是在跨机柜集群场景中对1.6T光模块的需求会大幅增加.

GB200与1.6T光模块的配比关系为1:9。NVLink5.0双向带宽相较2022年发布的NVLink4.0翻了一倍,提升至1800GB,对应单向带宽为900GB,若采用1.6T光模块传输+2层网络架构,(900GB*8/1600Gb)*2=9个,即GB200与1.6T光模块的配比关系为1:9;如果采用800G光模块,配比关系为1:18。

GB200的放量将对光模块行业产生重大利好,1.6T的销量预计将会增长。

GB200光模块和GPU配比关系

随着推理需求的上升,GB200在推理性能方面表现强劲,预计会得到越来越多的应用。这一趋势将推动光模块与GPU的配比关系从目前的一比2.5逐渐上升至1比9,这是一个重大的逻辑变化。GB200的放量对于整个光模块行业来说是一个利好,可能会导致明年1.6T总需求的预测从200万支到300万支之间上调,尤其是GB200的增量效应可能超出市场预期。

GB200 NVL72连接方式是什么?

GB200 NVL72 互联模式通过NV Switch 实现,其中GPU 与NVSwitch 采用铜互联形式(高速背板连接器),外部则使用光互联形式(光模块 I/O 连接器)。内部使用的电缆长度累计接近2 英里,共有5000 条独立铜缆。

GB200的出现如何改变对铜连接市场的认知和重视程度?

GB200的出现改变了人们对铜连接市场的认知,因为它的出现带来了市场放量预期和规格大幅提升。GB200机柜使用了5000根铜缆,与CPU之间的配比关系从巴卡时代的六倍跃升至70倍左右,同时传输速率也从56G升级到112G甚至更高,传输距离也有所增加。这些规格提升带来的价值量提升使得市场有了大幅跨越,因此现在开始重视GB200同链接市场。

GB200机柜内部的连接方案有何创新之处?

GB200内部的连接采用了NV link方案,使用铜缆连接,相较于光连接,成本下降六倍且性能表现出色。

未来是否有可能实现更高速率的连接器和线缆?

随着技术的发展,未来的高速连接器和线缆有可能会出现突破,比如低延迟的铜线缆或光模块。但是目前仍存在良品率和成本等问题,以及铜线缆在短距离走线上的挑战。

GPU铜缆连接线的价值

目前GPU连接线的价值量大约在十几万美金左右。5000根(1250*4根),一共100-120w(铜缆+连接器占服务器bom的6-7%)其中,铜缆100万,连接器10-15万(一个端口80元RMB)。另一种说法单台价值在200万人民币左右。

网传一张铜缆市场价值测算图:

下一代计算设备的趋势是什么?

下一代计算设备可能将不再采用PCIe接口,而是采用光模块或硅光芯片作为连接方式,这是长期发展趋势。英伟达已经在研发基于CPU的光引擎交换芯片,但此类技术面临的挑战包括良品率和电信号传输距离短等问题。

光模块的需求是否会因客户大部分需求已满足而下降?未来光模块市场的趋势如何?

对于大部分中大客户而言,跨机柜时仍需使用光模块进行互联。随着参数量逐渐增大,单机柜内的推理和训练将不足以满足需求,这将导致光模块用量保持稳定或增加。未来光模块市场将继续受益于GB200放量带来的需求增长,预计1.6T光模块的需求会超出市场预期。

未来随着推理需求增长,光模块需求量会如何变化?

如果推理占比持续增长,光模块的需求量也会相应增加,但增幅可能不像去年那样迅猛。新增资本投入将促使推理主机性能提升,从而带动网络速率和高配版模块用量的增长,总体算力仍会增长,但增长速率可能减缓。

背板连接器的边际变化和行业趋势

背板连接器的连接方式从传统的PCB板转向线缆背板模式,这种模式具有更好的散热、更低的传输损耗和更长的传输距离,但成本较高。背板连接器的价值量占单台服务器的3%到5%。未来的需求将主要来自AI服务器的需求,推动背板连接器向线缆背板模式发展。

核心标的:

铜缆部分:博威合金:,立讯精密,鼎通科技,沃尔核材,金信诺,精达股份,兆龙互连

光模块:中际旭创,天孚通讯,新易盛

----------------------

过往行业逻辑整理:

如果文章对您有所助益,点击下方“在看”支持一下!

6 阅读:988

每日调研备忘录

简介:感谢大家的关注