今晚(凌晨02:00),黄仁勋将发表主题演讲,其中一个关注点是英伟达下一代芯片——Feynman,将侧重推理,并转向LPU架构。 传统的GPU架构虽然在模型训练的海量数据思考中表现出色,但在快速回应的推理环节表现不足,为了解决这一痛点,一种全新的芯片架构——LPU(语言处理单元,Language Processing Unit) 应运而生,LPU是专为自然语言处理和大模型推理阶段设计的ASIC专用芯片。 LPU有两个核心特点,一是摒弃了传统的HBM,转而采用大容量的片上静态随机存取存储器SRAM作为主要存储介质,以Groq公司的LPU为例,每颗芯片内置约230MB的SRAM,总带宽高达惊人的80TB/s。二是张量流处理器TSP架构,取得极致的低延迟和高度稳定的时延表现,对于自动驾驶、实时语音交互等对响应时间极其敏感的应用场景至关重要。 Feynman是英伟达计划在2028年推出的下一代GPU架构,将接替Rubin架构,采用台积电最先进的A16制程,并首发多项前沿技术,其中最具革命性的变革,是它对LPU的深度整合。根据行业报告和爆料,英伟达已斥巨资获得Groq公司的LPU技术授权,并计划在Feynman架构中,通过3D堆叠技术将LPU单元直接融入GPU。 Feynman转向LPU架构,将带来多个产业链增量: 1. PCB量价齐升。LPU单颗芯片的SRAM容量有限(约230MB),市场预期,一个标准的LPU机柜可能集成高达256颗芯片 。相较于传统8卡GPU服务器,单柜内芯片数量的激增,直接导致PCB用板面积大幅提升。同时,为了支撑256颗芯片间的高速互连,LPU集群必须舍弃传统的铜缆方案,转向高多层PCB板进行信号传输。因此单颗LPU芯片对应的PCB价值量有望达到3000元人民币,是传统方案的5至10倍,单柜PCB的总价值量预计将达到45万至70万元人民币,PCB的总需求进一步打开。 2. CCL与电子布的升级。为了满足52层PCB及超高速信号传输的需求,PCB上游材料必须转向M9级超低损耗覆铜板,从而带来M9相关的CCL、石英布、铜箔、钻针等环节进一步升级。 3. SRAM存储的价值重估。在AI推理领域,SRAM被证明是实现最低延迟的关键技术,Feynman将加速SRAM从“配角”缓存向“主角”存储的转变。 4. 先进封装的升级。提升先进封装(如CoWoS、SoIC)的需求,因为将大规模SRAM与计算芯片堆叠,是实现高性能LPU的前提。