群发资讯网

英伟达LPU(语言处理单元,Feynman架构)是专为AI实时推理打造的专用芯片

英伟达LPU(语言处理单元,Feynman架构)是专为AI实时推理打造的专用芯片,将重构AI算力格局,并对上游硬件、存储、封装、散热、下游应用全产业链带来结构性影响。一、LPU核心定位与技术突破- 定位:与GPU互补,GPU做训练+高吞吐推理,LPU做超低延迟、确定性、高能效推理(如实时对话、金融交易)。

- 关键创新

- 片上SRAM替代HBM,带宽80TB/s(HBM的10倍)、延迟