群发资讯网

图中是又一家专做大模型硬件的公司,两个google前员工出来创业了“我们正在开发

图中是又一家专做大模型硬件的公司,两个google前员工出来创业了“我们正在开发一款LLM芯片,它比任何其他芯片提供更高的吞吐量,同时实现最低的延迟。我们称之为MatX One。

MatX One芯片基于可分割的脉动阵列,具备大规模脉动阵列所著名的能效和面积效率,同时在小型矩阵和灵活形状的矩阵上也能实现高效利用。该芯片结合了SRAM优先设计的低延迟与HBM的长上下文支持。这些元素,再加上对数字运算的新颖处理,使得在LLM应用中,MatX One的吞吐量超过了任何已公布的系统,同时延迟与SRAM优先设计相匹配。更高的吞吐量和更低的延迟为您的订阅费用带来更智能、更快速的模型。”