美东时间12月2日(周二),在年度云计算盛会re:Invent上,亚马逊云计算部门AWS动作频频,向AI芯片市场两大巨头英伟达和谷歌发起了有力挑战。当天,AWS推出了新一代人工智能(AI)训练芯片Trainium 3,这是亚马逊首款3nm制程的AI芯片,由台积电代工生产。同时还预告了下一代产品Trainium 4的开发计划。不仅如此,AWS同时推出Nova 2系列模型和全新AI服务,意图在竞争白热化的AI领域抢占更多市场份额。

AWS方面宣布,Trainium 3芯片已在近期部署到至少数个数据中心,自本周二起正式向客户开放使用。在客户使用方面,目前Anthropic是使用Trainium芯片的主要客户,这些芯片分布在印第安纳州、密西西比州和宾夕法尼亚州的数据中心。值得一提的是,AWS今年早些时候就已采取行动,将超过50万颗芯片串联起来,助力Anthropic训练最新模型,并且计划在年底前为这家OpenAI的劲敌提供多达100万颗芯片。
从性能参数来看,每颗Trainium 3芯片可提供2.52千万亿次浮点运算(PFLOPs)的FP8算力。其内存容量相较于Trainium 2提升了1.5倍,达到144GB HBM3e,内存带宽也提升了1.7倍,高达4.9TB/s。而单台完整配置的Trn3 UltraServer更是“实力强劲”,能够容纳144颗芯片,总算力可达362 PFLOPs,同时提供高达20.7TB的HBM3e内存以及706TB/s的聚合内存带宽。
