在这个圣诞节,英伟达联手 Groq 给芯片领域制造了一个大新闻。
曾领投 AI 芯片初创 Groq 7.5 亿美元融资的美国投资机构 Disruptive 的 CEO 艾利克斯·戴维斯(Alex Davis)告诉媒体,英伟达已同意以 200 亿美元现金收购 Groq 的资产。如若成交,这将是英伟达迄今为止的最大收购。
Disruptive 于 2025 年 9 月领投了 Groq 的最新一轮融资。戴维斯表示,自 Groq 于2016年成立以来,他的公司已向该公司投资超过 5 亿美元。三个月前,Groq 以约 69 亿美元的估值融资 7.5 亿美元。该轮融资的投资者包括贝莱德、纽伯格伯曼、三星、思科,以及 Altimeter 和 1789 Capital,值得注意的是美国总统特朗普的儿子小唐纳德·特朗普(Donald John Trump Jr.)是 1789 Capital 的合伙人。
(来源:Groq)
作为 Groq 的创始人兼 CEO,乔纳森·罗斯(Jonathan Ross)有着极具传奇色彩的求学历史与创业背景。他早年就读于美国纽约大学库朗数学科学研究院,主修数学和计算机科学。在校期间他展现出惊人天赋,大二时便成为首位获准修读仅限博士生参加的课程的本科生,并曾师从图灵奖得主杨立昆(Yann LeCun)。
图 | 乔纳森·罗斯(Jonathan Ross)(来源:领英)
毕业后,罗斯加入谷歌。起初,他只是一名负责广告软件系统的工程师,但他敏锐地观察到语音识别等 AI 任务对于算力的巨大渴求,于是利用谷歌著名的“20% 时间”理念启动了一个实验性项目(即谷歌允许员工每周拿出 20% 的工作时间也就是每周一天来处理自己感兴趣、但并非其日常工作职责的项目,以此激发内部创新)。
这个项目最终演变成了让谷歌得以改变行业的张量处理单元(TPU,Tensor Processing Unit)。作为 TPU 的核心设计者,罗斯参与设计的芯片一度支撑了谷歌在全球的 50% 的算力需求。随后,他加入谷歌母公司 Alphabet 旗下的 X 实验室,该实验室的前身是 Google X。在那里,罗斯负责孵化谷歌著名的“登月计划”。2016 年,罗斯从谷歌离职创办了 Groq。
Groq 在 2016 年底曾向美国证券交易委员会提交的首份文件中宣布筹集 1030 万美元资金,其中列出的负责人是罗斯和道格拉斯·威特曼(Douglas Wightman),后者是 Google X“登月工厂”的前工程师。根据威特曼的领英个人资料显示,他于 2019 年离开了 Groq 。
作为一家此前旨在挑战英伟达的 AI 芯片初创公司,Groq 的核心技术在于其自主研发的语言处理单元(LPU,Language Processing Unit)推理引擎。LPU 是专为快速、高效运行大模型等推理任务而优化的专用计算设备,其设计目标直指大模型的两个主要瓶颈:计算密度和内存带宽。
与依赖外部高带宽内存(HBM,High Bandwidth Memory)的传统 GPU 不同,Groq 的 LPU 采用了片上集成大容量静态随机存取存储器(SRAM,Static Random-Access Memory)的方案,其 230MB 的片上 SRAM 能提供高达 80TB/s 的内存带宽,这使其数据处理速度远超 GPU 方案。
更重要的是,Groq 通过独特的张量流处理器(TSP,Tensor Streaming Processor)微架构设计实现了硬件执行的确定性,它摒弃了传统 CPU/GPU 中诸如乱序执行、预测执行等导致不确定性的复杂设计,转而由一个功能强大的编译器来精确调度每一个计算步骤和数据流。
这种软件定义硬件的模式,使得编译器能够对整个系统中指令执行和数据移动的时序进行周期级精准控制,从而在由成百上千个 TSP 芯片组成的分布式系统中也能实现高性能的确定性推理。
Groq 的产品策略并非单纯销售芯片硬件,而是作为推理引擎提供完整的解决方案,主要面向开发者和企业客户提供两种部署模式:云服务与本地硬件集群。
其云服务因惊人的推理速度而闻名,在运行如 Mixtral、Llama 2 等开源大模型时,每秒可输出约 500 个 tokens,远超传统服务的响应速度,同时其每百万 tokens 的价格也极具竞争力。
Groq 希望通过这种高效低成本的推理能力,推动 AI 算力的民主化。为了实现规模化推理,Groq 设计了可扩展的分布式系统,能够将数千个 LPU 芯片互联,让计算流持续在芯片间流动,从而避免了传统架构因频繁访问外部内存带来的能耗与延迟。得益于其架构优化,LPU 的单位 token 能耗可降至 GPU 的三分之一左右。
当然,这种追求极致速度和确定性的架构也有其权衡,例如单卡内存容量较小,在运行大型模型时需要更多芯片协同工作,初期硬件成本较高。但 Groq 的愿景是明确的:在一个 AI 推理需求即将远超训练需求的时代,通过其创新的 LPU 架构,为市场提供一个高效、低成本且可规模化的推理基础设施新选择。
前文提到的戴维斯告诉媒体,在英伟达接洽之前,Groq 并没有寻求出售。Groq 当地时间周三在一篇博客文章中表示,已与英伟达就 Groq 的推理技术达成一项非独家授权协议,但未透露具体价格。文章称,根据协议,Groq 创始人兼 CEO 罗斯、公司总裁桑尼·马德拉(Sunny Madra)及其他高管将“加入英伟达,共同推进和扩大这项授权技术的应用”。 Groq 在文章中补充说,它将继续作为一家“独立公司”运营,由首席财务官西蒙·爱德华兹(Simon Edwards)担任 CEO。
戴维斯告诉媒体,英伟达将获得 Groq 的所有资产,但其新兴的云业务 GroqCloud 不包含在此次交易中。Groq 也表示,“GroqCloud 将继续运营,不会中断。”
这笔交易或将成为英伟达迄今为止规模最大的一笔收购。英伟达此前最大的一笔收购发生在 2019 年,当时它以近 70 亿美元的价格收购了以色列芯片设计公司 Mellanox 。截至 2025 年 10 月底,英伟达拥有 606 亿美元的现金和短期投资,高于 2023 年初的 133 亿美元。
媒体获得的一封英伟达 CEO 黄仁勋在发给员工的电子邮件中表示,该协议将扩大英伟达的能力。 黄仁勋写道:“我们计划将 Groq 的低延迟处理器集成到英伟达 AI 工厂架构中,扩展该平台以服务于更广泛的 AI 推理和实时工作负载。”
2025 年 9 月,英伟达促成了一笔类似但规模较小的交易,当时该公司斥资超过 9 亿美元聘请了 Enfabrica 的 CEO 罗汉·桑卡尔(Rochan Sankar)和这家 AI 硬件初创公司的其他员工,并获得了该公司的技术许可。 随着现金储备的增加,英伟达加大了对芯片初创公司和更广泛生态系统的投资。其也已投资 AI 和能源基础设施公司 Crusoe、AI 模型开发商 Cohere,并增加了对 CoreWeave 的投资。
2025 年 9 月,英伟达宣布计划向 OpenAI 投资高达 1000 亿美元,OpenAI 承诺部署至少 10 吉瓦的英伟达产品。但是,两家公司尚未正式宣布达成协议。同月,英伟达还宣布将向英特尔投资 50 亿美元。除了收购之外,英伟达也一直通过投资初创公司来加强自身护城河。总之,英伟达强者恒强的局面似乎正在形成。
参考资料:
https://www.cnbc.com/2025/12/24/nvidia-buying-ai-chip-startup-groq-for-about-20-billion-biggest-deal.html
https://finance.yahoo.com/news/nvidia-buy-ai-chip-startup-210634730.html
https://www.benzinga.com/news/25/12/49588049/nvidia-buying-ai-chip-startup-groq-for-about-20-billion-in-its-largest-acquisition-on-record-cnbc
https://www.morningstar.com/news/dow-jones/202512243565/nvidia-to-buy-chip-designer-groq-for-20-billion-cnbc-reports
https://www.investors.com/news/technology/nvidia-buying-ai-chip-startup-groq-in-record-20-billion-deal/
https://techcrunch.com/2025/12/24/nvidia-acquires-ai-chip-challenger-groq-for-20b-report-says/
https://groq.com/about-groq