硅谷开始怀疑GPU:Cerebras高光上市背后,AI算力即将迎来后GPU时代?

日期:2026-05-29 20:59:22 / 人气:6


上周四,英伟达再度交出一份炸裂财报,营收与利润双双超出市场预期,GPU看似依旧牢牢垄断全球AI算力市场,霸权无人撼动。
但今天我们抛开英伟达的高光业绩,聚焦另一桩足以改写AI算力底层格局的大事——今年美股规模最大科技IPO:Cerebras登陆纳斯达克。
5月14日,非GPU算力赛道独角兽Cerebras正式挂牌上市,发行价185美元,上市首日股价一度冲高至386美元,盘中最大涨幅接近翻倍,收盘依旧大涨68.15%,报311.07美元。即便经历后续小幅回调,截至上周五收盘,其股价依旧较发行价高出近四成,资本市场追捧力度可见一斑。
外界大多将Cerebras视作英伟达的新晋挑战者,讨论它能否瓜分GPU的市场份额。但抛开表层的竞品博弈,Cerebras成功上市真正的行业意义,远比对抗英伟达更加深远:
它把一个硅谷内部争论已久、却始终没有摆在明面上的核心问题,推向了公开资本市场中心——AI下一代基础设施,是否即将迎来后GPU范式革命?
过去一年,这条暗流一直在硅谷涌动,多家非GPU芯片公司截然不同的命运,已经给出了信号:
- 去年年末,英伟达斥资200亿美元收购Groq技术资产并吸纳核心团队,黄仁勋事后直言,Groq团队自主独立发展已经看不到突围机会;
- 曾经被寄予厚望、代表欧洲顶尖芯片实力的AI芯片黑马Graphcore,2024年被软银低价收购,彻底折戟,成为非GPU路线失败的典型样本;
- 而如今,坚持晶圆级芯片独特路线的Cerebras,逆风完成大额IPO,获得资本市场强力背书。
三家企业,三种结局,路线各异,却指向同一个终极疑问:明明GPU依旧统治全球AI算力市场,为什么硅谷资本与科技巨头,开始集体下注非GPU路线,甚至开始怀疑GPU的长期价值?
下文深度拆解Cerebras的逆袭逻辑,看懂这家公司的起死回生,就能读懂当下AI算力行业正在发生的底层变局。
一、蛰伏九年:Cerebras并非新秀,只是终于等到属于自己的时代
很多人误以为Cerebras是AI热潮下诞生的新公司,实则不然。这家企业早在2016年就已成立,深耕晶圆级WSE芯片赛道近十年,一路走来历经坎坷,甚至长期陷入「技术全球顶尖,却没有市场需求」的尴尬困境。
早在2024年,Cerebras就计划冲击美股IPO,却直接折戟于监管审查。公司背后拥有阿布扎比主权AI基金Group 42大额投资,外资持股结构让其IPO申请进入美国CFIUS(美国外国投资委员会)漫长安全审查流程,上市计划被迫搁置。
除此之外,上市前夕资本市场还有两大核心质疑点:一是公司营收高度依赖单一客户G42,客户集中度风险极高;二是自研超大尺寸晶圆级芯片工艺难度拉满,量产稳定性、规模化落地能力一直饱受争议。
但监管风险、客户依赖、工艺难题,都只是表层阻碍。Cerebras蛰伏近十年无人问津,最核心的原因从来不是技术不够强,而是过去整整十年,AI行业根本不需要它。
二、AI行业底层变局:从训练为王,进入推理瓶颈期,GPU固有缺陷彻底暴露
过去十年,AI行业处于大模型训练时代,全行业的核心诉求极其单一:极致堆叠算力。
彼时行业所有人的解题思路高度统一:想要更强算力,就堆叠更多英伟达GPU。GPU通用性强、生态完善、软件工具链成熟,完美适配大模型暴力训练需求,一家公司垄断了全球AI算力底层。
在纯训练场景下,GPU没有对手,非GPU专用芯片没有任何生存空间。
但从2025年下半年开始,AI行业完成关键转折:行业重心从一次性的大模型训练,全面转向常态化、规模化的线上推理。模型训练的痛点是算力不足,而AI推理时代,行业痛点彻底改写。
当下GPU集群最大的致命短板浮出水面:多卡GPU之间通信延迟极高,集群内部沟通成本居高不下。
大量GPU并联组网之后,芯片之间数据传输、指令同步耗时急剧攀升,带来三大无法规避的行业难题:用户端AI对话等待时间变长、接口响应延迟居高不下、大规模推理集群整体运营成本持续走高。
更关键的是,这是英伟达GPU架构与生俱来的底层缺陷,依靠迭代芯片制程、升级硬件参数,都无法从根源上解决。GPU适合拆分任务、并行计算做训练,却天生不适合低延迟、高实时性的大规模推理场景。
三、阴差阳错:诞生于训练时代的非GPU架构,精准命中推理时代刚需
极具戏剧性的一点是:Cerebras从创立之初,就不是为了解决AI推理痛点而生。
2016年Cerebras成立之时,ChatGPT尚未问世,生成式大模型浪潮还未到来,AI Agent、实时对话推理、云端高并发推理全部都不存在。公司最初研发晶圆级超大芯片,目标只是突破单芯片算力上限,服务早期AI模型训练。
时代浪潮更迭,无心插柳柳成荫。它坚守多年的非主流、反行业共识的非GPU路线,恰好完美补齐了当下GPU最大的短板。
Cerebras采用整片晶圆一体化封装,将海量计算核心集成在单颗芯片内部,无需多卡互联,从底层彻底消灭了芯片之间的通信延迟。相比于GPU多卡集群,它在实时推理、高并发对话、低延迟AI应用场景中,拥有碾压级原生优势。
放在五年前,这一优势毫无用处;而在当下全民落地AI应用、推理成本成为企业最大开支的时代,这一技术特性,直接变成了核心护城河。
四、营收结构彻底转向:市场不再把它当芯片公司,而是下一代算力基建
翻阅Cerebras完整招股书,能清晰看见这家公司商业模式的根本性转变,这也是资本市场愿意重金买单的核心逻辑。
前几年,Cerebras收入几乎100%依靠售卖自研硬件整机,直白来说就是卖芯片、卖算力服务器,和传统硬件厂商别无二致,只是硬件架构不同。
近两年,公司营收结构发生颠覆性变化:AI推理云服务收入占比持续暴涨,营收重心从卖硬件,转向直接提供标准化推理算力服务。
资本市场读懂了这次转型:Cerebras不再只是一家另类的AI芯片设计公司,而是一套可以替代GPU集群、适配未来AI应用生态的全新算力基础设施。
五、写在最后:GPU不会消亡,但算力市场再也不是一家独大
需要明确的是,硅谷开始怀疑GPU,从来不是判断GPU会彻底退出市场。在模型预训练、通用AI开发、多元化AI实验场景中,GPU完善的软件生态和通用性,依旧无可替代。
行业真正的共识是:AI算力单一GPU垄断的时代已经结束。
训练看GPU,推理看专用非GPU芯片,正在成为硅谷头部科技公司的全新算力采购逻辑。英伟达收购Groq补齐低延迟推理短板、Cerebras成功上市突围、Graphcore折戟证明小众路线的生存难度,三轮行业事件串联起来,完整勾勒出算力行业新格局。
Cerebras的上市高光,从来不是一场芯片公司的突围战,而是整个AI行业基础设施迭代的信号:
算力竞争,早已不再比拼谁能堆出更多的计算核心。解决通信延迟、降低推理成本、适配实时AI应用,才是下一代算力基建真正的胜负手。
后GPU时代,已然悄然而至。

作者:万向娱乐




现在致电 xylmwohu OR 查看更多联系方式 →

COPYRIGHT 万向娱乐 版权所有