Cerebras 深度解析
晶圓級範式:重寫矽晶片規則
Cerebras 的架構前提與既有的半導體產業截然不同。該公司並非將標準的 12 吋矽晶圓切割成數十個獨立晶片,而是讓晶圓保持完整,打造出單一的巨型處理器。其最新一代產品 Wafer-Scale Engine 3 採用 5 奈米製程,集成了 4 兆個電晶體及 90 萬個運算核心。其面積達 46,225 平方毫米,大約是傳統旗艦硬體加速器的 57 倍。這種龐大的單體設計直接解決了現代高運算負載中的主要瓶頸:記憶體牆(memory wall)。透過將 44 GB 的 SRAM 直接保留在晶圓上,Cerebras 實現了前所未有的每秒 21 PB 記憶體頻寬,規避了在不同獨立晶片間傳輸資料所帶來的延遲與功耗成本。
該公司透過結合硬體銷售與雲端運算服務的混合商業模式獲利。Cerebras 不銷售獨立的矽晶片組件,而是將晶圓封裝成專有的統包式設備 CS-3,將電源供應、液冷系統與主機介面整合至一個僅佔標準資料中心機櫃三分之一空間的機箱中。過去,營收主要由大規模、專案導向的叢集部署所驅動,多半用於構建主權超級電腦。然而,其商業模式正積極轉向基礎設施即服務(IaaS)。透過其推論雲端部門以及與大型公有雲營運商的合作,該公司為開發者提供託管運算能力來創造營收,目標鎖定那些需要為基礎模型提供確定性、低延遲效能,卻不想投入資本購買實體硬體基礎設施的企業。
客戶集中度與主權生命線
分析該公司的財務結構可發現,其爆炸性的營收成長背後隱藏著極端的脆弱性。Cerebras 2025 年總營收為 5.1 億美元,年增率達 76%。然而,其中高達 86% 的營收僅來自兩家位於阿拉伯聯合大公國的實體。僅穆罕默德·本·扎耶德人工智慧大學(Mohamed bin Zayed University of Artificial Intelligence)一家就佔全年營收的 62% 及應收帳款的 78%,而 Group 42 則貢獻了另外 24%。與此同時,來自美國客戶的營收年減 34%,降至 1.876 億美元。該公司目前的運作更像是一家在地化主權計畫的專屬硬體供應商,而非多元化的企業供應商。此外,儘管認列了 3.63 億美元與 Group 42 負債重組相關的非現金會計收益,該公司 2025 年仍報告了 7,570 萬美元的非 GAAP 營業虧損,較前一年的 2,180 萬美元進一步擴大。
為了抵銷這種生存級的客戶集中風險,Cerebras 於 2025 年 12 月與 OpenAI 簽署了一份具轉型意義的 200 億美元主關係協議。該合約承諾客戶在 2028 年前採購 750 MW 的推論運算能力,並可選擇在 2030 年前擴充至 2 GW。此交易包含一筆由客戶提供給 Cerebras、利率為 6% 的 10 億美元營運資金貸款。雖然此協議在生態系統的最高層級驗證了其技術,但也將一種集中風險轉嫁為另一種。該龐大積壓訂單的執行高度依賴外部因素,包括電網電力供應及上游供應商的製造產能。Cerebras 完全依賴單一晶圓代工廠的單一 5 奈米製程節點。隨著該代工廠為服務市場龍頭而積極將 5 奈米產能轉向 3 奈米製程,Cerebras 正面臨迫在眉睫的供應鏈風險,這可能在龐大產能承諾即將履約之際,壓縮利潤空間或延遲硬體交付。
市場結構與推論戰場
預計到 2033 年將成長至 6,040 億美元的資料中心半導體市場,正經歷從模型訓練轉向模型推論的結構性轉變。在早期的訓練時代,由於通用處理器的靈活性與成熟的軟體生態系統,同質化的通用運算處理器叢集佔據了主導地位。目前,一家市場龍頭仍掌握該通用硬體市場約 94% 的份額。然而,隨著企業採用的規模擴大,推論任務已佔運算成本的絕大多數。推論執行對記憶體頻寬與延遲極為敏感,通常以產生第一個輸出 token 所需的時間來衡量。這種典範轉移強烈有利於專為解碼邏輯設計的特殊應用積體電路(ASIC)。隨著超大規模資料中心(hyperscalers)追求更優異的單位經濟效益,客製化加速器市場預計將以 27% 的年複合成長率成長,於 2033 年達到 1,180 億美元。
Cerebras 目前是此客製化硬體類別中最大的獨立供應商,但正面臨市場龍頭激進的防禦性手段。該龍頭意識到專用推論晶片帶來的威脅,於 2025 年底以 200 億美元收購了一家領先的替代推論晶片設計商。此次收購將專用的語言處理技術直接整合進市場龍頭預計於 2026 年出貨的異質機架架構中。這將競爭格局整併為一場二元對決:Cerebras 的同質化晶圓級方案,對抗龍頭深耕已久的多架構生態系統。若龍頭能在其無所不在的軟體框架中無縫提供高速、解構式的推論效能,Cerebras 獨立硬體的潛在市場將大幅萎縮。
競爭護城河與運算的物理法則
Cerebras 的主要競爭優勢植根於實體硬體物理學,而非軟體市佔率。透過解決困擾業界數十年的晶圓級整合製造難題,該公司從根本上改變了大型矩陣運算的「效能功耗比」。傳統分散式運算需要將大型神經網路分割到數千個較小的獨立晶片上,這引入了巨大的軟體複雜性與網路延遲瓶頸。單一 Cerebras CS-3 系統通常能將整個大型模型保留在原生記憶體空間內,有效地以矽晶片級整合取代了系統級的網路複雜性。這種確定性的擴充性提供了線性的效能提升,而無需分散式資料中心叢集常見的變異性與同步開銷。
然而,這道結構性護城河受到冗餘工程的嚴密防禦。晶圓級矽晶片以良率極低著稱;理論上,單一微小缺陷就可能毀掉整片晶圓。Cerebras 透過為硬體配備數百萬個冗餘運算與記憶體單元來規避此問題,並在製造層級動態繞過缺陷區域。雖然這解決了良率問題,但產出的系統資本密集度極高。單一實體節點估計成本在 200 萬至 300 萬美元之間,且耗電量超過 15 kW。這種營運模式將該公司的目標市場限制在頂級雲端供應商、大型政府實驗室及擁有主權財富基金支持的設施,嚴重限制了其在基層企業的普及。
管理團隊背景:SeaMicro 策略的規模化
由執行長 Andrew Feldman 領導的管理團隊,為企業硬體領域帶來了經過驗證且執行力強的實績。核心創始團隊曾創立 SeaMicro,該公司是高密度、節能微型伺服器領域的先驅,於 2012 年以 3.34 億美元被成功收購。超過 50 名來自該創業計畫的工程師直接轉職至 Cerebras,凸顯了一種異常凝聚的工程文化,在人才流動率極高的產業中,這種文化已維持了超過十年。
管理層展現了敏銳的策略靈活性,特別是在應對複雜的監管與地緣政治阻力方面。當該公司於 2024 年底因涉及阿布達比資本連結的國家安全審查而導致首次公開募股(IPO)停滯時,高層迅速將股權重組為無投票權股份。此舉積極排除了外國實體對公司治理的影響,並於 2025 年初獲得聯邦監管機構核准。此外,管理層在公司早期發展階段拒絕收購邀約,並大膽引領公司邁向 230 億美元公開市場估值的決策,凸顯了他們對自身架構藍圖的高度營運信心。
總結評分
Cerebras 的核心論點在於,這種優雅的架構解決方案能否在既有壟斷者完全吞噬推論市場之前,實現超大規模的商業採用。其底層的晶圓級技術從根本上解決了困擾現代軟體負載的記憶體頻寬限制,為高速 token 生成提供了不可否認的單位經濟優勢。然而,該業務的財務結構仍處於危險的平衡狀態。由於 86% 的當前營收繫於單一外國主權計畫,且營業虧損在一次性會計收益的遮掩下持續擴大,該公司的短期生存能力完全取決於能否執行與頂尖軟體建構商簽署的 200 億美元產能合約。這要求在純晶圓代工廠積極轉移製造產能以支援硬體龍頭壟斷之際,必須具備完美的供應鏈管理能力。
歸根究柢,Cerebras 提供了標準離散處理器範式之外最可信的實體替代方案,但它面臨的商業機會窗口正迅速縮小。市場龍頭已透過近期的大規模收購,有效承認了專用推論晶片帶來的生存威脅,並正積極將異質硬體綑綁進其無所不在的開發者生態系統中。Cerebras 若要證明其在公開市場 230 億美元估值的合理性,必須迅速實現企業客戶群的多元化、擴大雲端服務營收,並明確證明晶圓級運算能從高度專業化的主權好奇心,轉變為全球雲端基礎設施堆疊中標準化且不可或缺的一環。