Cerebras 執行長:「沒人想要緩慢的 AI」—— 談 200 億美元 OpenAI 合約、AWS 架構布局,以及為何這不是泡沫
Bloomberg Tech 2026,舊金山 — 2026 年 6 月 4 日
在完成 Cerebras 執行長 Andrew Feldman 所稱「史上最大規模半導體 IPO」的兩週後,Feldman 於舊金山舉行的 Bloomberg Tech 2026 會議上,與彭博社記者 Tom Giles 進行對談。他詳細闡述了公司的商業論點、與超大規模雲端供應商(hyperscalers)的合作架構,並針對 AI 基礎設施支出是否過熱提出了明確看法。這些回應比大多數投資人會議一整季提供的資訊更具啟發性。
OpenAI 與 AWS 合約是藍圖,而非特例
此次對談中最關鍵的新資訊,在於 Cerebras 在 IPO 前夕商業動能的結構與規模。Feldman 確認已與 OpenAI 簽署一份金額「超過 200 億美元」的承諾性「照付不議」(take-or-pay)合約,簽約時間約在與 AWS 達成協議的 45 天前。這兩筆交易共同建立了一種商業模式,Feldman 形容此模式旨在擴展至其他超大規模雲端供應商——但有一個明確的例外。他說:「我們目前正致力於將此流程應用於與社群中所有成員合作,即除了 Nvidia 以外的其他超大規模雲端供應商,利用我們的技術解決部分問題,並結合他們的技術解決另一部分。」當被追問時,他證實:「沒錯,除了他們之外的所有人。」
AWS 的合作案在架構上極具意義,值得投資人密切關注,因為它揭示了 Cerebras 如何嵌入現有的雲端基礎設施,而非與其正面競爭。其核心洞察在於將推論(inference)工作負載拆解為兩個不同的運算問題。第一部分稱為「預填充」(prefill),用於處理輸入的提示詞(prompt),具有高度可並行性,這意味著超大規模雲端供應商現有的訓練優化晶片能妥善處理;第二部分稱為「解碼」(decode),即生成實際答案的過程,則屬於嚴格的序列運算,這正是 Cerebras 晶片發揮效能優勢之處。Feldman 解釋:「我們可以使用他們的訓練晶片來處理預填充,並利用我們的大型晶片來處理解碼。最終我們將得到這套卓越的解決方案。」對投資人而言,這意味著 Cerebras 並非試圖全面取代超大規模雲端供應商的基礎設施,而是切入推論管線中對延遲最敏感、價值最高的一環。
速度就是產品——市場類比直指核心
Feldman 以 Google 2009 年的一篇論文為基礎論證速度的重要性,該研究顯示,即使回應延遲僅有微小增加,也會顯著降低用戶參與度、留存率和工作階段長度——即便用戶並未察覺到延遲。他將此轉化為直接的市場規模論點:「慢速搜尋的市場有多大?撥接上網的市場又有多大?」他將速度定義為產品類別的決定性特徵,而非單純的效能指標。Cerebras 聲稱其推論速度比競爭對手快 15 倍以上。Open Claw 設計師 Peter Steinberger 曾形容,使用 Cerebras 的技術「就像給了他一把雷神之鎚」,大幅提升了程式開發效率。
該公司聲稱比替代方案快 15 倍以上的效能,仍是其商業主張的核心支柱,而贏得 OpenAI 和 AWS 的訂單則提供了重要的第三方驗證。然而,隨著競爭架構的演進,這種效能領先優勢是否能持續,仍是訪談中未直接回應的合理疑問。
250 億美元積壓訂單與反泡沫論點
針對 AI 基礎設施支出是否構成泡沫的質疑,Feldman 給出了目前最直接且具實證基礎的論點:Cerebras 目前擁有超過 250 億美元的積壓需求,這是包括 AMD 和 Nvidia 在內的任何供應商都無法滿足的。「建設者的進度遠遠落後於需求,這簡直荒謬。」他認為,歷史上的泡沫值得深思,「歷史上的泡沫特徵在於『只要你蓋好,他們就會來』的假設,」他引用 1990 年代後期的光纖建設和 1870 年代的鐵路建設為例。「AI 目前的特殊之處在於,建設者的進度遠遠落後於需求。」他補充說:「我們的客戶及其客戶正以軟體的速度前進,而我們卻受限於資料中心基礎設施的建設速度。」
若 250 億美元的積壓訂單數據準確,這對該產業而言是重要的數據點。投資人應注意,Feldman 並未細分這些積壓訂單的構成,也未說明轉化為營收的時間表,考慮到資料中心部署的長週期特性,這些資訊至關重要。
客戶集中度:一個大客戶,然後是一個更大的客戶
Feldman 以一貫直接的態度回應了客戶集中度風險。在與 OpenAI 簽約前,Cerebras 在 2023 年底與總部位於阿聯酋的 AI 領軍企業 G42 簽署了 10 億美元的承諾合約。當公司嘗試募資時,投資人曾指出單一客戶依賴的風險。隨後,Cerebras 簽下了超過 200 億美元的 OpenAI 合約,接著又是 AWS。Feldman 表示:「我過去有一個大客戶,現在依然只有一個,只是規模大了 20 倍。」他將此與 Nvidia 的客戶集中度進行對比:「Nvidia 上季營收約 680 億美元,其中四個客戶就佔了一半。這就是我們所處的商業世界。」此觀點固然有理,但也並未消除集中度風險,只是將其在產業內常態化了。
他同時提供了一種有用的視角,重新定義大客戶在實務上代表的意義。G42 是一家服務阿聯酋生態系統中大學、石油公司及數百家終端用戶的雲端供應商;OpenAI 的運算需求最終反映了數十億個別終端用戶的需求。單看帳面上的客戶數量,反而低估了實際服務的終端需求廣度。
Token 經濟學正加速成熟
針對 Token 限制、價格敏感度及企業 AI 運算分配等新興議題,Feldman 使用了 Costco 的類比來精確說明。早期的企業 AI 採用模式就像是在沒有購物清單的情況下逛遍倉儲超市的每個貨架——既浪費又缺乏規劃。「微軟有一天意識到,Token 很昂貴,」他指出,回頭來看,這種認知顯而易見。「我們還讓誰可以無限制地使用資源?這從一開始就是愚蠢的。」市場現在正學會區分:針對能證明成本合理性的任務使用高性能前沿模型,其他任務則使用開源替代方案,並根據個人生產力水準進行內部分配。Feldman 認為這是一種健康且快速的常態化過程,而非需求崩潰的訊號。
資料中心瓶頸與產業在社區關係上的失敗
Feldman 對 AI 產業未能為資料中心擴張爭取社區支持一事,表現得異常坦誠。限制是真實存在的——Cerebras 的雲端服務與所有超大規模雲端供應商一樣,受限於資料中心的可用性——但他認為政治阻力很大一部分源於可避免的自我挫敗。「我們本可以成為好鄰居。我們本可以走進這些社區,利用當地的流程和政府來獲得批准與支持。」他提到產業未能有效溝通就業機會、稅收貢獻,以及一個反直覺的事實:美國資料中心的用水量比加州的杏仁種植業少了五到七倍。「我們競相前進,卻沒有考慮到我們將這些資料中心置於其中的社區,」他直言,「我們搞砸了。」
Cerebras 的應對之道是將產能部署在電力充足且低廉的地區:德州西部、猶他州農村、路易斯安那州部分地區、尼加拉地區以及更廣泛的加拿大。邏輯很簡單——追逐電力可用性而非人口中心距離,再透過光纖傳輸 Token。這是針對產業自身造成且尚未大規模解決的問題,所採取的一種務實變通方案。
專用架構與通用架構之爭仍是關鍵問題
針對整合型通用架構最終是否會取代專用晶片的必然爭議,Feldman 提供了一個分析框架,而非推銷式的回答。他認為,結果完全取決於資源分布的形狀。「如果專用晶片瞄準的資源礦脈非常龐大,專用晶片就會勝出。如果資源分布由許多零散的小型資源區塊組成,通用架構就會勝出。」他引用 GPU 在離散圖形處理領域的統治地位作為專用晶片勝出的例子,ARM 在行動裝置領域擊敗 x86 是另一個例子,而 x86 架構在碎片化使用場景下的廣泛應用則是通用架構的勝利。他的觀點是,AI 推論——特別是解碼問題——代表了一個龐大且結構獨特的工作負載,足以支持專用架構。隨著模型效率提升與硬體競爭加劇,這條資源礦脈是否能保持足夠規模,是 Cerebras 論點面臨的核心長期風險,而 Feldman 在訪談中並未直接對此進行深入探討。