Cerebras 執行長：「沒人想要緩慢的 AI」—— 談 200 億美元 OpenAI 合約、AWS 架構布局，以及為何這不是泡沫

Bloomberg Tech 2026，舊金山 — 2026 年 6 月 4 日

在完成 Cerebras 執行長 Andrew Feldman 所稱「史上最大規模半導體 IPO」的兩週後，Feldman 於舊金山舉行的 Bloomberg Tech 2026 會議上，與彭博社記者 Tom Giles 進行對談。他詳細闡述了公司的商業論點、與超大規模雲端供應商（hyperscalers）的合作架構，並針對 AI 基礎設施支出是否過熱提出了明確看法。這些回應比大多數投資人會議一整季提供的資訊更具啟發性。

OpenAI 與 AWS 合約是藍圖，而非特例

此次對談中最關鍵的新資訊，在於 Cerebras 在 IPO 前夕商業動能的結構與規模。Feldman 確認已與 OpenAI 簽署一份金額「超過 200 億美元」的承諾性「照付不議」（take-or-pay）合約，簽約時間約在與 AWS 達成協議的 45 天前。這兩筆交易共同建立了一種商業模式，Feldman 形容此模式旨在擴展至其他超大規模雲端供應商——但有一個明確的例外。他說：「我們目前正致力於將此流程應用於與社群中所有成員合作，即除了 Nvidia 以外的其他超大規模雲端供應商，利用我們的技術解決部分問題，並結合他們的技術解決另一部分。」當被追問時，他證實：「沒錯，除了他們之外的所有人。」

AWS 的合作案在架構上極具意義，值得投資人密切關注，因為它揭示了 Cerebras 如何嵌入現有的雲端基礎設施，而非與其正面競爭。其核心洞察在於將推論（inference）工作負載拆解為兩個不同的運算問題。第一部分稱為「預填充」（prefill），用於處理輸入的提示詞（prompt），具有高度可並行性，這意味著超大規模雲端供應商現有的訓練優化晶片能妥善處理；第二部分稱為「解碼」（decode），即生成實際答案的過程，則屬於嚴格的序列運算，這正是 Cerebras 晶片發揮效能優勢之處。Feldman 解釋：「我們可以使用他們的訓練晶片來處理預填充，並利用我們的大型晶片來處理解碼。最終我們將得到這套卓越的解決方案。」對投資人而言，這意味著 Cerebras 並非試圖全面取代超大規模雲端供應商的基礎設施，而是切入推論管線中對延遲最敏感、價值最高的一環。

速度就是產品——市場類比直指核心

Feldman 以 Google 2009 年的一篇論文為基礎論證速度的重要性，該研究顯示，即使回應延遲僅有微小增加，也會顯著降低用戶參與度、留存率和工作階段長度——即便用戶並未察覺到延遲。他將此轉化為直接的市場規模論點：「慢速搜尋的市場有多大？撥接上網的市場又有多大？」他將速度定義為產品類別的決定性特徵，而非單純的效能指標。Cerebras 聲稱其推論速度比競爭對手快 15 倍以上。Open Claw 設計師 Peter Steinberger 曾形容，使用 Cerebras 的技術「就像給了他一把雷神之鎚」，大幅提升了程式開發效率。

該公司聲稱比替代方案快 15 倍以上的效能，仍是其商業主張的核心支柱，而贏得 OpenAI 和 AWS 的訂單則提供了重要的第三方驗證。然而，隨著競爭架構的演進，這種效能領先優勢是否能持續，仍是訪談中未直接回應的合理疑問。

250 億美元積壓訂單與反泡沫論點

針對 AI 基礎設施支出是否構成泡沫的質疑，Feldman 給出了目前最直接且具實證基礎的論點：Cerebras 目前擁有超過 250 億美元的積壓需求，這是包括 AMD 和 Nvidia 在內的任何供應商都無法滿足的。「建設者的進度遠遠落後於需求，這簡直荒謬。」他認為，歷史上的泡沫值得深思，「歷史上的泡沫特徵在於『只要你蓋好，他們就會來』的假設，」他引用 1990 年代後期的光纖建設和 1870 年代的鐵路建設為例。「AI 目前的特殊之處在於，建設者的進度遠遠落後於需求。」他補充說：「我們的客戶及其客戶正以軟體的速度前進，而我們卻受限於資料中心基礎設施的建設速度。」

若 250 億美元的積壓訂單數據準確，這對該產業而言是重要的數據點。投資人應注意，Feldman 並未細分這些積壓訂單的構成，也未說明轉化為營收的時間表，考慮到資料中心部署的長週期特性，這些資訊至關重要。

客戶集中度：一個大客戶，然後是一個更大的客戶

Feldman 以一貫直接的態度回應了客戶集中度風險。在與 OpenAI 簽約前，Cerebras 在 2023 年底與總部位於阿聯酋的 AI 領軍企業 G42 簽署了 10 億美元的承諾合約。當公司嘗試募資時，投資人曾指出單一客戶依賴的風險。隨後，Cerebras 簽下了超過 200 億美元的 OpenAI 合約，接著又是 AWS。Feldman 表示：「我過去有一個大客戶，現在依然只有一個，只是規模大了 20 倍。」他將此與 Nvidia 的客戶集中度進行對比：「Nvidia 上季營收約 680 億美元，其中四個客戶就佔了一半。這就是我們所處的商業世界。」此觀點固然有理，但也並未消除集中度風險，只是將其在產業內常態化了。

他同時提供了一種有用的視角，重新定義大客戶在實務上代表的意義。G42 是一家服務阿聯酋生態系統中大學、石油公司及數百家終端用戶的雲端供應商；OpenAI 的運算需求最終反映了數十億個別終端用戶的需求。單看帳面上的客戶數量，反而低估了實際服務的終端需求廣度。

Token 經濟學正加速成熟

針對 Token 限制、價格敏感度及企業 AI 運算分配等新興議題，Feldman 使用了 Costco 的類比來精確說明。早期的企業 AI 採用模式就像是在沒有購物清單的情況下逛遍倉儲超市的每個貨架——既浪費又缺乏規劃。「微軟有一天意識到，Token 很昂貴，」他指出，回頭來看，這種認知顯而易見。「我們還讓誰可以無限制地使用資源？這從一開始就是愚蠢的。」市場現在正學會區分：針對能證明成本合理性的任務使用高性能前沿模型，其他任務則使用開源替代方案，並根據個人生產力水準進行內部分配。Feldman 認為這是一種健康且快速的常態化過程，而非需求崩潰的訊號。

資料中心瓶頸與產業在社區關係上的失敗

Feldman 對 AI 產業未能為資料中心擴張爭取社區支持一事，表現得異常坦誠。限制是真實存在的——Cerebras 的雲端服務與所有超大規模雲端供應商一樣，受限於資料中心的可用性——但他認為政治阻力很大一部分源於可避免的自我挫敗。「我們本可以成為好鄰居。我們本可以走進這些社區，利用當地的流程和政府來獲得批准與支持。」他提到產業未能有效溝通就業機會、稅收貢獻，以及一個反直覺的事實：美國資料中心的用水量比加州的杏仁種植業少了五到七倍。「我們競相前進，卻沒有考慮到我們將這些資料中心置於其中的社區，」他直言，「我們搞砸了。」

Cerebras 的應對之道是將產能部署在電力充足且低廉的地區：德州西部、猶他州農村、路易斯安那州部分地區、尼加拉地區以及更廣泛的加拿大。邏輯很簡單——追逐電力可用性而非人口中心距離，再透過光纖傳輸 Token。這是針對產業自身造成且尚未大規模解決的問題，所採取的一種務實變通方案。

專用架構與通用架構之爭仍是關鍵問題

針對整合型通用架構最終是否會取代專用晶片的必然爭議，Feldman 提供了一個分析框架，而非推銷式的回答。他認為，結果完全取決於資源分布的形狀。「如果專用晶片瞄準的資源礦脈非常龐大，專用晶片就會勝出。如果資源分布由許多零散的小型資源區塊組成，通用架構就會勝出。」他引用 GPU 在離散圖形處理領域的統治地位作為專用晶片勝出的例子，ARM 在行動裝置領域擊敗 x86 是另一個例子，而 x86 架構在碎片化使用場景下的廣泛應用則是通用架構的勝利。他的觀點是，AI 推論——特別是解碼問題——代表了一個龐大且結構獨特的工作負載，足以支持專用架構。隨著模型效率提升與硬體競爭加劇，這條資源礦脈是否能保持足夠規模，是 Cerebras 論點面臨的核心長期風險，而 Feldman 在訪談中並未直接對此進行深入探討。

閱讀下一篇

NVIDIA 實錄：Vera Rubin AI 平台全面量產，代理人（Agents）重塑運算經濟學

2026-06-06

Bloomberg Live：博通執行長陳福陽稱併購策略已成過去式，OpenAI 晶片預計年底投產

2026-06-05

JP Morgan：SpaceX 的 IPO 真義在於太空 AI 資料中心與百倍頻寬，而不僅僅是火箭

2026-06-05

All-In Podcast：Coatue 的 Laffont 預見 4 兆美元 AI IPO 浪潮，將成生態系的大洗牌時刻

2026-06-05

All-In Podcast：OpenAI 財務長揭露新款消費性裝置、2027 年前算力短缺現況，以及結合 Google 意圖與 Meta 精準投放的廣告平台

2026-06-05

免責聲明： 本文僅供參考，不構成投資建議或買賣、持有任何證券的推薦。我們的分析師對企業事件提供詳細報導，但也可能出錯，請務必進行您自己的自行評估與研究。文中所表達的觀點和意見不一定反映 DruckFin 的立場。我們未獨立核實本文所使用的所有資訊，其中可能包含錯誤或遺漏。在做出任何投資決定之前，請諮詢合格的財務顧問。 DruckFin 及其關係企業對因依賴此內容而產生的任何損失不承擔任何責任。完整條款請見我們的使用條款。