SanDisk 執行長:KV Cache 遷移至 NAND 已成現實,資料中心需求預測持續上修
Bernstein 第 42 屆年度戰略決策會議,2026 年 5 月 28 日 — SanDisk 董事長兼執行長 David Goeckeler 闡述需求轉折點、110 億美元合約承諾,以及即將推出的 HBF 架構布局
資料中心需求預測已連續四次上修
SanDisk 在 Bernstein 戰略決策會議上最引人注目的揭露,並非單一數字,而是一連串的數據。執行長 David Goeckeler 透露,在過去約三個預測週期中,SanDisk 對 2026 日曆年資料中心 NAND 需求成長的內部預測已連續四次上修——從 20% 多(mid-20s),一路調升至 40% 多、60% 多,隨後更高。「我不認為這對任何人來說是個謎——資料中心確實正在非常、非常、非常激進地成長,」Goeckeler 表示,並補充說這種上修的速度與強度,甚至讓他的管理團隊都感到意外。
這股驅動力是結構性的,而非週期性的。隨著超大規模雲端供應商(hyperscalers)與雲端基礎設施建構者在進行大規模推理(inference)部署的架構設計時,他們發現實際所需的 NAND 容量始終高於最初估計。Goeckeler 解釋說,早期的 AI 基礎設施建設本質上是無限制的資源搶奪——「給我所有的運算能力、給我所有的記憶體、給我所有的電力」——但隨著轉向大規模全球推理,經濟效益問題被迫浮上檯面。DRAM 與 HBM 雖然在延遲(latency)表現上技術領先,但無法擴展到足以滿足全球數十億次推理查詢的密度需求。NAND 可以。「NAND 具有極高的可擴展性。它是世界上最具可擴展性的半導體技術,」Goeckeler 說,「DRAM 是卓越的技術,HBM 也是卓越的技術,它們擁有令人難以置信的特性,但它們缺乏解決全球推理問題所需的規模。」
KV Cache 遷移至 NAND:「這已是現實」
Bernstein 分析師 Mark Newman 向 Goeckeler 追問關於 Jensen Huang 在 CES 上提出的願景,即每個 GPU 約 17TB 的 KV cache 儲存將遷移至 NAND 儲存。Goeckeler 的回應毫不含糊:這不僅僅是前瞻性的論點,更是當前的商業現實。「這不僅僅是一個願景。這就是現實,而且這種情況已經持續一段時間了,」他說。KV cache 在推理過程中儲存大型語言模型(LLM)的中間注意力狀態(attention states),由於上下文視窗(context windows)不斷擴大且模型規模持續成長,KV cache 正被移至 NAND,因為在所需的規模下,DRAM 在每 GB 成本或面積密度上根本無法與 NAND 競爭。
Goeckeler 提醒,不要對每個 GPU 產生多少 NAND 需求建立簡單的線性公式,並指出最終數字取決於模型大小、Token 數量、KV cache 維度、快取命中率(cache hit rates)以及具體的應用場景。但發展方向很明確:隨著基礎設施設計師不斷調整架構,答案始終是需要更多的 NAND,而非更少。「當企業需要將這些卓越的 AI 技術擴展到我們所有人都能使用的程度時,」他說,「這就是推動市場的動力。」
420 億美元剩餘採購義務,110 億美元合約擔保
SanDisk 新的商業模式揭露值得仔細剖析。截至最近一季末,該公司已簽署三份長期供應合約,承載約 420 億美元的剩餘採購義務——即這些協議生命週期內的最低採購量承諾。季末後又簽署了兩份合約,因此尚未計入報告數字。在所有五份合約中,交由第三方託管機構作為終止擔保(termination backstops)的總金額——Goeckeler 稱之為客戶退出時的財務承諾——總計為 110 億美元。
這種結構是刻意設計的。SanDisk 並不會預先收到這些資金;它們由中立的第三方根據預先定義的釋放機制保管。如果客戶退出合約,託管資金將釋放給 SanDisk——無需訴訟,無需談判。「我們不會起訴我們的客戶,」Goeckeler 斷然說道。其目的是為了對齊激勵機制:客戶在放棄數十億美元的託管資金前會三思,而 SanDisk 則在最可能需要的時候(即需求低迷期)獲得現金緩衝。「如果你必須退出合約,你將不得不放棄數十億美元。所以你最好考慮清楚,」他說。
SanDisk 目前超過三分之一的業務量都在這些新商業模式協議內。Goeckeler 拒絕透露客戶名稱,但承認這些合約的期限各異,這是刻意安排的。他希望錯開到期日——有些是一年期、有些是三年期、有些是五年期——以避免集中風險。至於這些客戶是否全是超大規模雲端供應商,並未獲得證實。當被問及尚未簽署長期合約的剩餘三分之二客戶是否面臨供應風險時,Goeckeler 直言:「我不是市場上唯一的供應商」且「我無法經營他們的業務。」
HBF:NAND 晶粒預計年底問世,完整系統於 2027 年推出
High-Bandwidth Flash (HBF) 是 SanDisk 的專有架構,旨在為推理工作負載提供接近 DRAM 等級存取模式的 NAND。該技術目前正從概念轉向硬體。Goeckeler 確認,HBF 的 NAND 晶粒(die)目前正在開發中,預計於 2025 年底準備就緒,而包含其上層客製化控制器的完整系統預計將於 2026 年某個時間點推出。客戶整合工作已經展開,儘管 Goeckeler 明確表示這並非隨插即用的組件更換。「你必須讓客戶將其採用到他們正在構建的系統中,我們正在經歷這個過程,」他說。
HBF 被定位為一種密度優化、以讀取為主(read-dominant)的架構,專為推理而設計,Goeckeler 將其描述為「主要是基於讀取的活動,且是確定性的讀取活動。」他謹慎地表示,這並非 DRAM 的替代品,也不是企業級 SSD 的取代者。相反,它是記憶體層級中的一個新類別——SanDisk 認為,隨著推理在全球範圍內的擴展,以及 HBM 的每美元頻寬限制變得愈發嚴苛,這種架構在經濟上將變得必要。
資本支出效率是成長故事中被低估的部分
Goeckeler 提出的重要觀點之一,也是在討論需求時容易被忽略的一點,是節點轉換(nodal transitions)與資本密集度(capital intensity)之間的關係。每一個新的 NAND 節點都能以超過 SanDisk 設定的 15%-19%(mid-to-high-teens)艾位元組(exabyte)成長目標的複合速率,提供更多的每晶圓位元數。這意味著:如果 SanDisk 在每個後續節點中僅維持相同的晶圓產量,將會導致市場系統性供過於求。相反,他們在每個節點調降晶圓投片量(wafer starts)的同時仍能增加產出,這意味著儘管營收成長,資本支出(CapEx)佔營收的比例卻在下降。
「如果你觀察我們的資本支出佔營收的比例,隨著營收成長,它持續下降,」Goeckeler 說,並將此描述為該業務高效產生自由現金流的核心機制。對於投資人而言,這是 NAND 經濟學為何不像歷史週期所暗示的那樣具有資本破壞性的結構性論點——前提是供應紀律必須維持。
關於週期性:Goeckeler 試圖打破 40 年的產業慣例
Goeckeler 對該產業歷史上遵循的繁榮與蕭條週期(boom-bust cycle)的破壞性持異常坦率的態度,並對結構性改變這一現狀的野心表現得異常直接。他的三部分框架——賺取合理回報、降低週期性、以及成長——雖然簡單,但他明確承認這三者之間存在緊張關係。追求更高的短期經濟效益會冒著需求崩潰的風險;以犧牲成長為代價換取更多週期性則會破壞價值;而成長速度超過 15%-19% 可能可行,但會以犧牲其他兩個目標為代價。「你必須三者兼顧,」他說,「如果你開始干擾其中之一,另一個就會朝相反的方向發展。」
他還帶著一絲苦笑指出,不到 12 個月前,分析師報告還在預測 SanDisk 會因價格下跌而錯失 12 月季度的目標。「我讀到晚至夏末的報告還在說,SanDisk 會錯失 12 月的數字,因為價格將會下跌。結果並非如此。」平均售價(ASP)的軌跡——Bernstein 的 Newman 估計最近一季每 GB 價格季增約 140%——已經驗證了 SanDisk 在整個 2024 年所主張的需求論點。
關於在當前定價環境下是否會積極增加產能,Goeckeler 給出了一個結構性的回答:SanDisk 一直在增加產能,這些決策是提前幾年做出的,且節點生產力動態意味著他們可以在不按比例增加晶圓投片量的情況下增加產出。他不願暗示任何近期的加速行動,並指出,在市場稱這些投資水準過高不到一年後,就逆轉投資水準,在營運上是前後矛盾的。