TD Cowen:NVIDIA 網路業務不再是配角,而是 AI 工廠的架構核心
TD Cowen 第 54 屆年度 TMT 大會,2026 年 5 月 28 日 — NVIDIA 網路部門副總裁 Gilad Shainer 解析為何該公司規模達 149 億美元的網路部門,在市場上擁有獨一無二的結構性優勢。
149 億美元的網路業務,年增率達 199% — 每個層級皆貢獻良多
NVIDIA 網路業務營收在最新一季突破 149 億美元,年增率高達 199%。NVIDIA 網路業務負責人 Gilad Shainer 於 5 月 28 日在 TD Cowen 第 54 屆年度 TMT 大會上明確表示,這並非單一產品的成功故事。營收成長同時來自「向上擴展」(scale-up)的 NVLink、「向外擴展」(scale-out)的 InfiniBand 與 Spectrum-X 乙太網路,以及作為儲存處理器與資料處理單元(DPU)、實現 AI 工廠安全存取的 BlueField。這種多面向的貢獻至關重要,意味著網路營收並不依賴於單一瓶頸的解決或單一客戶的集中度。NVIDIA 所稱的「AI 工廠」,其每一個層級都在持續擴張。
併購 Mellanox 是為了成為運算公司,而非零組件供應商
Shainer 對 Jensen Huang(黃仁勳)當年推動併購 Mellanox 的動機提出了迄今最清晰的闡述。TD Cowen 將此併購案形容為「或許是科技史上最重要且最成功的併購案」。在 Shainer 看來,其邏輯在於架構層面:「Jensen 看見 NVIDIA 必須成為一家運算公司,而不是一家裝置公司或 ASIC 公司。連結這些運算 ASIC 的方式,將決定這些 ASIC 能發揮什麼功能。若以某種方式連結,你得到的只是一個伺服器農場;但若以另一種方式連結,你就能打造出一台超級電腦。」這種將「網路」視為決定運算效能關鍵的觀點,支撐了 NVIDIA 整個整合式機架(integrated rack)策略,也解釋了為何 Mellanox 團隊從第一天起就沒有被當作獨立業務單位,而是直接整併為單一工程組織。
NVLink Fusion 並非防禦性舉措,而是 NVIDIA 向生態系開放其頂尖技術
市場一直擔憂 NVIDIA 轉向全整合式 NVL 機架會將客戶鎖定在封閉系統中,進而疏遠生態系夥伴。Shainer 直接反駁了這種觀點。該架構採取垂直設計——每個元件皆經過共同工程設計以作為單一單元運作——但採取水平銷售,意味著客戶可以選取個別組件,並將其與自己的設計結合。NVLink Fusion 允許第三方 CPU 甚至第三方 GPU 透過 NVLink 進行連結,正是此策略的具體體現。「NVLink Fusion 讓我們的客戶在有需求時,也能將 NVLink 作為獨立元件使用,」Shainer 說道。他的論點是,NVIDIA 對每一項組件的品質深具信心,因此希望合作夥伴能個別使用它們。至於生態系將此視為「真誠開放」還是「策略性開放」,那是另一個問題,但圍繞 Fusion 夥伴所發布的商業公告,已顯示出實質的市場動力。
為何 Spectrum-X 乙太網路在架構上獨樹一幟 — 且這並非行銷話術
此次對談技術含量最高的部分,在於 Shainer 解釋了為何 Spectrum-X 不能與標準乙太網路交換器相提並論,以及這種差異為何是根本性的而非漸進式的。分散式 AI 工作負載的核心問題在於「抖動」(jitter)——即資料抵達不同 GPU 時的時間差異。在一個由數十萬個 GPU 必須同步運作的訓練或推論叢集中,即使單一 GPU 接收資料稍有延遲,也會導致其他所有 GPU 必須等待。傳統乙太網路架構(包括針對大型雲端工作負載所設計的架構)從未被設計來解決此問題,因為在單一伺服器或長距離傳輸環境中,抖動並不重要。
更深層的問題在於結構。消除抖動需要「無條件封包散佈」(unconditional packet spraying)——即在不考慮流量順序的情況下,將每個獨立封包透過最不擁塞的路徑傳送。然而,在交換器層級執行此操作,本質上會導致資料抵達順序混亂。解決此問題的唯一方法,是擁有一個智慧型端點,能夠即時接收順序錯亂的封包,並在 GPU 記憶體中正確重組。這個端點就是 ConnectX SuperNIC。「這就是為什麼當你為分散式運算工作負載建立基礎設施時,你需要一個能執行無條件分佈的交換器元件,同時需要一個能將資料重新排序的 SuperNIC,」Shainer 表示,「這就是為什麼它是一個基礎設施,而不是單一裝置。」這就是架構上的護城河。競爭對手若只提供交換器或只提供 NIC,無法複製 Spectrum-X 作為系統所能提供的效能。
Spectrum-X 支援多種路由協定 — 包括 MRC 及客戶自研協定
Shainer 也談到了新興的「多路徑 RDMA 擁塞控制」(Multi-path RDMA Congestion control, MRC)標準及其與 Spectrum-X 的關係。他並未將 MRC 視為對 NVIDIA 自適應路由(adaptive routing)方法的競爭威脅,而是將 Spectrum-X 描述為一個能同時支援多種路由協定的平台,包括自適應 RDMA、MRC,以及大型超大規模雲端客戶為優化自身工作負載而開發的多種專有協定。「多種路由協定可以在 Spectrum-X 上執行,」Shainer 說道,並將其類比為 BGP 只是另一個協定層。他指出,Ultra Ethernet Consortium 目前致力於標準化的許多工作,其實反映了 NVIDIA 在 Spectrum-X 中早已做出的設計選擇。若此說法準確,意味著 NVIDIA 在生產級實作上已擁有顯著的領先優勢。
推論帶來了訓練所沒有的基礎設施新需求 — BlueField 與 KV Cache 儲存難題
Shainer 介紹了 NVIDIA 網路成長中一個較少受投資人關注的面向:為推論所建立的儲存基礎設施層。隨著 AI 部署轉向「代理架構」(agentic architectures)——即 AI 模型與其他 AI 模型互動、維持更長的上下文視窗(context windows)並維護更大的 KV 快取(KV caches)——所有相關資料都能存放在本地 GPU 記憶體的假設已不復存在。網路連結儲存(network-attached storage)變得不可或缺,但傳統的網路儲存架構對於推論使用場景來說過於複雜,因為它們優先考慮透過複製(replication)來確保資料冗餘。Shainer 認為,在推論中,遺失的資料可以直接重新計算,使得複製顯得浪費。NVIDIA 的解決方案是使用 BlueField、STX 和 CMX 打造專用儲存層,在沒有傳統儲存冗餘開銷的情況下,針對 KV 快取檢索進行優化。這是網路部門全新的增量目標市場,而非現有產品的重新包裝。
共同封裝光學元件(CPO)首先是電力問題,其次才是技術問題
關於銅纜與光纖的爭論,Shainer 以一種能過濾市場雜訊的務實態度回應。銅纜在短距離傳輸上具備成本與功耗優勢——其功耗幾乎為零。光纖則在長距離需求下不可或缺,但現今向外擴展基礎設施上的光學連結,可能消耗 AI 工廠總電力容量近 10%,這已成為部署運算規模的關鍵限制。共同封裝光學元件(CPO)能降低此光學功耗負擔,這也是為何 NVIDIA 在 Feynman 平台等配置中投入研發的原因,因為該平台在 1,152 個 GPU 連結時必須跨越機架邊界。對投資人而言,這項論述很重要:CPO 的採用並非取決於技術成熟度的辯論,而是取決於電力經濟學,而電力正是當今 AI 工廠建設的首要限制因素。