DruckFin

NVIDIA 發表 Vera Rubin:全面量產並推出專為 AI 代理打造的全新 CPU

NVIDIA GTC Taipei 2026 執行長黃仁勳主題演講 — 2026 年 6 月 1 日,台灣台北

歡迎與生態系現況

黃仁勳在 GTC Taiwan 的熱烈歡迎聲中登台,他首先對與會規模表示驚嘆,並提到全台共有 70 場同步連線的發表會同時觀看這場直播。他特別介紹了在現場的父母並贏得掌聲,隨後感謝開場表演者的演出。

黃仁勳回顧了 NVIDIA 生態系的廣度,指出大多數人提到生態系時,往往只想到 NVIDIA 計算系統之上的軟體堆疊與開發者社群。但他強調,NVIDIA 的生態系一路向上延伸至一切起點的台灣供應鏈,向下則涵蓋資料中心,最終直達終端使用者。他對台灣生態系表達了高度讚賞,稱其為全球最頂尖的供應鏈生態系。他提到前一晚有人告訴他,台灣今年的 GDP 預計將成長近 10%,他對此感到不可思議。

代理式 AI 時代來臨:軟體生產力革命

黃仁勳以一個核心主題開啟演講:兩年前,他開始談論 AI 如何從生成式 AI 邁向下一波浪潮,即他所稱的「代理式 AI」(Agentic AI)。他宣布,代理式 AI 現已正式到來,實用的 AI 時代已經開啟。

為了說明這一點,他以 GitHub 為例,將其視為代理式 AI 在軟體編碼領域的首批應用之一。他指出,全球專業軟體開發市場約有 3,000 萬至 4,000 萬名開發者。隨後他展示了 GitHub 的提交數據(衡量開發者下載、修改並回傳程式碼的指標):2023 年為 3 億次,2024 年為 4 億次,2025 年為 5 億次。而在 2026 年的前幾個月,該數字已近乎翻了三倍。

黃仁勳以經濟角度分析:3,000 萬名軟體開發者代表每年約 3 兆美元的 GDP 薪資總額,進而帶動整體經濟成長。這 3 兆美元的薪資現在產出的成果幾乎是過去的三倍,意即以 3 兆美元的薪資創造了 9 兆美元的生產力。他稱這就是 AI 的潛力與願景。

他強烈反駁了 AI 會減少就業的說法,稱其完全是無稽之談。他主張事實恰恰相反——正因為每位工程師的產出變得如此驚人,企業反而聘雇了更多的軟體工程師。如果聘請一位軟體工程師能創造 9 兆美元的生產價值,為什麼要減少人力?他表示這種效應很快就會在經濟數據中顯現。

Token 成為營收新單位與代理背後的計算模式

黃仁勳隨後將這場生產力革命與計算需求連結。他解釋,Token(代幣)的需求現已極度旺盛,因為只要能產生這種產出,企業就會想要生產更多。Token 現在是獲利的單位,由於 AI 已具備獲利能力,企業紛紛建立更多的「AI 工廠」以產生更多 Token。他說,這正是台灣計算需求暴增,以及生態系中所有企業表現亮眼的原因。

他描述了計算模式的根本轉變。舊模式涉及應用程式、在應用程式中執行的程式碼以及作業系統。新模式則是「代理」(Agent),由一個或多個大型語言模型組成,並置於一個「框架」(Harness)之中。該框架負責協調模型以執行生產性工作,處理輸入、理解、觀察、推理、行動及工具使用。工具可包括試算表、網頁瀏覽器、資料處理引擎與資料庫引擎。代理如同人類一樣,管理著短期工作記憶與長期記憶。

他特別提到「工具使用」是一項重大突破。他指出,許多人曾告訴他代理式 AI 會讓軟體公司倒閉。但他認為事實正好相反——由於未來將有數以萬計的代理,且世界不再受限於人力,這些代理將使用比以往更多的工具。他表示,這對軟體公司而言是絕佳的時代,但軟體必須以代理能夠使用的方式呈現。

CUDA-X 函式庫:NVIDIA 在代理時代的寶藏

黃仁勳將 NVIDIA 的上千個 CUDA-X 函式庫形容為公司的寶藏。他解釋,NVIDIA 現在能將這些 CUDA-X 函式庫呈現給代理,而代理使用它們的效率甚至超過人類。這要追溯到 20 年前作為加速計算單一架構而建立的 CUDA。這些函式庫涵蓋了廣泛領域:用於計算微影的 cuLitho、決策優化的 cuOpt、直接稀疏求解器的 cuDSS、跨結構與非結構化文件進行深度研究的 AI-Q、用於 AI RAN 的 Aerial、可微分物理的 PhysicsNeMo,以及基因組學的 Parabricks。

他指出,所有 CUDA-X 函式庫現在都將具備「技能」——本質上是一份 AI 可以閱讀並學習如何使用的手冊。他表示,代理使用這些函式庫的能力將會非常驚人,所有 CUDA-X 函式庫都正準備作為代理的工具。

代理計算的解構式架構

黃仁勳詳細說明了代理式 AI 底層的分散式架構。他將代理描述為終極的解構與分散式計算模型,其中許多不同的電腦被啟動以處理單一代理的工作。模型、框架、工具、技能與執行環境都在資料中心的不同部分運作。

他提供了一個類比:將模型視為大腦,框架視為身體,工具視為工作坊中的物品。工人(代理)在那個工作坊中以極大規模使用工具。處理過程的每一步都在電腦的不同部分執行。當大型語言模型在思考——處理情境、推理、規劃、行動時——整組 Grace Blackwell NVLink 72 機櫃會被啟動。當代理使用工具時,則會使用 CPU。安全框架在 CPU 與名為 NVIDIA BlueField 的安全處理器(DPU)上運作。所有的協調工作則由 CPU 執行。

他將記憶體系統描述為最困難的部分之一。工作記憶(稱為 KV 快取)涉及結構化與非結構化資料的壓縮與檢索,並包含不同資料結構間複雜的本體關係。他表示,AI 的記憶體系統將徹底顛覆儲存系統。

黃仁勳表示,這種解構、分散、異質的計算問題,正是 NVIDIA 打造下一代架構 Vera Rubin 的原因。

Vera Rubin:首款多機櫃、Pod 規模的 AI 超級電腦——全面量產

黃仁勳介紹 Vera Rubin 時強調,它不僅是一顆晶片或 GPU,而是整個系統——從端到端。它包含 Vera Rubin NVL72 GPU、Vera CPU、革命性的儲存系統、ConnectX-9 網路、DOCA 軟體堆疊,以及確保資料在靜態、傳輸與使用中皆加密的安全處理器。他稱 Vera Rubin 是 NVIDIA 史上最宏大的計畫,全公司 4 ,000 名工程師與廣大生態系夥伴皆投入其中。

他做出重大宣布:Vera Rubin 現已全面量產。他表示,為 Vera Rubin 建立的供應鏈規模是 Grace Blackwell 的兩倍,過去組裝一台 Grace Blackwell 機櫃需要兩小時,現在僅需五分鐘。他感謝台灣生態系達成此成就。

隨後播放的影片詳細介紹了 Vera Rubin 的製造與技術細節。該系統始於台積電的 3 奈米製程、CoWoS 先進封裝,以及來自美光、SK 海力士與三星的 HBM4 記憶體。Vera Rubin GPU 單板擁有 6 兆個電晶體與超過 18,000 個元件。Vera Rubin NVL72 負責處理提示詞與情境理解、推理及規劃。系統採用全新的模組化運算托盤與 PCB 中板、ConnectX-9 SuperNIC 與 BlueField-4 DPU,且無需纜線即可進行維護。機櫃內含 18 個運算托盤與 9 個可熱插拔的 NVLink 交換器托盤。全新的高效液冷匯流排可承載超過 5,000 安培電流——相當於 20 輛電動車全速加速的能量。總計 130 萬個元件組成了這台第三代 MGX 機櫃。影片向 Microsoft、Dell 與 CoreWeave 致意,感謝他們建置了 Vera Rubin NVL72 工程機櫃。

影片亦介紹了 Vera CPU 機櫃,單一液冷機櫃可容納 256 顆 CPU,用於協調模型、調度記憶體與啟動工具。由鴻海與廣達協力打造的 Vera LPX 機櫃,則在 16 個托盤中容納 256 顆 Groq LPU,提供每秒 40 PB 的 SRAM 頻寬以實現超低延遲。當 NVL72 以最高吞吐量產生 Token 時,LPX 機櫃則以最低延遲產生。影片亦強調了用於儲存處理與晶片內安全性的 Vera BlueField-4 STX,以及 NVIDIA Spectrum-X 乙太網路光電技術,這是全球首款採用 200 Gbps 共封裝光學元件(CPO)的乙太網路交換器。整個系統由五個相連的機櫃級系統組成,被形容為專為 AI 代理打造的超級電腦,由台灣 150 家供應鏈夥伴共同打造。

影片結束後,實體機櫃系統被推上舞台。黃仁勳展示了 Vera Rubin NVL72、LPX 機櫃、搭載 256 顆液冷 CPU 的 Vera CPU 機櫃、Vera BlueField 儲存與安全處理系統,以及他稱為全球首款 CPO 的 Mellanox 網路交換器。他特別強調設計中移除了纜線與水管,這歸功於連接機櫃兩側的 PCB 中板,大幅縮短了組裝時間並提升了可靠性。

NVIDIA DSX:大規模 AI 工廠基礎設施

在深入介紹 Vera Rubin 之前,黃仁勳展示了用於 AI 工廠基礎設施的 NVIDIA DSX 架構。他形容全球正競相建設 AI 工廠,這是人類歷史上規模最大的基礎設施建設。他指出,1 GW 等級的 AI 工廠造價已從 200 億至 300 億美元,漲至 500 億至 600 億美元,未來將達到每 GW 800 億至 1,000 億美元。他強調這些工廠必須在第一時間運作順暢,因為資本成本極高。

影片介紹了 DSX Sim,這是一個 Omniverse 藍圖,讓合作夥伴在訂購任何機櫃前,即可設計並驗證 NVIDIA Vera Rubin AI 工廠——包括規劃佈局、模擬電力與冷卻、設計網路,並在數位孿生中驗證所有整合。DSX OS 隨後負責佈建、操作、監控與修復基礎設施。DSX MaxLPS 讓營運商能在相同的電力預算內安全部署更多 GPU,目前 AI 工廠的電力配置往往過剩高達 40%。系統具備 45°C 高效熱液冷技術,能減少水與能源消耗。DSX Flex 則能讀取即時電網訊號,並在電網需要緩解時動態調整電力。影片指出,在十年內將有 100 GW 的 AI 工廠上線。

黃仁勳解釋,NVIDIA 已轉型為 AI 基礎設施公司,而不僅僅是 GPU 或系統公司。他描述了其中的經濟邏輯:計算即營收,每瓦效能即營收,而快速建置工廠、高吞吐量運作、維持可靠性並延長使用壽命,都是 NVIDIA 整合式方案所解決的關鍵因素。他表示,由於整個系統的極致協同設計,NVIDIA 的 Token 生產成本是全球最低的,且差距不僅是 10%,而是數倍之多。

NVIDIA Vera CPU:首款為代理而非人類打造的 CPU

黃仁勳轉向他所稱的全新主要成長動力:專為代理時代打造的 Vera CPU。

他主張,迄今為止所有的 CPU 都是為人類設計的——人類活在以秒為單位的世界,並以小時為單位租用雲端 CPU 核心。代理則截然不同。它們沒有耐心,活在以奈秒(nanosecond)為單位的世界。當代理使用工具或存取資料庫時,回應必須盡可能快。任何等待都會阻礙代理進入下一步。由於 CPU 緊鄰著產生 Token 營收的昂貴 GPU 基礎設施,這些 CPU 必須同時具備高效能與高能源效率。

他概述了 Vera 的四個定義性屬性。第一,每時脈指令數(IPC):全球最高,每時脈可擷取、解碼並執行 10 個指令,提供同級最佳的單執行緒效能與低延遲。第二,每核心頻寬:世界級水準。第三,晶片內外總頻寬:由於代理系統本質上是解構且分散的,網路與資料傳輸成為核心問題。Vera 具備第二代可擴展一致性架構(Scalable Coherency Fabric),以每秒 3.6 TB 的速度在單一網格上連接所有 88 個 Olympus 核心,無需跨越路徑邊界。它是首款採用 PCIe Gen 6 與 LPDDR5X 記憶體的 CPU,頻寬達每秒 1.2 TB——是市場上最高效能 CPU 的兩到三倍——並能在不犧牲頻寬的情況下同時修正多個錯誤。第四,能源效率:讓系統能在不排擠 Token 生成所需電力的情況下,在工廠中塞入盡可能多的 CPU。

影片詳述了 Vera CPU 的技術架構。Vera 核心中的 NVIDIA Olympus 核心專為現代資料中心工作負載打造,包括分支密集型的 Python 執行環境、工具呼叫與沙盒程式碼執行。每個核心具備神經分支預測器、10 寬度解碼引擎、大型亂序執行引擎,以及具備新型圖形引擎的先進預取器。影片指出,Vera 的峰值記憶體延遲比 x86 低 40%。記憶體一致性 NVLink 晶片對晶片連接技術將 GPU 直接連接至 CPU,並可將 Vera 擴展至多個插槽。Vera 的代理沙盒效能是 x86 CPU 的 1.8 倍。

回到台上,黃仁勳展示了基準測試結果。他顯示 SQL 在 Vera 上執行速度快了三倍——他稱這非常驚人,因為 SQL 是最難加速的工作負載之一。他還展示了紐約證券交易所的即時串流處理結果,Vera CPU 執行速度快了六倍,這歸功於架構的頻寬提升、單執行緒指令執行以及內部與外部頻寬的優化。

他提到台灣幾乎所有主要的 OEM 與 ODM 廠商都支持 Vera。他表示早期採用者是代理公司,這代表了一個前所未有的新市場——專為代理設計的 CPU。他指出,代理數量將遠超人類,且代理非常沒有耐心,這使得該市場規模勢必更大。他補充訂單已經湧入,並預測 Vera 將成為 NVIDIA 公司史上最快、最成功的產品發表。

用於企業 AI 的 NVIDIA Agent Toolkit

黃仁勳提出了本次演講最重要的重點:用於企業 AI 的 NVIDIA Agent Toolkit(代理工具套件)。他表示每家公司都將執行代理,每家公司內部都會有代理,且每家公司都在詢問如何安全地執行並為自身工作負載打造代理。

該工具套件包含四個組件。第一,模型——大型語言模型,越聰明、越便宜、越快越好。第二,用於協調一切的框架。第三,具備技能的工具——包括 CUDA-X 函式庫。第四,執行環境——即 NVIDIA 稱為 OpenShell 的作業系統。OpenShell 是一個高度安全的企業級框架,能保護代理、將其限制在安全政策內、保護隱私、管理權限並保護身分。它是開源的,並正被 Red Hat、Canonical 與 Microsoft 等廣泛採用。工具套件還包括 OpenClaw 與 Hermes 等開放代理框架。

為了示範工具套件的實際應用,黃仁勳描述了與 Cadence 的合作,共同打造晶片設計超級代理。影片展示了該代理——由 Codex 或 Claude Code 協調,由 Nemotron 驅動,並由 NVIDIA OpenShell 保護——執行設計驗證工作流程。子代理負責 RTL 生成、測試平台建立、迴歸測試與除錯。晶片堆疊代理利用 Cadence Xcelium 執行數百次模擬,並以 JasperGold 進行形式驗證。過去需要團隊數週的工作,現在僅需數小時——驗證週期快了 40 倍以上。

黃仁勳表示,NVIDIA 擁有數千名晶片設計師,未來將聘用數十萬個 Cadence 超級代理與他們並肩工作,以進一步加速研發。他接著宣布 Nemotron 3 Ultra,這是全球首款結合狀態空間模型(SSM)與混合專家模型(MoE)的混合架構模型。他表示其執行速度比全球最經濟的模型快 5 倍,成本低 30%,表現優於全球頂尖的開放模型。與之前的 Nemotron 模型一樣,NVIDIA 不僅釋出模型,還釋出所有訓練資料與腳本,讓任何人都能進行擴充與客製化。他提到 NVIDIA 目前正開發 Nemotron 4。

他列出了已採用該工具套件的企業軟體合作夥伴:Cadence、CrowdStrike、ServiceNow、Palantir 與 SAP。他重申,代理不會顛覆這些公司,反而會為企業軟體夥伴創造史上最大的機會。

重塑 PC:RTX Spark、Windows 電腦與 DGX Station

黃仁勳轉向個人計算領域,將討論置於 PC 40 年歷史的背景下。他表示 Microsoft 與 NVIDIA 正攜手為代理時代重塑 PC,雙方已花費三年時間徹底重新構想 PC 的運作方式。

他介紹了 RTX Spark,稱其為 NVIDIA 33 年來所有經驗的結晶。RTX Spark 搭載 Blackwell RTX GPU,具備 6,144 個 Tensor 核心、1 Petaflop 的 AI 效能、與聯發科合作客製化的 20 核心 Grace CPU、NVLink 融合技術、128 GB 統一記憶體、台積電 3 奈米製程及 700 億個電晶體。他表示 NVIDIA 所有的軟體都能在其上執行——數位生物學、地震處理、天體物理學、所有物理、生物學、基因組學、AI 與電腦圖形學,以及 Windows 曾經執行過的每一個應用程式。他表示 Microsoft 與 NVIDIA 精心優化了一切,使電腦能運行世界上創造過的所有軟體,外加代理。

影片示範了在 RTX Spark 上本地運行的代理協助設計房屋。該代理透過運行 Hermes 框架的 OpenShell 沙盒運作,連接雲端的 Claude Sonnet,並使用筆電上的工具(包括 Rhino 3D 建模與 Blender 渲染)。代理模擬了場地、地形塑形、提出兼顧成本與舒適度的建築形式、生成室內佈局、自動放置門窗與結構元件、偵測並修正自身錯誤、將 Rhino 模型匯出至 Blender 並保留材質與物件屬性,最後利用 Flux 2 生成式 AI 模型產生多視角與多種照明條件下的照片級渲染圖。

他也強調了 Adobe 作為合作夥伴,指出他們已針對 RTX Spark 重新設計了 Photoshop 與 Premiere 的核心,使其應用程式速度提升兩倍,並透過 MCP 伺服器使其具備代理友善性,能與筆電上的代理互動。

黃仁勳隨後宣布了更廣泛的全新 PC 系列:三款革命性的 Windows 電腦,涵蓋桌機、筆電與工作站,全數 100% 相容 Windows、100% 支援 CUDA、100% 搭載 NVIDIA AI Tensor 核心。他展示了 MSI 桌機版的 RTX Spark 平台,並描述其具備 24 小時全天候運行代理的能力,且無須擔心電費,能連接使用者的整個家庭——筆電、顯示器、相機、家電與保全系統——作為一個隨時間越發聰明的個人 AI 代理。

他還宣布了相容 Windows 的 DGX Station,具備 768 GB 記憶體、20 Petaflops 計算能力與每秒 8 TB 的記憶體頻寬,足以在開發者桌邊運行兆級參數的模型。他表示這代表了一個全新產品系列的開始,未來每一代架構都將推出對應的桌機、筆電與工作站。

他將 PC 的預期轉變與手機的發展進行比較。20 年前,手機只是手機。今天,人們幾乎不使用手機進行通話。他確信 10 年後的 PC 將完全不同——正如今天每個家庭都有家庭劇院與家電,未來每個家庭都將擁有一台 AI 超級電腦,全天候運行主人的所有代理與助理。他表示這將更像 R2-D2 或 C-3PO 而非傳統 PC,而這場重塑的重要性不亞於手機轉型為智慧型手機。

實體 AI:Cosmos 3、自動駕駛與人形機器人

黃仁勳轉向實體 AI 與機器人技術,指出代理式 AI 本質上就是數位機器人——它能理解、推理、規劃與行動。相同的計算模式將應用於各類實體系統。

他描述了實體 AI 的資料挑戰:語言模型的訓練資料是從人類視角撰寫的,但機器人訓練資料必須來自機器人的視角。世界上大多數視訊資料都是第三人稱視角,而非第一人稱。他概述了從遠端操作與人類示範,到模擬訓練,再到將第三人稱資料重投影為第一人稱,最終達到能從任何視角理解實體世界的「世界基礎模型」(World Foundation Model)的進展階梯。

黃仁勳宣布 Cosmos 3,稱其為實體 AI 的前沿。他表示 NVIDIA 在實體 AI 領域絕對是全球頂尖,並將 Cosmos 3 描述為任何涉及實體世界工作的基礎模型——無論是工廠機器人,還是任何在實體環境中運作的機器人。影片介紹 Cosmos 為建構在新型「Transformer 混合架構」(Mixture of Transformers)上的開放式前沿全能模型。像素、動作、聲音與語言流入一個自回歸 Transformer,進行推理、規劃並指示擴散 Transformer 生成下一步。Cosmos 可作為觀察並理解實體世界的視覺語言模型、生成物理準確合成影片的世界模型、作為策略訓練與評估閉環的模擬器,以及 NVIDIA OmniDreams(一種預測未來影格的動作條件世界模型)的基礎。Cosmos 是開放的——模型、資料與訓練方法皆公開釋出。

他接著宣布 Alpamayo 2 Super,這是用於自動駕駛車的開放模型,也是全球首款具備推理能力的自動駕駛車。他指出,約佔全球 80% 的汽車製造商品牌已加入 NVIDIA DRIVE Hyperion,全球約 97% 的移動服務正與 NVIDIA 連結。示範影片顯示 Mercedes 車輛在城市駕駛場景中導航——處理行人、停車標誌、變換車道、切入車輛與封鎖車道——同時系統即時敘述其推理過程。黃仁勳開玩笑說,雖然車輛不斷對自己說話可能會讓乘客發瘋,但這種敘述代表了思考,而這正是他們想要的。

他隨後談到人形機器人,將 NVIDIA Isaac GR00T 平台描述為涵蓋完整人形機器人堆疊——模型、資料生成、模擬、執行環境與作業系統。他宣布 NVIDIA Isaac GR00T 參考人形機器人,完全整合了由 Sharpa 製造、每隻手具備 25 個自由度、總計 31 個自由度的系統,身高 6 英尺,重 150 磅,運行於全新的 Jetson Thor 平台與完整的 Isaac GR00T 軟體堆疊。他表示該平台主要為高等教育與大學研究人員打造,對他們而言,從零開始建造這樣的機器人極其困難。影片詳細描述了完整工作流程:在 Isaac Lab 設定模擬、利用 Isaac Teleoperation 捕捉示範、透過 Omniverse 與 Cosmos 生成合成資料、訓練策略、在 Isaac Lab Arena 評估,並透過 Jetson Thor 上的 Isaac ROS 部署,每個元素皆為模組化且開放。

總結

黃仁勳以重大發表的總結結束演講。Vera Rubin 已全面量產——這不僅是一個 GPU,而是一個完整的解構式分散式代理處理系統。NVIDIA 已成為一家 AI 基礎設施公司。Vera CPU 是專為代理而非人類打造的革命性新架構,其屬性與以往所有 CPU 截然不同。訂單已經湧入,預計將成為 NVIDIA 史上最快、最成功的產品發表。Microsoft 與 NVIDIA 為代理時代創造了全新的 PC 系列,全球所有 PC OEM 廠商皆已加入。相同的代理計算模式將複製到雲端、企業、PC、機器人、衛星、基地台與工廠中。

他表達了對個人電腦觀念將發生深遠改變的信心,並感謝台灣生態系過去一年來的合作、友誼與卓越貢獻。他最後歡迎大家參加 Computex 2026。

NVIDIA 深度剖析

運算架構的演進

NVIDIA 已完成從單一圖形處理器供應商,轉型為人工智慧時代的全端架構設計者。該公司的商業模式核心在於設計並將加速運算平台變現,這些平台為人工智慧、高效能運算及先進數據視覺化提供動力。NVIDIA 不僅僅是販售標準晶片,而是提供完全整合的基礎設施。其生態系統涵蓋底層運算硬體,包括圖形處理器(GPU)與中央處理器(CPU),以及如 InfiniBand 與乙太網路交換器等關鍵資料中心網路設備。此硬體層由龐大且具專利權的軟體堆疊強力支撐,使該公司得以在整個資料中心架構中獲取價值。

這種全端策略在財務上的體現極為驚人。2027 會計年度第一季,該公司總營收達 816 億美元,年增率達 85%。資料中心部門現已完全超越傳統遊戲業務,單季營收達 752 億美元。至關重要的是,NVIDIA 已成功將網路業務從附屬產品轉變為獨立的結構性支柱。僅資料中心網路業務單季營收即達 148 億美元,主要受惠於 Spectrum-X 乙太網路與 NVLink 互連技術的採用。此外,該公司正透過 NVIDIA AI Enterprise 系統性地擴大經常性軟體營收,每個 GPU 每年約可帶來 4,500 美元的收益,在其硬體裝機基礎上疊加高毛利的訂閱經濟。這種營運槓桿充分反映在公司的獲利能力中,毛利率高達 74.9%,且單季產生 486 億美元的自由現金流。

生態系統:客戶、供應商與競爭對手

NVIDIA 的客戶群反映了全球人工智慧建設的雙引擎驅動。目前,資料中心部門的營收分佈呈現完美平衡:約 50% 的需求來自超大規模雲端服務供應商,包括 Microsoft、Alphabet、Amazon 與 Meta;其餘 50% 則分佈於主權 AI 計畫、企業資料中心與工業應用。這種多元化是關鍵的風險分散因素,證明加速運算需求已成功超越少數幾家雲端基礎設施巨頭,實現了廣泛的擴張。

在供應端,NVIDIA 的主要脆弱點與限制仍結構性地與台積電(TSMC)掛鉤。該公司多晶片系統的物理複雜性,使其高度依賴台積電的 CoWoS 先進封裝產能。預計到 2026 年底,每月總 CoWoS 產能將達到 12 萬至 13 萬片晶圓,其中 NVIDIA 佔據高達 60% 的份額。此外,該公司高度依賴 SK Hynix 與 Micron 等記憶體供應商提供關鍵的高頻寬記憶體(HBM)模組,形成一個極其複雜的多層次供應鏈,任何單一環節的瓶頸都會立即抑制已認列的營收。

競爭格局正沿著兩個不同方向加劇:標準晶片對手與超大規模業者的內部工程。Advanced Micro Devices(AMD)仍是最顯眼的標準晶片競爭對手,正陸續推出 MI350 及即將問世的 MI400 系列架構。然而,更具生存威脅的挑戰來自 NVIDIA 的最大客戶。Alphabet 部署其專有的 TPU v6e Trillium 與 TPU v7 Ironwood,以及 Amazon 的 Trainium 2,皆代表了資金雄厚、旨在繞過 NVIDIA 利潤空間的實質努力。隨著雲端供應商尋求優化總擁有成本並降低對單一供應商的絕對依賴,內部晶片專案正獲得幾乎無上限的資本投入。

市占率與 CUDA 的堡壘

儘管競爭雜音增加,我們對 2026 年資料中心加速器市場的分析顯示,NVIDIA 按營收計算仍持續掌握全球約 80% 的市占率。AMD 的 Instinct 產品組合已建立穩固但較小的立足點,約占 5% 至 7% 的市場。這種持久的市場主導地位不僅源於算力表現,更受到 NVIDIA Compute Unified Device Architecture(CUDA)軟體平台的強力保護。近二十年來,該生態系統已成為平行運算與人工智慧開發的通用語言。

競爭對手經常能在原始硬體規格(如記憶體頻寬或每秒兆次浮點運算)上追平甚至理論上超越 NVIDIA。然而,要取代 NVIDIA,必須說服企業開發者放棄一個高度成熟、文件詳盡的軟體生態系統,轉而投向尚在萌芽的替代方案。此外,市占率日益受到網路主導地位的保護。隨著人工智慧模型參數規模擴展至兆級,訓練這些模型需要數萬個處理器之間的完美同步。NVIDIA 有能力銷售整套機櫃級架構,無縫整合處理器、交換器與資料處理器(DPU),創造出碎片化競爭對手難以複製的整合效能標準。這種深層的結構性根基,確保了進入門檻始終高不可攀。

世代更迭:Blackwell 與 Rubin

硬體產品週期是未來營收加速的核心催化劑。隨著 Hopper 架構奠定了生成式運算熱潮的基礎,Blackwell 世代目前的量產進度正推動 2026 年初的基礎設施部署。然而,NVIDIA 已透過引入 Vera Rubin 平台規劃了下一個淘汰週期,預計於 2026 年下半年實現大規模雲端可用性。Rubin 產品系列代表了架構上的重大躍進。

Rubin 平台內部的核心 R100 單元採用 3 奈米製程,整合 3,360 億個電晶體,較前一代大幅擴充。它引領產業邁向次世代 HBM4 記憶體,提供 288GB 記憶體容量及每顆晶片 50 PFLOPS 的 FP4 運算能力。同樣關鍵的是,Rubin 世代正積極將 NVIDIA 專有的 Vera 中央處理器推向資料中心。透過將核心加速器與 ARM 架構處理器結合,NVIDIA 正明確進軍通用伺服器市場,解鎖一個總值 2,000 億美元的全新潛在市場。管理層宣稱,Rubin 平台在大規模部署下可將推論 Token 成本降低達 10 倍,徹底重置部署的單位經濟效益,並迫使產業進入非自願的升級週期。

產業動態與顛覆性參與者

資料中心基礎設施市場已從基於通用運算的資本支出,結構性轉向專用智慧工廠。主要機會在於代理框架(agentic frameworks)與在地邊緣運算的激增。隨著即時語音、影片與自主推理等應用驅動推論需求呈指數級成長,對在地運算實例的需求正將潛在市場規模擴展至傳統超大規模設施之外。此外,主權人工智慧的興起——即各國政府正積極投入數十億美元建立在地基礎設施——正提供一層高度持久且非相關的市場需求。

反之,該產業正面臨嚴峻的物理與熱力學限制。持續部署的主要威脅並非資本不足,而是電力與散熱密度。競爭指標正迅速從絕對效能轉向每百萬瓦(megawatt)的 Token 產出。這種動態正為專注於低功耗、高傳輸量推論工作負載的顛覆性新進者創造機會。Cerebras 與 Groq 等公司已超越投機性創投階段,正積極取得具體的商業合約,利用獨特的晶圓級整合與在地 SRAM 架構,完全繞過高頻寬記憶體的瓶頸。儘管這些新進者尚無法威脅 NVIDIA 在大型模型訓練上的鐵腕統治,但它們對未來的推論營收池構成了具體且針對性極強的威脅。

管理層實績

在黃仁勳(Jensen Huang)的領導下,經營團隊在技術預測與供應鏈執行方面展現了無與倫比的實績。過去三年,管理層準確識別了向加速運算的架構轉移,並在市場廣泛理解需求規模前,積極鎖定長期的晶圓產能。這種投入數十億美元於不可取消採購義務的決心,使 NVIDIA 得以實質壟斷基礎設施繁榮的早期階段。

管理層的資本配置框架隨著營運現金流同步成熟。NVIDIA 過去被視為波動劇烈的成長型企業,現已迅速轉型為結構性的現金回饋工具。僅在 2027 會計年度第一季,該公司即執行約 200 億美元的股東回饋,宣布將季度股息提高 25 倍,並授權額外 800 億美元的股票回購計畫。管理層在處理從 Hopper 架構轉向 Blackwell,並隨即進入 Rubin 的過渡期時,展現了極高的營運精準度,既未蠶食當季銷售,也未遭受災難性的庫存減記,凸顯了該執行團隊正處於工業能力的巔峰狀態。

總結評分

NVIDIA 是現代運算時代最具代表性的基礎設施供應商,結合了無與倫比的硬體工程實力與根深蒂固的軟體護城河。其財務執行力規模龐大,單季 816 億美元的營收與 74.9% 的優異毛利率,證明了其商業模式已完全擺脫傳統半導體週期性。向全機櫃級系統、專有網路設備及透過即將推出的 Vera Rubin 平台進軍中央處理器領域的策略性擴張,實質上確保了該公司在未來中期內,能從全球資料中心資本支出中獲取越來越大的份額。

從絕對壟斷邁向市場主導者的轉型正全面進行中。超大規模客製化晶片的快速成熟,加上直接標準晶片競爭對手與針對特定推論架構的新進者的持續硬體迭代,將不可避免地壓縮該公司過去的容錯空間。雖然物理封裝限制與全產業性的電力瓶頸限制了近期的產量擴張,但該公司的定價能力與生態系統黏著度依然絕對。在雲端與企業營收均衡分佈,以及主動轉型為軟體定義生態系統的支撐下,其核心商業模式保持了深厚的結構性耐受力。

免責聲明: 本文僅供參考,不構成投資建議或買賣、持有任何證券的推薦。 我們的分析師對企業事件提供詳細報導,但也可能出錯,請務必進行您自己的自行評估與研究。 文中所表達的觀點和意見不一定反映 DruckFin 的立場。 我們未獨立核實本文所使用的所有資訊,其中可能包含錯誤或遺漏。 在做出任何投資決定之前,請諮詢合格的財務顧問。 DruckFin 及其關係企業對因依賴此內容而產生的任何損失不承擔任何責任。 完整條款請見我們的使用條款