NVIDIA 實錄:Vera Rubin AI 平台全面量產,代理人(Agents)重塑運算經濟學
GTC Taipei 2026 主題演講 - 2026 年 6 月 1 日
NVIDIA 執行長黃仁勳在 GTC Taipei 登台宣布,NVIDIA 雄心勃勃的 Vera Rubin 平台現已進入全面量產階段。他將此稱為自個人電腦(PC)革命以來,運算領域最重大的變革。這場主題演講同步於台灣 70 個地點轉播,黃仁勳強調,實用的 AI 時代已經來臨,運算的經濟模式已發生根本性轉變。
AI 經濟學:Token 等同於營收
黃仁勳首先以強而有力的證據展示代理人 AI(Agentic AI)已從願景轉向生產力。他展示 GitHub 的提交(commit)數據指出,2023 年全球 3,000 萬名軟體開發者產出了 3 億次提交,到了 2025 年該數字達到 5 億次;而 2026 年僅過幾個月,提交次數已近乎翻倍至約 9 億次。
這背後的經濟影響深遠。黃仁勳解釋,目前投入 3 兆美元的開發者薪資,所產出的價值相當於過去需要 9 兆美元人力才能達成的成果。這是 AI 產生可衡量 GDP 成長的首個具體證明。他強調,與大眾擔憂的「取代工作」相反,企業反而聘用了更多軟體工程師,因為每位工程師的產出價值已大幅提升。
生產力的激增創造了對運算基礎設施前所未有的需求。黃仁勳指出,由於 Token 現在已成為獲利的單位,AI 企業渴望生成更多 Token,這正是台灣半導體生態系經歷爆發式成長的驅動力。他以台灣預估近 10% 的 GDP 成長率,作為運算需求強勁的直接佐證。
理解代理人運算模型(Agentic Computing Model)
黃仁勳花費相當篇幅解釋代理人與傳統應用程式的本質差異。一個代理人由大型語言模型(LLM)組成,並置於一套能夠協調觀察、推理、規劃與行動的架構(Harness)之中。代理人使用各種工具——如試算表、網頁瀏覽器、資料庫或專業運算引擎——這些工具由架構進行管理,就像作業系統管理應用程式一樣。
現場演示包括透過簡單文字指令生成台北 101 大樓的 GIF 動畫、根據口頭描述建立 3D 列印所需的 CAD 檔案,以及透過自然語言執行複雜任務。黃仁勳強調,運算模式已從「啟動應用程式並點擊按鈕」,轉變為「向 AI 解釋意圖」,再由 AI 生成程式碼或使用工具來產出結果。
解構式運算挑戰
代理人運算模型代表了終極的解構式與分散式運算架構。不同的元件運行在資料中心的不同部分:大型語言模型的思考過程啟動整櫃的 Grace Blackwell NVLink 72 系統;工具使用則啟動運行編譯器、Python、JavaScript 或加速運算函式庫的 CPU;安全架構則運行在 NVIDIA BlueField 等 CPU 與 DPU 上;而編排工作則由 CPU 負責管理整個工作流程。
記憶體管理成為最複雜的挑戰之一。被稱為 KV 快取(KV caching)的工作記憶體,必須處理結構化與非結構化資料的壓縮與檢索。資料結構之間的本體論與關聯性產生了極其複雜的處理需求。黃仁勳預測,AI 的記憶體系統將徹底顛覆儲存基礎設施。
這種異質、解構式的架構正是 NVIDIA 打造 Vera Rubin 的原因。黃仁勳強調,Vera Rubin 不僅是一顆晶片,而是一整套端到端的系統,包含 GPU、CPU、儲存系統、ConnectX-9 網路、安全處理器與軟體堆疊。每個系統元件單獨來看都是一場革命,整合在一起則代表了 NVIDIA 最雄心勃勃的計畫。
NVIDIA 作為基礎設施公司
黃仁勳說明,NVIDIA 已從 GPU 公司轉型為系統公司,現在更進一步成為基礎設施公司。生態系現已涵蓋發電機、冷卻系統與電網供應商。NVIDIA 的目標是建立完整的基礎設施堆疊,讓客戶能建造「AI 工廠」。
他介紹了 DSX——繼用於 GPU 的 RTX 與用於系統的 DGX 之後的基礎設施藍圖。DSX 包含 DSX Sim,這是一個基於 Omniverse 的模擬器,合作夥伴可在下訂任何機櫃前,先在數位孿生(Digital Twin)中設計並驗證整個 AI 工廠,包括規劃佈局、模擬電力與冷卻、設計網路並測試每項變更。
DSX OS 負責配置、操作、監控與修復基礎設施,將已安裝的系統轉化為可信賴、多租戶、具備韌性的 AI 就緒容量。突破性創新包括 DSX MaxLPS,透過將過度配置(overprovisioning)從 40% 降至近乎零,讓營運商能在相同的電力預算下部署更多 GPU,每年增加數十億美元營收。45 攝氏度的熱液冷卻技術則減少了水與能源消耗。動態電力分配在機櫃間調度電力,回收閒置瓦數。AI 代理人團隊則持續協調冷卻與電力,以滿足工作負載需求。
競爭優勢的四大要素
黃仁勳提出了評估 AI 基礎設施投資的定義框架,包含基礎設施上線速度、傳輸量、可靠性與使用壽命。由於這些系統投資金額高達 500 億至 1,000 億美元,每個因素都會顯著影響投資報酬率。
「首個 Token 的產生時間」至關重要。NVIDIA 的全整合方法——每個元件共同設計且整個系統經過模擬——使部署速度遠快於競爭對手。此外,傳輸量(Throughput)即營收,在電力容量有限的情況下,每瓦傳輸量直接等同於營收。黃仁勳強調,不考慮每瓦效能而選擇便宜晶片在經濟上是不理性的。他明確表示:「買得越多,賺得越多。」
在系統壽命方面,由於 NVIDIA 系統在全球運作且軟體開發者皆以 CUDA 為基礎,生態系確保了資產的長期使用價值與低總體擁有成本。
Vera Rubin:全面量產公告
黃仁勳宣布 Vera Rubin 現已進入全面量產,現場響起持續的掌聲。Vera Rubin 的供應鏈規模是 Grace Blackwell 的兩倍。製造傳輸量顯著提升:過去組裝一台 Grace Blackwell 機櫃需兩小時,現在僅需五分鐘。
Vera Rubin 系統由七顆新晶片組成,透過台積電(TSMC)3 奈米製程、CoWoS 先進封裝,以及來自美光(Micron)、SK 海力士(SK Hynix)與三星(Samsung)的 HBM4 記憶體打造。Vera Rubin GPU 包含 6 兆個電晶體,單一電路板上擁有超過 18,000 個元件。
Vera Rubin NVL72 負責思考——包括提示處理、上下文理解、推理與規劃。Vera CPU 機櫃則在單一液冷機櫃中包含 256 顆 CPU,負責編排模型、調度記憶體與啟動工具。鴻海(Foxconn)與廣達(Quanta)製造了 Vera LPX 機櫃,內建 256 顆 Groq LPU,提供每秒 40 PB 的 SRAM 頻寬,實現超低延遲。
NVIDIA Vera CPU:為代理人而生的運算
黃仁勳介紹了 Vera CPU,這與以往的處理器截然不同。傳統 CPU 為人類設計,世界以「秒」計;而代理人生活在以「奈秒」計的世界中,它們非常急躁。當代理人使用工具或存取資料庫時,任何等待都會阻礙其進入下一步。因此,讓 CPU 具備極低延遲與互動性至關重要。
Vera 是首款在極限下打造的 CPU,透過連接所有 CPU 核心的架構,實現每秒 3.6 TB 的頻寬,且無跨晶片邊界延遲。Vera 是首款使用 PCIe Gen 6 與 LPDDR5 的 CPU,頻寬達到每秒 1.2 TB,是市場上最高效能 CPU 的兩到三倍。
NVIDIA 企業 AI 代理人工具組(Agent Toolkit)
黃仁勳強調,未來十年將由「代理人搭配架構」的運算模式所定義。每家公司都將成為「代理人公司」。NVIDIA 企業 AI 工具組(NVIDIA Agent Toolkit for Enterprise AI)旨在協助企業建立代理人服務或內部運作代理人。該工具組包含四個要素:聰明且快速的模型、編排一切的架構、代理人可使用的工具與技能,以及將一切串聯的執行環境(Runtime)。
其中,Nemotron 3 Ultra 是 NVIDIA 最新推出的開源模型,基於狀態空間模型(State Space Models)與混合專家模型(Mixture of Experts)的混合架構,速度提升五倍,成本降低 30%,旨在讓每個人都能建立自己的代理人。
重塑個人電腦
黃仁勳與微軟共同宣布重塑 PC,推出 RTX Spark。這是 NVIDIA 33 年經驗的結晶,專為 AI 時代設計。RTX Spark 內建 Blackwell RTX GPU,擁有 6,144 個 Tensor Core,提供 1 Petaflop 的 AI 效能,並與聯發科(MediaTek)合作打造 20 核心 Grace CPU,透過 NVLink 融合 128GB 統一記憶體。這不僅能運行本地 Nemotron 3 Ultra 模型,還能透過 OpenShell 沙盒環境連接雲端模型,讓代理人能在筆電上協助設計、研究等複雜任務。
物理 AI 與 Cosmos 3 基礎模型
代理人 AI 本質上是理解、推理、規劃、行動並使用工具的數位機器人。黃仁勳宣布 Cosmos 3 為物理 AI 的前沿模型。這是所有機器人工作的基礎模型,無論是工廠機器人、人形機器人還是自動駕駛車輛,都能透過 Cosmos 3 理解並推理物理世界。Cosmos 3 採用混合 Transformer 架構,能預測物理世界的下一步,是 NVIDIA 在物理 AI 領域的重大突破。
Isaac GR00T 平台與參考機器人
最後,黃仁勳介紹了 NVIDIA Isaac GR00T 人形機器人平台。這是一個包含模型、資料生成、模擬與執行環境的完整堆疊。NVIDIA 同步推出 Isaac GR00T 參考設計人形機器人,旨在降低高等教育與研究機構開發機器人的門檻。這款機器人擁有 31 個自由度,運行 Jetson Thor 電腦,是 NVIDIA 致力於推動機器人時代的具體實踐。
黃仁勳總結,代理人運算模式將在雲端、企業內部、PC 以及機器人中全面普及。NVIDIA 已從 GPU 公司轉型為基礎設施公司,將持續與全球合作夥伴共同迎接這個運算新紀元。
NVIDIA 深度剖析:透過全端協同設計壟斷代理 AI 時代
商業模式與營收架構
NVIDIA 完成了企業史上最驚人的轉型之一,從一家繪圖晶片製造商演變為垂直整合、全端加速運算平台供應商。NVIDIA 經濟模式的核心引擎在於資料中心業務,目前該業務佔公司合併營收的 92% 以上。NVIDIA 的商業模式並非銷售單一矽晶片,而是圍繞著銷售完整的加速運算平台來建構。這些平台包含高效能圖形處理器(GPU)、客製化中央處理器(CPU)、先進網路晶片以及專有軟體。過去幾季以來,銷售的基本單位已從單一伺服器主機板轉移至完全整合的機櫃級超級運算機殼,例如 Grace Blackwell 系統以及剛開始量產的 Vera Rubin 平台。這使公司得以獲取多層高毛利的硬體與軟體溢價,而這些利潤在過去通常會被供應鏈中的各個參與者瓜分。
NVIDIA 的財務表現反映了這種系統級貨幣化策略的複利回報。截至 2026 年 4 月 26 日的 2027 會計年度第一季,NVIDIA 創下 816 億美元的營收紀錄,較去年同期成長 85%,季增 20%。此成長由資料中心部門帶動,該部門營收達 752 億美元,年增 92%。此模式的財務生產力建立在無與倫比的定價能力與高毛利系統組合之上,促使 GAAP 與非 GAAP 毛利率分別達到 74.9% 與 75.0%。這種龐大的獲利能力支撐了積極的資本回報策略。僅在 2027 會計年度第一季,NVIDIA 就透過股利與股票回購向股東回饋了約 200 億美元,包括將季度現金股利提高至每股 0.25 美元,並設立了額外 800 億美元的股票回購授權。
客戶、供應商與競爭對手生態系
NVIDIA 價值鏈的結構特點在於極高的客戶集中度、高度製造專業化以及激烈的競爭態勢。NVIDIA 的主要客戶群為全球雲端服務供應商與超大規模運算(hyperscale)營運商,即所謂的「四大巨頭」(Big Four),包括 Microsoft、Amazon、Alphabet 與 Meta。這種集中度為營收管道帶來了實質風險,因為在 2026 會計年度末,僅這四家客戶就佔了總營收的 61%,最大單一買家更佔銷售額的 22%。終端客戶則是企業軟體開發商、消費性網路平台以及正在建構主權 AI 基礎設施的國家政府。在供應端,台積電(TSMC)是 NVIDIA 不可或缺的製造夥伴。NVIDIA 已將其在台灣的資本支出與採購金額提高至每年約 1,500 億美元,使其成為台灣科技生態系中最大的採購商,並確保了對先進製程節點與 CoWoS 封裝產能的優先取得權。其他關鍵供應商包括 SK Hynix、Samsung 與 Micron,它們提供現代加速器不可或缺的高頻寬記憶體(HBM)。
在競爭格局方面,商用半導體市場在高階領域呈現雙頭壟斷。Advanced Micro Devices(AMD)是主要的挑戰者,正積極擴大其 Instinct GPU 產品組合。AMD 2026 年第一季資料中心營收年增 57% 至 58 億美元,主要受惠於 Instinct MI300 系列以及即將推出的 MI350 與 MI400 架構。AMD 已取得重大合作承諾,包括與 OpenAI 的 GW 級基礎設施建置,以及與 Meta 的客製化協同設計計畫。Intel 的 Gaudi 加速器仍居第三,且因軟體生態系採用率與平台整合問題而陷入苦戰。除了商用矽晶片外,最強大的競爭對手來自超大規模運算商內部的工程部門,他們正越來越多地設計客製化特殊應用積體電路(ASIC),以繞過商用晶片的利潤抽成。
市占率動態與協同設計護城河
截至 2026 年中,NVIDIA 在商用 AI 加速器市場保持主導地位,市占率估計在 85% 至 92% 之間。儘管競爭對手已成功在市場中取得次要地位,但產業需求的強勁力道讓 NVIDIA 得以在不犧牲毛利率的情況下維持領先。這種市占優勢的基礎是 Compute Device Unified Architecture,即大眾熟知的 CUDA,這是 NVIDIA 耗時二十多年開發的專有軟體運算平台。CUDA 創造了巨大的開發者鎖定效應,因為絕大多數的 AI 訓練函式庫、編譯器與框架優化都是專為 NVIDIA 的軟體堆疊所編寫。若要在競爭對手的硬體上執行最先進的模型,則需要複雜的模擬層或大量的程式碼重寫,這會帶來大多數企業買家無法接受的執行風險與延遲。
NVIDIA 的競爭優勢已從軟體與矽晶片的護城河,擴展為高度整合的機櫃級協同設計霸權。隨著資料中心架構演進,效能瓶頸已從單純的運算能力轉移至系統級通訊與互連頻寬。NVIDIA 透過其專有的擴充(scale-up)與橫向擴充(scale-out)網路來解決此問題,特別是 NVLink 互連協定與 NVSwitch 晶片。在剛發表的 Vera Rubin 平台中,NVLink 6 交換器提供了每秒 260 TB 的驚人總頻寬。作為整個系統的唯一架構師——包括客製化 ARM 架構 Vera CPU、Rubin GPU、ConnectX-9 SuperNIC 以及 Spectrum-6 乙太網路交換器——NVIDIA 在機櫃層級優化了記憶體存取與電力傳輸。這種系統級工程能力使競爭對手無法再以單一元件進行競爭,因為企業買家越來越傾向於需求隨插即用、完全優化的液冷超級電腦,而非零散的半導體元件。
產業機會、地緣政治威脅與平台集中化
NVIDIA 長期的主要機會在於從生成式 AI 模型向代理 AI(agentic AI)與強化學習架構的典範轉移。生成式 AI 極度依賴單次前饋推論查詢,而代理 AI 系統則執行自主的多步驟工作流程。單一使用者指令即可觸發數千個連續步驟,涉及本地沙盒程式碼執行、向量資料庫檢索、工具使用與推理迴圈。這種代理化轉變使每次交易的運算強度呈指數級成長,推動資料中心基礎設施的整體潛在市場(TAM)結構性擴張,並在基礎模型訓練完成後,持續支撐對先進硬體的需求。
這些結構性機會受到嚴峻的地緣政治逆風與平台集中化的制衡。最直接的財務影響是因美國嚴格的出口限制,導致中國資料中心市場完全流失。在 2026 會計年度第一季,NVIDIA 從中國客戶獲得 46 億美元的 Hopper 等級資料中心營收;到了 2027 會計年度第一季,該數字降至零。NVIDIA 目前的財務指引假設來自中國的資料中心運算營收為零,這永久封殺了一個龐大的潛在市場。此外,全球半導體供應鏈高度集中於台灣,構成了系統性的尾部風險。由於台積電製造了約 90% 用於 AI 加速器的先進晶片,該地區任何地緣政治動盪都將立即中斷 NVIDIA 的硬體生產。最後,四大超大規模運算商的極高客戶集中度,使 NVIDIA 面臨資本支出消化週期的風險,若這些主要買家決定優化現有產能,將對 NVIDIA 造成衝擊。
技術藍圖:Vera、Rubin 與代理 AI 的轉型
為了搶佔先機並維持高毛利營收,NVIDIA 已將硬體發布節奏壓縮至一年一週期。剛發表的 Vera Rubin 平台已進入全面量產,預計於 2026 年第三季開始向客戶出貨,該平台即是專為代理 AI 時代所設計。此平台不僅僅是一顆單一晶片,而是一套整合了七種客製化晶片的套件:Vera CPU、Rubin GPU、NVLink 6 交換器、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 乙太網路交換器以及 Groq 3 LPU。這種極致的協同設計使整個機櫃級系統能像單一的分散式加速器一樣運作,繞過了傳統模組化設計在效能與通訊上的限制。
此下一代架構的核心是 Rubin GPU,採用台積電先進的 3 奈米製程。Rubin GPU 擁有 3,360 億個電晶體,較 Blackwell 架構增加 1.6 倍,並整合了 8 組堆疊、共 288 GB 的 HBM4 記憶體。此架構提供每秒 22 TB 的驚人記憶體頻寬,是 Blackwell 的 2.8 倍。Rubin GPU 採用第三代 Transformer Engine,具備硬體加速自適應壓縮功能,支援 4 位元浮點格式,實現高達 50 petaFLOPS 的 NVFP4 推論能力。Rubin 平台的單 GPU 熱設計功耗(TDP)高達 2,300 瓦,全面採用液冷散熱,完全排除了 NVIDIA 高階資料中心產品組合中的氣冷選項。
該平台的另一個關鍵成長驅動力是 Vera CPU,這是 NVIDIA 首款專為代理 AI 編排與強化學習所打造的客製化 ARM 架構處理器。Vera CPU 具備 88 個相容 Armv9.2 架構的客製化 Olympus 核心,並利用空間多執行緒(spatial multi-threading)來分配核心資源。基準測試數據顯示,Vera CPU 的任務完成速度較傳統 x86 伺服器處理器提升 1.8 倍,較上一代 Grace CPU 效能提升 1.63 倍。在邊緣運算方面,NVIDIA 正在部署 RTX Spark 處理器架構,將 Rubin 微架構擴展至消費級筆電與桌機。此裝置端代理框架旨在將 AI 助理從依賴雲端的工具轉變為本地、低延遲、自主運行的代理,為個人運算市場開闢了第二成長曲線。
破壞性挑戰者與客製化矽晶片威脅
儘管 AMD 與 Intel 等傳統競爭對手仍是市場焦點,但對 NVIDIA 市占率最可信的長期威脅,來自雲端超大規模運算商內部設計的客製化 ASIC。客製化矽晶片在 2025 年佔 AI 加速器市場的 20.9%,預計到 2026 年底將擴大至 27.8%。超大規模運算商極具動機部署專有硬體,以繞過 NVIDIA 龐大的商用毛利並降低總擁有成本(TCO)。Google 的 TPU 繼續作為此客製化市場的量能支柱,而 Amazon 的 Trainium 系列已取得數十億美元的重大承諾,包括與 Meta 的部署合作。
Broadcom 已成為此客製化 ASIC 生態系的首要推手與設計夥伴,透過與 Google、Meta 及 OpenAI 的多代客製化協同設計合作,佔據了約 60% 的客製化 AI 半導體市場。Broadcom 的客製化矽晶片計畫正擴展至先進的 2 奈米製程,利用其深厚的實體 IP 與封裝整合能力,打造高效能、具成本效益的通用 GPU 替代方案。同樣地,Marvell 在客製化 ASIC 設計領域擁有約 20% 至 25% 的市占率,主要服務 Amazon Web Services 與 Microsoft。隨著 AI 市場成熟,工作負載從運算密集的基礎訓練轉向高度重複、對成本敏感的推論,這些客製化的特定工作負載 ASIC 構成了結構性逆風,可能在長期內逐漸侵蝕 NVIDIA 在高量超大規模資料中心中的市占率。
管理層績效與稀缺環境下的執行力
由創辦人暨執行長黃仁勳(Jensen Huang)與財務長 Colette Kress 領導的 NVIDIA 高階管理團隊,在營運靈活性與長期戰略遠見方面展現了卓越的紀錄。管理層成功預測了 Transformer 模型革命對硬體的需求,並在生成式 AI 浪潮完全成形前,積極投入資本以確保晶圓製造與先進封裝產能。這種積極的態度使 NVIDIA 能夠在嚴重的全球封裝與矽晶片短缺下,持續執行其硬體擴產計畫,並管理包含僅台灣就有 150 家供應商在內的複雜供應鏈。
這種營運執行力與紀律嚴明、符合股東利益的資本配置框架相輔相成。隨著業務產生龐大的自由現金流,管理層利用其財務實力啟動了大規模的資本回報計畫。在 2027 會計年度第一季,公司向股東回饋了 200 億美元,並設立了額外 800 億美元的無期限股票回購授權,使總回購能力超過 1,180 億美元。儘管部分市場參與者將這種對股票回購與 25 倍股利成長的關注,解讀為超高成長故事走向成熟的跡象,但管理層同時承諾維持一年一週期的硬體發布,並對未來架構(如即將到來的 Feynman 平台)進行大量研發投資,顯示 NVIDIA 在維持平衡資本結構的同時,仍專注於技術領先地位。
總結評分
NVIDIA 繼續在全球 AI 基礎設施建設的核心地帶佔據極強的近乎壟斷地位,其 2027 會計年度第一季創紀錄的 816 億美元營收與 75.0% 的非 GAAP 毛利率即為明證。公司的競爭護城河已遠超單純的矽晶片優勢,擴展至以剛開始量產的 Vera Rubin 平台為代表的全系統與機櫃級協同設計。透過將客製化的 88 核心 Vera CPU 與 3,360 億電晶體的 Rubin GPU 配對,並透過專有的 NVLink 6 網路進行整合,NVIDIA 創造了一個優化且高度整合的平台,其代理運算吞吐量最高可達上一代 Blackwell 的 10 倍。這種全端整合加上深耕已久的 CUDA 軟體生態系,使得 AMD 等商用競爭對手在短期內難以在高階訓練與複雜代理推論工作負載中取得實質市占率。
儘管營運表現卓越,長期投資人仍須權衡 NVIDIA 的主導地位與日益增加的結構性與地緣政治逆風。公司面臨前所未有的客戶集中度,僅四家超大規模運算商就佔總營收 60% 以上,若這些買家進入資本支出消化階段,業務將面臨顯著波動。同時,隨著 Broadcom 與 Marvell 為 Google 與 Amazon 等業者共同開發的客製化 ASIC 迅速崛起,當市場從訓練轉向高度成本敏感的推論時,這構成了可信的長期威脅。加上美國出口管制導致中國資料中心營收完全流失,以及對台灣製造生態系的系統性依賴,NVIDIA 的高溢價估值幾乎沒有容錯空間。雖然技術藍圖依然無人能及,但轉向成熟且高度集中的市場顯示,未來的回報將取決於供應鏈韌性以及客製化矽晶片替代的經濟效益。