Nebius:專為推論、代理與利潤而生的新雲端,而不僅僅是電力競賽
2026年美銀全球科技大會,2026年6月3日
Nebius Group 首席商務長 Roman Chernin 在美銀(Bank of America)2026年全球科技大會上,與該行分析師 Tal Liani 進行對談,闡述了為何 Nebius 認為其架構定位足以在 AI 基礎設施市場從「原始算力」轉向「推論」與「代理(agentic)工作負載」的過程中,勝過大型雲端服務供應商(hyperscalers)及其他新雲端(neoclouds)競爭對手。這場對談揭示了兩項對投資人而言極具價值的核心洞見:其一是 Nebius 的軟體堆疊如何直接擴大其潛在客戶群並推升利潤;其二是該公司近期收購 Eigen 與 Clarifai 的策略邏輯,管理層認為這兩次收購共同打造了目前市場上最強大的大規模推論工程團隊之一。
不賣沙漠中的水,而是販售管線系統
Liani 在開場時直言不諱地定義了當前的 AI 基礎設施熱潮:「現在販售資料中心容量,就像在炎熱沙漠中賣水一樣。」Chernin 的反駁同樣直接且具戰略重要性:「我們不賣資料中心容量,我們賣的是建構在基礎設施之上的產品。」這種區別並非行銷術語,而是反映了 Nebius 針對不同客戶原型所建構的刻意且分層的市場進入架構,每一類客戶對 AI 基礎設施的抽象化需求各不相同。
基礎層是那些需要大規模裸機(bare-metal)算力,且幾乎不需要其他服務的大型雲端供應商與前沿實驗室。在其之上,是 Chernin 所稱的「AI 原生實驗室」或「Neolabs」——數百甚至數千家以研究為導向的組織,他們需要託管基礎設施,以便專注於訓練任務,而無需維護整套軟體堆疊。Nebius 透過其所謂的多租戶雲端服務這些群體。再上一層則是垂直 AI 產品的開發者——例如編碼領域的 Cursor、法律領域的 Harvey 或 Legora、內容領域的 Gamma,以及 CRM 領域的 Clay——這些公司根本不以 GPU 時數來思考。他們將模型視為一種服務(models as a service),而 Nebius 為此打造了一個名為 Nebius Token Factory 的託管推論平台。再往上則是新興的代理層,開發者不再需要選擇模型或比較 Token 價格,只需購買代理執行後的結果。
「我們的產品策略就是在那裡迎接他們,」Chernin 描述了這種追隨 AI 消費浪潮而非錨定單一抽象層的哲學。其商業邏輯很簡單:堆疊中的每一層都將 Nebius 的服務範圍從少數幾家大型雲端供應商,擴展到數千家,最終甚至達到數十萬家開發者與建設者。
推論已見成效,並改善資本支出經濟效益
Chernin 確認,推論已成為 Nebius 營收組合中成長最快的領域,且目前已對業務產生「顯著且正面的影響」,而非遙遠的未來目標。這對評估公司近期軌跡的投資人至關重要。訓練合約多為一次性、由基礎設施驅動的銷售,客戶在簽約時就已明確知道所需的 GPU 叢集規模與期限。推論則在結構上截然不同:它是經常性的,與客戶自身的成長同步,並允許 Nebius 透過軟體優化而非僅僅是硬體交付來獲取價值。
Chernin 特別提到了資本支出(CapEx)的生命週期。當新晶片問世,大型客戶將其前沿訓練工作負載遷移至最新硬體時,舊有的叢集並不會成為閒置資產,而是會被重新部署用於推論工作負載。他引用 Anthropic 與 SpaceX 的合作作為此動態的公開案例:SpaceX 將訓練任務轉移至較新的叢集,而原始硬體則繼續高效地執行推論任務。對於像 Nebius 這樣資本密集的企業而言,延長 GPU 叢集的創收壽命,直接提升了投資資本回報率。
收購 Eigen 與 Clarifai:打造推論引擎
Nebius 近期完成的兩項收購——位於舊金山的 Eigen 與總部位於東岸的 Clarifai——皆旨在強化 Token Factory 推論平台,其背後的邏輯在技術上精確到值得深入探討。
Eigen 是一支由麻省理工學院(MIT)博士創立的研究型團隊,專注於模型層級的推論優化,旨在從單一 GPU 中提取更高的 Token 吞吐量。Clarifai 的核心能力則是系統級推論,即如何高效地調度數千個 GPU 以服務數百萬用戶,包括快取策略、需求激增時的節點擴展,以及流量消退時的快速縮減。「將這些技術結合起來,並結合我們內部的工程能力,我們相信現在擁有相當強大——或許是市場上最好——的團隊來構建大規模系統推論,」Chernin 表示。其經濟轉化非常直接:更佳的推論系統效能意味著客戶更優的 Token 經濟效益、Nebius 更高的利用率,以及在性價比上更強的競爭優勢。
為何軟體是利潤的關鍵,即便它不直接變現
Liani 追問軟體與全堆疊策略是否真的能轉化為更高的利潤。Chernin 的回答打破了新雲端業者在單位經濟效益上一貫的模糊態度。其核心論點在於需求端的選擇性:一個能服務 1 萬家客戶的平台,其定價能力永遠優於只能服務 10 家的平台。「你的熱門選項越多,你的定價空間就越大,」他援引自己在數位廣告領域的背景說道。將硬體從客戶端抽象化的能力——意即由 Nebius 而非買方決定哪個 GPU 叢集處理特定的推論工作負載——創造了優化槓桿,這直接轉化為雙方的經濟利益。
他也明確表示,軟體不一定作為獨立產品變現。「你不一定直接靠軟體獲利,但你開發軟體是為了開啟新的應用場景,並為客戶——進而為你自己——提供更多的優化槓桿。」對於那些尋找不存在的獨立軟體營收項目的投資人而言,這是一個重要的細節。利潤紅利隱含在利用率、定價能力,以及從相同的基礎設施基礎上服務更多樣化、更高價值工作負載的能力之中。
大型雲端合約資助了核心業務
關於客戶組合,Chernin 坦率地說明了大型雲端合約在資助 Nebius 更宏大願景中的角色。與 Microsoft 或 Meta 等客戶合作並非長期的戰略終點——Nebius 的既定目標是建立一個包含 AI 原生企業、成長型新創公司與成熟企業的多元化投資組合。但大型批發合約提供了資本,使其能更快速地擴充產能,並更積極地為其餘業務提供融資。據悉,該公司目前平均有 3 到 4 家客戶在爭奪每一個 GPU,Chernin 將此描述為需求端定價槓桿的直接指標。
多元化不僅限於客戶原型,還擴展到合約結構:Nebius 持有長約、短期協議以及可因即時可用性而溢價的現貨容量的混合組合。這種投資組合策略賦予了公司純裸機運營商所缺乏的商業靈活性。
供應鏈:自建資料中心是 2026 下半年及以後的關鍵解鎖
對於 Nebius 而言——正如所有新雲端業者一樣——最核心的限制依然是能否足夠快速地提供具備電力與連線能力的資料中心空間以匹配需求。Chernin 指出,2026 年下半年起,很大一部分新增產能將來自 Nebius 自行從零開發的資料中心,而非租賃第三方設施。自建資料中心改善了成本結構,提供了對時程的更大掌控力,並降低了對外部房東的依賴。在多個地區同步進行約十幾個資料中心專案也發揮了避險作用——單一專案的延遲不會造成交付危機,因為投資組合是刻意超額規劃的。推論工作負載的分散式特性強化了這一點:與需要將算力集中於單一地點的大型訓練叢集不同,推論可以從地理上分散的設施中提供,從而增加了調度的靈活性。
關於大宗商品與晶片定價風險,Chernin 的態度審慎但充滿信心:最大的合約已鎖定供應,而在當前環境下,需求對定價的壓力遠大於零組件的成本通膨。