DruckFin

All In Podcast:中國開源 AI 模型挑戰美國前沿實驗室,記憶體瓶頸引發產業通膨

第 278 集:邀請 Gavin Baker 與 Travis Kalanick,錄製於 2026 年 6 月

中國 AI 實驗室正透過開源模型快速縮小與美國前沿模型的差距,其效能現已媲美甚至超越 OpenAI 的 GPT-5.5 與 Anthropic 的 Claude Opus 4.8,這引發了根本性的質疑:美國自設的安全限制是否仍具備任何戰略意義。中國 Z.AI 發布的 GLM 5.2 成為一個分水嶺,該模型在關鍵基準測試中創下開源權重模型最高分,且成本比美國同類閉源模型低 85%。

中國開源突破使美國的「安全劇場」顯得過時

GLM 5.2 在人工分析智慧指數(artificial analysis intelligence index)中獲得 51 分,創下開源權重模型歷史新高,並在 Frontier SWE 程式編碼基準測試中擊敗 GPT-5.5,僅以不到 1 個百分點的差距落後於 Claude Opus 4.8。該模型擁有 7,440 億個參數與 100 萬個 token 的上下文視窗,採用 MIT 授權條款發布,且無任何區域限制。Z.AI 創辦人向 Elon Musk 表示,具備 Fable 等級能力的模型將在 2027 年第一季前問世。

身處政府行政體系的 David Sacks 警告稱,美國目前針對前沿模型的審核流程正將競爭優勢拱手讓給中國。「在這場競賽中,我們沒有幾個月的時間可以揮霍,」Sacks 表示。「中國在我們的模型之後落後約 9 個月,視能力而定,誤差約 3 個月。但當他們得知在網路安全等領域出現突破時,他們能針對該特定問題投入更多資源,從而更快追上。」

Sacks 將矛頭指向 Anthropic 執行長 Dario Amodei,認為是他促成了導致 Fable 被撤回的監管環境。「我從一開始就說過,我們正與中國處於高度競爭狀態。我們負擔不起任何不必要的行為來拖慢自家公司的腳步。」他形容這種情況可能成為一種自我實現的預言,並指出 Dario 是「作法自斃」,他所倡導的政府審核流程如今反而限制了自家公司。

Gavin Baker 承認 GLM 5.2 的品質「挑戰了我的一些信念」,但他強調,從前沿模型進行蒸餾(distillation)在其中扮演了重要角色。「毫無疑問,這其中存在大量的蒸餾過程,」Baker 解釋道。「想像一下,數以萬計的手機、iPad 和電腦透過遮蔽帳號向雲端 API 提出非常具體的問題,這些推理路徑(reasoning traces)被蒐集起來。隨後,這些推理路徑在強化學習過程中,甚至可能在預訓練過程中,被回饋到模型中。」

然而,Baker 指出,現在 GLM 5.2 已經「足夠優秀,足以進行自我強化學習,覆水難收了」。關鍵問題在於,OpenAI、Mythose 與 SpaceX 即將推出的模型是否能重新拉開差距。

DRAM 瓶頸導致全產業通膨與戰略脆弱性

Micron 的亮眼財報揭示了高頻寬記憶體(HBM)已成為 AI 基礎設施的決定性制約因素,該公司營收年增 4 倍至 420 億美元,且 2026 年全年的產能已全數售罄。Baker 稱 DRAM 為 AI 技術堆疊中「最重要的瓶頸」,並指出「記憶體容量與頻寬是所有 AI 模型效能的基礎」。

供應短缺正推動消費性電子產品價格大幅上漲。Apple 將 MacBook Neo 價格調漲 14% 至 799 美元,Mac Studio 則調漲 25%,轉嫁了先前自行吸收的成本。主持人形容:「通膨已來到桌上型電腦。」Microsoft 調漲了 Xbox 價格,預計 Nintendo Switch 與 PlayStation 也將跟進。

Baker 解釋,全球僅有三家公司能生產 AI 伺服器所需的特殊 HBM DRAM:Micron、SK Hynix 與 Samsung。「這已接近科學所能及的魔法極限,」他說,並強調將 8、12 或 16 個 DRAM 晶粒堆疊並進行必要封裝的難度。第四家廠商、中國的 CXMT 即將上市,並將「以廉價消費級 DRAM 淹沒市場」,但缺乏生產 AI 基礎設施所需客製化晶片的能力。

DRAM 短缺造成了一種奇特的動態,即它現在佔所有超大規模資料中心(hyperscaler)資本支出的 30% 到 40%。Baker 認為這或許反而對社會有益,因為它減緩了 AI 軍備競賽。「這或許能給我們作為一個社會適應的時間,」他引用 Brad Gerstner 所稱的「社會契約」概念說道。建設吉瓦(gigawatt)級資料中心的成本高昂——現在半導體需 350 億美元,電力與冷卻設備需 250 億美元——意味著「即使對超大規模資料中心而言,經濟效益依然至關重要。」

Chamath Palihapitiya 指出,能源限制正加劇記憶體瓶頸。「自 2021 年以來,約 40% 的資料中心面臨電力爭奪,」他說。「我認為這個數字還會上升。我們所看到的 AI 能源消耗預測嚴重失衡。供應極其稀缺,而需求實際上是無限的。」

分散式運算與軌道基礎設施成為解決方案

地面瓶頸正加速人們對分散式運算與軌道資料中心的興趣。Baker 概述了使太空運算日益可行的經濟因素。在地球上建設一個吉瓦級資料中心總成本為 600 億美元——350 億美元用於 Nvidia 半導體,250 億美元用於電力與冷卻設備。一旦 Starship 實現快速重複使用,將同等運算能力送入軌道的發射成本將降至僅 50 億美元,總成本將降至 400 億美元。

「那 250 億美元的電力與冷卻成本顯然具有通膨性質,」Baker 解釋。「三四年後,地面建設成本可能是 700 億美元,而太空只需 400 億美元。隨著 Starship 實現快速重複使用,那 50 億美元的成本很可能是通貨緊縮的。」軌道方案消除了對大規模冷卻基礎設施的需求,太空中的機架透過雷射連結,而非傳統的資料中心架構。

主持人討論了 Tesla 新註冊商標的「Megapod」系統,將其描述為模組化資料中心硬體,可部署在已有電力基礎設施的超級充電站。Palihapitiya 形容,這種可在倉庫製造並在 90 天內部署的預製運算模組,相較於傳統設施通常需要兩到三年的工期,極具吸引力。

Travis Kalanick 強調,他的公司 Adams 正在探索分散式推論網路,將來自各處的剩餘運算能力進行整合。「如果你是一家企業,你會擁有一個路由器,當有人發出查詢或公司需要執行任務時,路由器會將其發送到你所使用的 DeepSeek 或其他開源模型版本,」Baker 解釋。「然後在工作流程的某個節點,可能會由前沿模型介入進行檢查。」

將推論拆解為預填充(prefill)與解碼(decode)操作,使得這種分散式方案成為可能。Baker 解釋,預填充(理解問題與上下文)受限於記憶體容量,而解碼(生成下一個 token)則受限於記憶體頻寬。像 Groq(已被 Nvidia 收購)與 Cerebras 這類公司,能將舊款 H100 或 A100 GPU 與專用解碼晶片配對,將現有硬體的使用壽命延長至 7 年甚至 12 年。

DSA 的社會主義叛亂奪取民主黨基礎設施

紐約市市長 Zohran Mamdani 所屬的美國民主社會主義者(DSA)橫掃了他所背書的所有三場國會初選,將現任民主黨人拉下馬。Sacks 將此發展描述為左翼版的川普民粹崛起。「未來的選擇將是民主黨內的共產主義或社會主義,或是共和黨內的民族主義,」Sacks 說。「這是兩條民粹主義的方向。」

勝選的 DSA 候選人支持廢除參議院、消除警察部隊與監獄、解散移民及海關執法局(ICE)並給予所有人特赦、以隸屬於國會的機構取代總統與最高法院,並實施比例代表制與排序複選制。「這是對我們憲政體系的全面改造,」Sacks 指出。其中一位勝選者、32 歲的 Shioalier 宣稱她想「根除西方文明」,並在 10 月 7 日事件隔天參加了慶祝以色列平民死亡的集會。

DSA 共同主席 Josh Block 對策略直言不諱:「我們將民主黨作為獲取選票的工具,並非因為我們認同其目標。我們建立自己的組織,以民主黨名義參選,在有用時與民主黨黨團合作,並從內部推動我們自己的議程。我們將民主黨建制派視為障礙,而非歸宿。」

Baker 認為 Mamdani 本人是「我這輩子見過最有才華的政治人物之一」,將其與 AOC 相提並論。「他能發表精彩演說,面試表現出色,能觸及所有這些議題。他就像一隻能隨時變色的變色龍。」然而,Baker 強調,DSA 的實際選民基礎是「相對富裕、向下流動的白人自由派」,而非民主黨傳統代表的工人階級、窮人、黑人或拉丁裔美國人。

主持人將這股社會主義浪潮與兩代感到經濟上被邊緣化的美國人連結起來。「他們不相信自己能參與體系,他們覺得體系被操弄了,」Baker 說。「如果有人出現並與他們對話,而他們對社會主義、對德國歷史或紅色恐慌期間發生的事情毫無概念,他們根本不知道什麼是社會主義或共產主義。」

Kalanick 提供了一個哲學框架:「真理與正義是社會的免疫系統。當免疫系統受到抑制,所有社會弊病就會爆發。」他補充說:「我們每個人心中都有共產主義。共產主義作為人類存在於我們的血液中。你這輩子懶惰過嗎?你曾想過不勞而獲嗎?差別在於,你會不會將其變成一種生活方式?」

Cerebras 跌破發行價,公開市場紀律回歸

Cerebras 在其作為上市公司的首份財報中跌破 IPO 價格,引發了 Baker 所謂「價格不敏感拋售」(price insensitive selling),基金經理人會自動退出跌破發行價的部位。「我認識一些管理大型基金的人,如果股票跌破發行價,他們無論如何都會賣出,」Baker 說。「放空者知道,如果股票接近發行價,他們就會放空,因為他們想讓它跌破發行價,然後快速獲利 10% 或 20%。」

Baker 認為市場反應主要是關於供應鏈時程,而非基本面問題。他概述了 Cerebras 於 2025 年 12 月與 OpenAI 簽署的轉型合約,為何要到 2026 年勞動節前後才會顯現營收影響。「從我們下單到台積電製造晶片需要 4 個月,然後我們將晶片轉化為伺服器需要約 2 個月。如果運氣好且能找到電力,我們還需要一個月來為晶片通電並開始生成 token。」

Cerebras 投資人的關鍵問題在於電力部署的執行速度。「除了超大規模資料中心之外,唯一曾引入超過 1 吉瓦電力的公司是 CoreWeave、Crusoe 和 SpaceX AI,」Baker 指出。如果 Cerebras 能在 2027 年每月增加 50 百萬瓦(MW),他們年底的雲端運算營收預估將達 90 億美元,而目前市值不到 400 億美元。

Baker 建議即將上市的公司「定價時應避免在上市前 9 個月內跌破發行價」,而 Palihapitiya 則更大力倡導採用基於拍賣的 IPO 流程,以發現真正的市場出清價格,而非依賴承銷商的判斷。

Anthropic 在預期上市前估值達 3 兆美元

Baker 對 Anthropic 給出了驚人的估值評估,認為該公司「今天價值 3 兆美元」,且「這大致是其作為上市公司可能交易的價格」。他的依據是營收預測顯示 Anthropic 在 2026 年底營收將「遠超 1,000 億美元」,並可能在 2028 年達到 2,000 億至 3,000 億美元。「它可能不會以 10 倍於該數字進行交易,但由於它是以推論為主導,在這種規模下將非常獲利,」Baker 提到推論業務擁有 85% 的毛利率。

該估值將使 Anthropic 超過 OpenAI 的預期公開估值,並成為歷史上最大的科技發行案之一。然而,Baker 淡化了對市場吸收能力的擔憂。「這只是從私人市場轉移到公開市場,」他說。「在全球資本市場的規模下,這些數字看起來很大。你只是從私人市場轉向更大的公開市場而已。」

這場對話凸顯了 AI 時代估值規模的劇烈轉變。Baker 與 Kalanick 回憶起 2014 年 Uber 的 C 輪融資,當時 170 億美元的估值被認為是開創性且具爭議的。「我們在 Fidelity 將 Uber 定價為 140 億美元時,因被認為不知所云而遭到媒體抨擊,」Baker 回憶道。十年後,Anthropic 即將達到 3 兆美元的估值,在成熟投資人眼中已幾乎不值一提。

關於 SpaceX 最近的 IPO,Baker 指出,與典型的科技 IPO 不同,大多數 SpaceX 利害關係人在過去十年中透過收購要約(tender offers)有定期的流動性機會,這減輕了潛在的拋售壓力。「SpaceX 近半數員工在 IPO 時買入,」他說。然而,Palihapitiya 反駁稱,上市前最後一年 8 倍的增值——從 3,500 億美元的私人估值到公開定價——對於那些經歷了多年每年 20% 至 30% 溫和增長的長期持有者來說,仍可能創造顯著的流動性事件。

免責聲明: 本文僅供參考,不構成投資建議或買賣、持有任何證券的推薦。 我們的分析師對企業事件提供詳細報導,但也可能出錯,請務必進行您自己的自行評估與研究。 文中所表達的觀點和意見不一定反映 DruckFin 的立場。 我們未獨立核實本文所使用的所有資訊,其中可能包含錯誤或遺漏。 在做出任何投資決定之前,請諮詢合格的財務顧問。 DruckFin 及其關係企業對因依賴此內容而產生的任何損失不承擔任何責任。 完整條款請見我們的使用條款