Nvidia決算説明会:ジェンスン・フアンCEOが語る「エージェンティック・コンピューティング」の未来と50%の現金還元、次世代CPU「Vera Rubin」
GTC Taipei 2026 金融アナリスト向けQ&A(2026年6月)
大規模な株主還元策を発表
ジェンスン・フアンCEOは、セッションの冒頭で重要な財務方針を発表した。Nvidiaは今年、来年、そしてそれ以降も、フリーキャッシュフローの50%以上を株主に還元する計画である。これは、すでに発表済みの800億ドルの自社株買いプログラムと、25倍に引き上げた配当に続くものだ。フアン氏は、今後も自社株買いと配当を拡大していく方針を示し、これを株主に対する強力なコミットメントであると強調した。
核心となるアイデア:エージェンティック・コンピューティング
フアン氏は、過去2年間議論してきた「核心となるアイデア」について時間を割いて説明した。AIのコンピューティング・パターンは「エージェンティック(自律的)」であり、エージェントこそが現代のアプリケーションであるという考えだ。これらのエージェントは推論し、ツールを使い、長期記憶にアクセスできる。記憶は構造化されたデータでも非構造化データでも構わない。エージェントが使用するツールは、PC上のもの、クラウド上のもの、設計ツール、ソフトウェア開発ツール、データベース検索・処理ツール、あるいはチップ設計ツールなど多岐にわたる。このコンピューティング・パターンは、かつてアプリケーションがどこでも動作したように、クラウド、PC、ワークステーション、自動車、さらには人型ロボットに至るまで、あらゆる場所で動作することになる。
このコンピューティング手法は分散型かつ分離型であり、エージェントのコンピューティング・パターンの各要素がデータセンターの異なる場所で実行される。Hopperは事前学習向けに設計されたが、Grace Blackwellは事前学習・事後学習に加え、推論にも対応した。MVLink 72により、トークン生成コストを20%ではなく、20倍の効率で削減することが可能になった。Nvidiaは現在、最も低コストでトークンを生成できるプラットフォームである。目標は低コストなデータセンターを作ることではなく、低コストで製品を生産することにある。NvidiaのGrace Blackwellは、世界で最も低コストなトークン生成を実現している。
Vera Rubinアーキテクチャ
Vera Rubinは、事前学習、事後学習、推論、そしてエージェントの実行を目的として設計された。このコンピューティング・パターンは分離・分散されている。ワークロードの各要素がVera Rubinの異なる部分で実行される。AIにおいて収益を生む最も重要な部分はトークン生成だ。そのため、GPUの数を最大化することが重要となる。企業は、収益を最大化するために「1ギガワットのデータセンターに何基のGPUを搭載できるか」を最優先事項とするようになるだろう。
処理の中核となるのは「思考」であり、これは非常に重い計算を要する。思考には、コンテキストの読み取り、全ドキュメントの精査、推論、計画立案、そして実行(ツールへのコマンド生成)が含まれる。ツールからのフィードバックを受けてシステムが回答の正誤を判断する。このやり取りの間、AIは待機状態となるため、ツール利用は非常に高速でなければならない。そのためNvidiaは、ソフトウェア業界全体と協力してアプリケーションの高速化に取り組んでいる。Adobeは数十年来のアーキテクチャを刷新し、PhotoshopとPremiereを完全に再設計した。NvidiaはCadence、Synopsys、Ansys、Siemensといった企業の高速化も支援している。
CPUは単にレンタルが容易であるとか、安価であるだけでは不十分だ。応答速度が速くなければならず、そのためにはシングルスレッド性能が極めて重要となる。マルチスレッドやマルチコアではなく、1つのCPUが1つのAIのために1つのタスクをこなす際、超高速である必要がある。分離型アーキテクチャであるため、Nvidiaは最適なCPU設計と配置を検討した。Vera Rubinは、メモリシステムにとって世界最高のデータプロセッサである。AIには長期記憶と短期記憶が必要であり、メモリとはすなわちデータである。データセンター全体でデータを移動させるには膨大な帯域幅を要する。
Veraは最大のIO帯域幅を備えている。また、データ処理時にCPU同士が通信を行うため、CPU間帯域幅も最大である。1つの巨大なダイ上にすべてが統合されているため、「チップレット税(チップレット化による遅延やオーバーヘッド)」は存在しない。Nvidiaは4つや6つの小さなダイに分割することもできたが、ダイをまたぐたびにチップレット税が発生する。CPU間帯域幅は3.5倍高く、チップ内部の断面積帯域幅およびIO帯域幅は、15%向上といったレベルではなく、桁違い(X factors)に世界最高水準だ。
カスタムCPUコア設計
GraceはNvidiaがこのアプローチを採用した最初のCPUであり、Veraは第2世代にあたる。VeraのCPUコアは完全にカスタム設計されている。これは、世界最高のクロックあたり命令実行数(IPC)を実現するためだ。VeraのCPUはパイプライン全体を通じて、1クロックで10命令をフェッチ、デコード、実行できる。このようなCPUは他に存在しない。Veraは人間向けではなく、非常にせっかちな「エージェント」のために設計された。エージェント向けに設計されたアクセラレーテッド・コンピューティングであり、システム全体が事前学習や推論だけでなく、エージェントを動かすために構築されている。
Microsoftと進めるPCの再発明
約3年前、フアン氏はサティア・ナデラCEOに対し、人々が常にアシスタントを求めていることから、将来的にAIはデバイス上で動作する必要があると語った。現時点では、ノートPCに話しかけたい場合、部屋に戻るまで待たなければならない。将来的には、WhatsAppでテキストを送るだけでPCがタスクをこなすようになる。PCはAIとなり、一日中寄り添うアシスタントへと進化する。ローカルで実行できれば無料であるため、すべてをクラウドで処理する必要はない。
ナデラ氏とフアン氏、そしてMicrosoftとNvidiaは、全く新しいコンピューターのラインナップを創出することに合意した。このラインナップは、テンソル処理、パラメータ圧縮、そしてエージェントを安全なサンドボックス内で実行し、権限を管理できるOSを備えた世界初のPCである。ワークステーション、デスクトップ、ノートPCのすべてが対象だ。過去3年間、両社は昼夜を問わず取り組んできた。すべての重要なアプリケーションがテストされ、性能がベンチマークされている。
PC業界全体が、誰一人取り残すことなく、コンピューターを再発明するために結集する。これは文字通り40年ぶりのPCの再発明だ。PCの振る舞いは一変する。従来のすべてのタスクをより高いレベルでこなしつつ、AIアシスタントとしての機能を備えることになる。
基盤モデルとエコシステム
Nvidiaは、物理AIモデルの最先端となる基盤モデルを発表した。これらはロボットシステムや自動運転のための物理AIモデルの最前線であり、Nvidiaはこれらをエコシステムに開放した。モデルを手に入れたら、そこにエージェントのワークフローを組み込み、どこでも実行する。それが未来だ。Nvidiaはコンピューティングのあらゆる面を再発明している。
CPU市場の機会
CPU事業で200億ドルという目標について問われたフアン氏は、Vera以前のCPUはすべて人間向けに作られていたと説明した。過去のCPUとこれからのCPUの特性は大きく異なる。Veraは、卓越したIPC、コアあたりの帯域幅、コア間の帯域幅、そして驚異的なエネルギー効率を備えた最初のCPUだ。エージェントの世界におけるCPUは、過去のCPUとは全くの別物である。
NvidiaのGPUを搭載するデータセンターは、おそらくすべてVeraを採用するだろう。Nvidiaは数百万基のGPUを販売している。その半分がヘッドノードのCPU数となる。ヘッドノードの外側にも、ワークロードを制御するためのCPUやストレージサーバー用CPUが存在する。このストレージサーバー用CPUも非常に高性能だ。Nvidia GPUの世界では、これら3つの構成すべてにおいて、CPUもNvidia製になる可能性が高い。これにより、CPUの搭載数は実質的に倍増する。
NvidiaのGPUシェアは100%であるため、CPUシェアはGPUシェアよりも高くなる可能性がある。NvidiaはGPU以外の用途でもCPUを販売するためだ。「MVLink Fusion」でパートナーと連携する際、Nvidiaはスイッチ、NIC、CPUをセットで提供する。Nvidia VeraはGPUの枠を超えて販売される。クラウドにおける最大のワークロードであるデータ処理において、Nvidiaは大量のCPUを販売することになる。また、シングルスレッド性能が重要視されるEDA(電子設計自動化)やシミュレーション分野でも、多くのCPUが採用されるだろう。
過去のCPUと未来のCPUでは設計の中心が異なる。Nvidiaは「エージェント」という、6ヶ月前には存在しなかった巨大な市場を狙っている。エージェントの登場により実用的なAIが可能となり、莫大な需要が生まれている。Veraはそのために構築されたのであり、その時代が到来したのだ。
未来を推論する:CPU対GPUの比率
フアン氏は、未来を予測する能力とは推論であり、当て推量や希望的観測ではないと強調した。企業がどのような電力を持っていようと、収益源はトークンのみである。AI企業はCPUコアを借りたがらない。彼らが売りたいのはトークンだ。ビジネスモデルはトークンにある。企業が求めるのは2つ。大規模モデルでトークンを賢くし、ASP(平均販売単価)を上げること。そして、スループットを高めて可能な限り多くのトークンを生成することだ。
この工場はトークンによってのみ評価される。フアン氏が顧客にアドバイスするのは、まずデータセンター内の「Vera Rubin MVLink 72」を最大化すること。次に、GPUをサポートするために必要な最小限のCPUを配置することだ。企業はVera Rubinの数を最大化したいと考えている。それが収益を最大化するからだ。500億ドルや600億ドルをデータセンターに投じるなら、莫大な利益を上げるべきだ。CPUはトークンを生成しないため、利益を生まない。何もしないCPUに300億ドルを投じる意味があるだろうか。
エージェントはどこで動いているのか。現在はすべてクラウドだ。しかし将来は? あらゆる場所だ。そこにはすべてCPUがある。だからこそNvidiaは優れたCPUをどこにでも提供する。現在、エージェントを動かすにはクラウドしかない。Nvidia社内でもエージェントはクラウドで動いているが、すべて手元に戻そうとしている。ノートPCで実行し、必要に応じてクラウドのAIモデルを呼び出せばよい。CPUは分散されるが、Nvidiaは依然として大量のCPUを販売する。
理由は単純だ。現在10億人のコンピューターユーザーがいるが、明日には数百億の「エージェント」がコンピューターを使うようになる。この新しい知能の集団がコンピューターを必要とするのは自明だ。彼らは思考のために多くのCPU、ノートPC、ワークステーション、そしてVera Rubinを必要とする。CPU市場は大幅に拡大するが、価値の面でGPUに匹敵することはあり得ない。
エンタープライズ・ソフトウェア・スタック
エンタープライズ事業について問われたフアン氏は、Nvidiaのエンタープライズ・スタックは、すべてのエンタープライズ・ソフトウェア企業が「エージェント企業」になるための支援であると説明した。Cadenceの例がそれだ。コンピューティング・パターンは「モデル・ハーネス」「ツールとスキル」「ランタイム」の4つで構成される。これらがエージェントのOSとなる。NvidiaはすべてのSaaS企業と協力している。Nvidia AI Enterprise層を除き、すべてオープンだ。これがエンタープライズ向けのランタイム層であり、NvidiaはGPUあたり年間約1,000ドルから1,500ドルを課金している。
このソフトウェアライセンス事業は確実に成長している。SaaS企業がクラウドで実行する際、このライセンスが適用される。フアン氏は、これが数十億ドル規模の大きなビジネスチャンスになると確信している。
PC戦略と価値提案
NvidiaがPC市場に参入する理由について、フアン氏は同社が長年PC業界にいたことを指摘した。Nvidiaは単なるコモディティデバイスを作るために参入するわけではない。それは同社の性質に反する。世界が変わったから、あるいは世界を変えたいからCPUを作るのだ。かつてグラフィックス業界に参入した際、グラフィックカードのASPは49ドル、ハイエンドでも100ドルだった。現在、Nvidiaは1,500ドル、2,500ドル、5,000ドル、8,000ドルのカードを販売している。グラフィックスの定義を塗り替え、GPUへと進化させたからだ。
PCでも同じことを行う。PCを作るのではなく、PCのあり方を再定義する。今日のPCはタイプライターのようなものだ。キーボードを叩き、クリックするデバイスである。将来、PCは常に稼働するアシスタントになる。スマートなタイプライターから、バックグラウンドで常に動作し、呼び出しに応じ、タスクの完了を通知してくれるエージェントシステムへと変わる時、価値提案は一変する。
今日、1,500ドルのPCは高く感じるかもしれないが、毎日タスクをこなす1万ドルのアシスタントという考え方は非論理的ではない。昔は99ドルの電話が妥当だったが、今や人々はスマートフォンに2,000ドルを支払う。カテゴリーが再発明されれば、それは合理的な支出となる。MicrosoftとNvidiaが行っているのは、PCのカテゴリーの再発明だ。人々が愛するPCの利便性はそのままに、全く新しい「パーソナルAI」へと昇華させる。Nvidiaがこの市場にいるのは、PCをコモディティ化して競争するためではない。Nvidiaは決してそのようなことはしない。
10年前を思い出してほしい。フアン氏が自動車業界に参入した際、車載コントローラーは29ドル程度だった。Nvidiaはその29ドルの市場で競うつもりはなかった。自動車をロボティクスカー、自動運転車へと再発明したかったのだ。まずソフトウェアでプログラム可能にし、シャーシのアーキテクチャを再定義した。今や「Hyperion」は至る所にある。29ドルのHyperionなど存在しない。Nvidiaは自動車の可能性を再発明した。すべてのカテゴリーで、同社は再発明を行っている。それがNvidiaの流儀だ。
光学技術と銅線の戦略
データセンターにおける光学技術について、フアン氏は「可能な限り銅線を使うべきだ」と語った。どうしても必要な場合にのみ光学技術を使うべきだ。銅線は当初、ごく短い距離しか使えなかったが、Nvidiaが発明したSerDesにより、MVLinkにおいては史上最長の伝送距離を実現した。ラックのバックプレーン全体を銅線でつないだ。誰も不可能だと思っていたことだ。結果として、Nvidiaは「セクシーな銅線」を作り上げた。銅線の時代を復活させたのだ。
銅線をセクシーにしたことで、Amphenolと共同開発したマイクロコネクタも同様に価値あるものとなった。信頼性が高く、極めてコスト効率に優れているため、銅線は可能な限り長く使い続けるべきだ。ただし、1メートルを超えるような場合は光学技術が必要になる。Nvidiaはさらに距離を伸ばせるかもしれないと考えているが、10倍にはならないだろう。
Nvidiaが構築するデータセンターは、OpenAIの最初のシステム(Ampere世代)で1万8,000基のGPUだった。Hopper時代には10万基規模、Blackwell時代には20万〜25万基が限界だったが、Vera Rubin時代には少なくとも50万基に達する。50万基のGPUには高度なネットワークが必要だ。それが「Spectrum 6」の役割だ。Spectrum 6は世界初の800ギガビットCPOであり、数十万から100万基規模のAI工場向けに設計されている。銅線では到底対応できない。
Nvidiaは銅線でスケールアップし、シリコンフォトニクスや光学技術でさらにスケールアップし、光学技術でスケールアウト・スケールクロスを行う。結論として、銅線、コネクタ、光学技術のすべてが大量に必要となる。だからこそNvidiaはCoherent、Lumentum、Corningと提携し、投資を行っている。Marvellとの提携も、Nvidiaと共にスケールアップ・スケールアウトできる世界を準備するためだ。Nvidiaのサプライチェーンは非常に強力である。
推論とエージェントの普及
推論について、フアン氏は「RTX Spark」がPCに搭載されることで推論がPCに浸透すると説明した。理由は単純だ。エージェントとは「実用的なAI」を意味する。このAIはPC上のすべてのソフトウェアを書き換えるためにあるのではない。OS、DirectX、Adobe Photoshop、Autodeskといった既存のツールを使う。エージェントはようやく、コンピューター上のツールを使いこなし、人々の仕事を支援できるほど賢くなった。
専門家でさえ、PhotoshopやPremiereの機能のほんの一部しか知らない。エージェントは、これらのツールのマニュアルを読み込むだけで、そのツールの専門家になれる。ユーザーはコマンドを覚える必要はなく、エージェントに頼めばよい。すべてのPCがより便利になり、エージェント化する。そのすべてが推論だ。エージェントが思考するたびに推論が行われる。エージェントが行動するには、まず思考しなければならない。エージェントの時代が到来したとき、推論が本格化する。
データセンターに関しては、現在は学習用に使われているシステムも、Vera Rubinが登場すれば、顧客はGrace Blackwellシステムを推論に転用するだろう。これがNvidiaシステムの利点だ。研究者は毎年、学習性能を桁違いに向上させている。学習専用や推論専用のデータセンターに縛られる必要はない。システムは完全に「代替可能(ファンジブル)」だ。Nvidiaは意図的にそう設計した。
代替可能であれば有用性が高まり、TCO(総所有コスト)が下がる。寿命が延びれば、さらにTCOは下がる。Nvidiaのプラットフォームは世界で最もTCOが低いと確信している。A100はすでに何年償却済みか? 3〜4年だ。現在も1時間あたり3〜4ドルの利益を生んでいる。タダ同然のチップが24時間体制で稼ぎ続けているのだ。これは私がバスボーイ(皿洗い)をしていた頃よりずっと良い。
AIに対する認識と普及
AIが原子力以上に不人気であるという懸念に対し、フアン氏は最も楽観的な見方を示した。アジアではAIは愛されているが、米国では嫌われている。その理由は、企業が自社の立場を有利にし、規制による囲い込みを行うために意図的に言葉を使っているからだ。それは国にとって有害であり、賢明ではない。
米国や欧州がAIを使わず、それを核兵器と比較するのは全く馬鹿げている。誰もがAIを持つべきであり、核兵器を持つべきではない。その比較はナンセンスで誇張が過ぎる。人々を怖がらせるだけだ。業界がAIを使わないよう地域社会を怖がらせれば、国全体に大きな損害を与える。それがフアン氏の最大の懸念だ。
もちろん、AIは安全に構築されなければならない。不適切な利用を防ぐための政策も必要だ。安全性、セキュリティ、機能性は必須である。それを保証するのはテクノロジー業界、製品メーカー、サービス提供者の責任だ。一社だけが安全性を追求しているかのような主張はナンセンスだ。自動車業界で一社だけが安全な車を作り、他社がランダムに人を殺しているようなものだ。素晴らしい、安全でセキュアな製品を作るのは業界全体の責任だ。
安全を懸念しつつ、楽観的であることは可能だ。これらは矛盾しない。世界は安全性と明るい未来の両方を同時に構築しなければならない。業界は真剣に取り組む必要があるが、このテクノロジーが危険だと地域社会を怖がらせ、子供たちが関われないようにしてはならない。フアン氏は自分の子供たちにAIを使うよう伝えている。取り残されてほしくないからだ。自分の子供にどうアドバイスするかが、その技術に対する自分の本心を示す究極のテストだ。
AIを使うなと子供にアドバイスする親はいない。取り残されないようにすべきだ。アナリストが記事を書くように、誰もがAIを持つべきだ。ただし、業界は真剣に、適切に、安全に、セキュアに構築しなければならない。
ギガワットあたりのコスト経済学
ギガワットあたりのコストが500億ドルから900億ドルに上昇することについて、フアン氏は問うた。1ギガワットのデータセンターに、500億ドル相当のコンピューターを置くのと、1兆ドル相当を置くのとではどちらが良いか? 1兆ドルの方が良い。データセンターの電力枠は1ギガワットのままだからだ。1兆ドル相当のコンピューターを動かすなら、そのコンピューターは非常に生産的で、エネルギー効率が桁外れでなければならない。フアン氏は単に「良さ」を投影しているだけだ。代替案は愚かである。
今年、1ギガワットには500億ドル分のコンピューターを搭載できる。来年、もし100億ドル分しか搭載できないとしたら、それは良いニュースか? フアン氏は、Nvidiaが非常に長けている「ワットあたりの性能(Perf per Watt)」という工学的原則を提示しているだけだ。それこそが唯一重要な指標である。
ワットあたりの性能を3倍にすることは可能だ。コストを3倍削減することは不可能だ。メモリやケーブル、発電機、MLCCなど、コストを削減しきれない要素があるからだ。しかし、Nvidiaのワットあたり性能は3倍、10倍と向上する。だからこそ、この指標が極めて重要なのだ。
Nvidiaの徹底した共同設計能力、ラック全体とソフトウェアスタック全体を設計する能力により、エネルギー効率を極限まで高めている。ワットあたりの性能は世界クラスであり、今後もNvidiaの輝かしい能力であり、AI工場の最も重要な特性であり続けるだろう。
事業セグメント開示の根拠
財務セグメントを再編した理由について、フアン氏は「ビジネスの仕組みを説明するため」と答えた。すべてを1つの巨大なデータセンターとしてまとめてしまうと、ビジネスの仕組みが見えなくなる。重要なのは、ビジネスがどのように動いているかだ。
ハイパースケーラー内だけでも、ビジネスは3つの方法で動いている。第一に、Nvidiaがハイパースケーラーに顧客を連れてくる。だからこそ、すべてのクラウドにNvidiaが存在する。Nvidiaが多くの大口顧客を連れてくるため、クラウド各社はNvidiaを維持する。第二に、各社は検索、データ処理、SQLクエリ、音声認識など、内部ワークロードでNvidiaを活用している。第三に、AnthropicやOpenAI、xAIといったAI企業とのビジネスがある。
第二のカテゴリーは、HP、Dell、LenovoなどのOEMであり、産業界や「NeoCloud(AIネイティブクラウド)」に販売している。CoreWeaveやLambdaは、データセンターの立ち上げを含め、多くの面でNvidiaに依存している。彼らは部品単位で購入するのではなく、リファレンスアーキテクチャを求めている。ソフトウェアスタックが複雑すぎて、自社でエンジニアを抱える余裕がないからだ。彼らの強みはスピードと機敏性である。
彼らは土地、電力、建屋を確保する。オーストラリア、欧州、米国など世界中で地域に根ざした展開を行っている。彼らにはNvidiaのコンピューティング・リファレンスアーキテクチャとソフトウェアスタックが必要だ。そしてNvidiaが顧客を連れてくる。さらに資金面でもNvidiaが少額投資を行うことで信頼性を担保し、残りの90%の調達を支援する。
この第二のカテゴリーは、新しいASICを設計するのではなく、サービスのためにコンピューターを運用することが目的だ。このセグメントは現在ビジネスの50%を占め、年率100%で成長している。長期的にはさらに大きくなるだろう。クラウドだけでなく、エッジにも膨大な需要があるからだ。すべての工場に「工場の脳」が必要になる。そのエージェントワークロードはクラウドには置けない。地域性、主権、データ保護の観点から、自社でデータセンターを制御する必要がある企業は多い。
第三のセグメントはロボティクスとエッジだ。物理AIの未来を信じるなら、Nvidiaは多くのシステムに関与することになる。新しいエッジシステムも投入する。これら3つのカテゴリー(クラウドサービスプロバイダー、AIクラウド/エンタープライズ/産業、ロボティクス/エッジ)で開示することで、ビジネスの粒度を高め、各セグメントの将来を予測しやすくした。Nvidiaはシェアを拡大しているが、それは誰かから奪っているからではなく、AIの未来があらゆる方向に成長しているからだ。
生産性向上の証拠
リセッションリスクについて問われたフアン氏は、AIによる生産性向上の証拠を提示した。世界で最も多くの雇用とコストを抱えるのはソフトウェアエンジニアであり、3兆〜4兆ドルの規模がある。2023年には3億件のコードコミットがあった。2025年には5億件に増えた。3兆ドルの人件費が5億件のコミットを生んだ。
2026年の最初の数ヶ月で、年間換算14億件に達した。3倍になったのだ。3兆ドルの生産性が3倍になった。業界は6兆ドルを超える生産性を生み出している。これは狂気じみた生産性向上エンジンだ。ソフトウェアエンジニアが解雇されるという話があるが、3兆ドルのコストで6兆ドルを生み出せるなら、企業はエンジニアを解雇するのではなく、むしろもっと雇うだろう。コードは問題解決であり、GDP成長であり、イノベーションだ。コスト削減すべき場所は他にもあるが、ソフトウェア開発は削減すべきではない。それこそがNvidiaの存在意義であり、機械が生成するコードとトークンの価値だ。
サプライチェーンのサポート
サプライチェーンについて、フアン氏は「Nvidiaはエコシステムとサプライチェーン全体のサポートを受けており、非常に堅調な成長が可能だ」と語った。すでに巨大なベースから前年比100%近く成長した。世界的な供給制約はあるものの、Nvidiaは提供したガイダンスを十分に達成できるだけのサポートをエコシステムから得ている。