Cerebras Systems CEOが語る250億ドルのAI受注残と「AIバブル」否定の理由
2026年6月4日 - Bloomberg Tech 2026、サンフランシスコ
半導体史上最大のIPOと75年越しの課題解決
Tom Giles:Andrew、2週間前に大きなイベントがありましたね。
Andrew Feldman:ええ。今年これまでで最大のIPO(新規株式公開)となりました。
Tom Giles:半導体業界史上最大のIPOですね。私の計算が正しければ、あなたは業界で長年活躍されています。私もこの業界を長く見てきましたが、チップ関連のスタートアップ、ましてやIPOにまで到達する企業は多くありません。AIによって何が変わったのでしょうか?
Andrew Feldman:まず、チップ開発は非常に困難です。そのため、私たちの多くは年齢を重ねるか、あるいは脱落していきました。作るのが難しいわけではありません。これを見てください(Andrew Feldman氏が巨大なCerebras Wafer-Scale Engineチップを聴衆に掲げる)。史上最大のチップです。拍手をありがとうございます。大きなチップに拍手が送られるとは、時代も変わりましたね。完成までに5億ドルと私の人生の10年を費やしました。その結果、史上最速のAIプロセッサが誕生したのです。私たちは、コンピュータ業界で75年間未解決だった「巨大チップをどう作るか」という課題を解決しました。2019年8月に発表しましたが、当時は全く関心を持たれませんでした。世界が追いつくまでに少し時間がかかったのです。
Andrew Feldman:2025年に入り、AIモデルが実用的なレベルに達し、人々がAIを使い始めました。AIの利用が普及すると「速度」が重要になります。私たちが提供するのは推論(inference)であり、世界最速、それも他社を15倍以上引き離す速度です。それが、2週間前のIPOという異例の事態につながったのです。
推論の分解とAWSとのパートナーシップ
Tom Giles:その過程で、AWSを含め、非常に重要な顧客を獲得しましたね。AWSとの関係は興味深いものです。推論処理を分解し、AWSの「Trainium」が一部を担い、デコード(回答生成)の部分を貴社が担当するという手法は、他のハイパースケーラーとの協業の青写真になり得るのでしょうか?
Andrew Feldman:この90日間は非常に充実していました。OpenAIと200億ドル規模のコミットメント契約(テイク・オア・ペイ契約)を締結し、その45日後にはAWSと大型契約を結びました。コンピュータアーキテクトとして、常に適切なマシンとは何かを考えます。自社で設計すべきか、他社のマシンを使えるか。2015年から2016年にかけて、私たちは新しいワークロードの台頭を目の当たりにしました。このAIは膨大な計算リソースを消費すると確信し、2つの逆張り戦略をとりました。一つは専用シリコンを構築すること、もう一つはGPUとは全く異なるものをゼロから設計することです。
Andrew Feldman:当時、周囲からは正気ではないと思われましたが、結果として私たちは生き残りました。2025年以降、AIが高度化し、推論への需要が爆発的に高まっています。推論の本質は「プロンプトの処理」と「回答の生成」の2つに分かれます。私たちは前者を「プリフィル(pre-fill)」、後者を「デコード(decode)」と呼んでいます。
Andrew Feldman:この2つは計算特性が全く異なります。プリフィルは並列化が可能ですが、デコードは厳密な逐次処理です。そこでAWSに対し、プリフィルにはTrainiumを、デコードには私たちの巨大チップを使うという提案をしました。これが非常に高く評価されました。現在、Nvidia以外のすべてのハイパースケーラーと、同様の役割分担による協業を進めています。
専門特化型チップ対汎用チップの戦い
Tom Giles:チップ製造において、汎用化が進み、分解型のアプローチが淘汰されることは避けられないのではないでしょうか?
Andrew Feldman:いいえ。専門特化型と汎用型の戦いは非常に興味深いものです。どちらが勝つかは「リソース環境の形」で決まります。専門家が狙うリソースの塊が大きければ専門特化型が圧勝し、小さなポケット状のリソースが散らばっていれば汎用型が勝ちます。
Andrew Feldman:x86は多様な用途がある場所で勝ちました。GPUはグラフィックスという単一のワークロードで勝ちました。x86が携帯電話で勝てなかったのは、ARMがバッテリー駆動と低消費電力に特化したものを作ったからです。2015年、AIの台頭により、専門特化型チップが最も適した巨大なリソース環境が生まれました。それが私たちの勝因です。
AIはバブルか?250億ドルの受注残
Tom Giles:OpenAIとの契約のように、企業は計算リソースの確保に奔走しています。数百億ドル規模の支出が続いていますが、彼らが債務を履行するための収益を上げられるか懸念はありませんか?AIバブルではないのでしょうか?
Andrew Feldman:この業界は初めてではありません。歴史的にバブルとは「作れば客が来る」という幻想に基づいています。しかし、現在のAIは、作り手側が需要に全く追いついていないという点で異常です。私たち、AMD、Nvidiaを含めても、エンドユーザーの需要を満たせていません。250億ドルを超える受注残がそれを証明しています。これはバブルの反対です。ソフトウェアの進化速度に、データセンターという物理的なインフラの構築速度が追いついていないのです。
データセンターの制約と地域社会との関係
Tom Giles:現在、データセンターへのアクセスが制約になっているとおっしゃっていましたね。地域社会からの反対運動についてはどう対応していますか?
Andrew Feldman:まず、私たちを含め、業界全体がデータセンターの不足に直面しています。次に、地域社会からの反発についてですが、これは業界が「近隣住民」としての配慮を怠った結果です。地元政府と協力し、雇用を創出し、地域経済に貢献する姿勢をもっと示すべきでした。例えば、データセンターは大規模なものでも、アーモンド農家よりもはるかに少ない水しか消費しません。私たちは機械との対話には長けていても、人間との対話には不器用だったのかもしれません。今後は、電力供給が豊富な地方や、 Niagaraのような地域を活用し、光ファイバーで接続する戦略をとるべきです。業界として、地域社会とうまく共存する努力が不足していたと反省しています。
顧客の集中とG42、OpenAIとのスケーリング
Tom Giles:G42との関係が重要視される一方で、顧客の多様化も求められています。次の大きな動きはどこにありますか?
Andrew Feldman:シリコンバレーの歴史において、これほど大規模な契約は稀です。G42やOpenAI、AWSといった顧客は、それぞれが背後に何百ものユーザーを抱えています。OpenAIに販売するということは、実質的にその計算リソースを利用する数十億のユーザーに販売するのと同じです。顧客の集中は、この業界の構造そのものなのです。
「速度」という参入障壁とトークン経済の「Costco化」
Tom Giles:OpenAIがCerebrasベースのモデルを導入しましたが、パフォーマンス面での指標はありますか?
Andrew Feldman:Googleが2009年に示したように、回答までのわずかな時間の差が、ユーザーの満足度に劇的な影響を与えます。AIが日常生活に浸透する中で、速度は不可欠な要素です。開発者は、私たちの速度を「ソーのハンマー(Thor's hammer)」を手に入れたようだと表現しました。生産性が飛躍的に向上するからです。
Tom Giles:市場ではトークン消費に対する価格感応度が高まっています。これは普及のペースに影響しますか?
Andrew Feldman:Costcoの例えが適しています。最初は「何でも好きなだけ買おう」としますが、やがて必要なものを賢く選ぶようになります。Microsoftも同様に、トークン消費の最適化を始めました。全てのタスクに最高級のモデルを使う必要はありません。Ferrariで食料品の買い出しに行く必要はないのです。安価なオープンソースモデルと使い分ける「賢い買い物」を学ぶ段階に来ています。この学習は非常に急速に進んでいます。
Cerebras Systems詳細分析
ウェハー・スケール・アーキテクチャと物理的な参入障壁
ハイパフォーマンス・コンピューティング(HPC)の領域において、AI(人工知能)の推論および学習は、「メモリーの壁」という根本的な制約に直面している。これは、メモリーバンクと演算プロセッサー間でのデータ転送に要する時間とエネルギーのロスを指す。現在の市場で主流のアーキテクチャは、高速光ネットワークと広帯域メモリー(HBM)を介して個別のGPU(画像処理半導体)を接続することでこの問題を解決している。一方、Cerebras Systemsはこの物理的なボトルネックを完全に回避する。同社は46,225平方ミリメートルというシリコンウェハー全体を活用し、「Wafer-Scale Engine(WSE)」を単一の連続したプロセッサーとして機能させる。現行の「WSE-3」は、4兆個のトランジスタと90万個のAI最適化コアを搭載している。しかし、真のアーキテクチャ上の武器は、チップ上に実装された44GBのSRAM(スタティックRAM)である。モデルの重みをウェハー上に直接保持することで、Cerebrasは毎秒21ペタバイトという圧倒的なメモリー帯域幅を実現する。既存のフラッグシップ・プロセッサーと比較して、WSE-3は演算コア数が格段に多く、メモリー帯域幅も飛躍的に大きい。この構造的な違いにより、チップ間通信に伴う遅延ペナルティなしに、極めて大規模なパラメーターを持つモデルを単一システム上でネイティブに実行できる。結果として、重要な推論ワークロードにおいて、秒間トークン処理数(スループット)で大きな優位性を発揮する。
ビジネスモデルと収益化
Cerebrasは、資本集約的なハードウェア販売から、より利益率の高いユーティリティ・モデルへと積極的に移行するハイブリッドな収益構造をとっている。かつては、CS-3スーパーコンピューティング・システムの政府機関や国立研究所への販売が収益のほぼすべてを占めていた。現在、ビジネスモデルは二極化している。同社は個別のハードウェア導入を通じて先行投資を確保しつつ、導入価格の年間15%〜20%相当の保守・サポート契約を通じて継続的な収益を得ている。さらに、同社は「AI Model Studio」を通じた「AI-as-a-Service」モデルへも注力している。このクラウドベースの推論・学習APIにより、企業は巨額の先行資本支出を伴うことなく、ウェハー・スケールの演算能力を利用できる。同時に、独自のソフトウェア・スタックを独立したエンタープライズ製品としてライセンス提供も行っている。この戦略的転換は、半導体ハードウェア販売特有の景気循環を平準化し、直接的なハードウェア導入で達成される40%〜45%のベースラインを超えた持続的な粗利益率の拡大を狙ったものだ。
顧客集中と需要のカタリスト
Cerebrasの分析において最も重要な要素は、極端な顧客集中である。上場以前、同社は事実上、アラブ首長国連邦(UAE)向けの専属ハードウェア供給業者として機能していた。G42やモハメド・ビン・ザイード人工知能大学(MBZUAI)といった組織が売上の最大86%を占めており、この依存関係は地政学的および規制上の深刻なリスクをはらんでいた。しかし、2025年後半、OpenAIが200億ドル超の複数年コンピューティング契約を締結し、さらに10億ドルの運転資金を融資したことで、商業的な物語は劇的に変化した。この取引は、世界で最も要求の厳しい基盤モデル開発企業から技術的な裏付けを得たことを意味し、同社の軌道を根本から変えた。加えて、Amazon Web Services(AWS)も2026年後半までに自社のデータセンターへCerebras製ハードウェアを導入することを決定した。契約済みのバックログは比類のない収益の可視性をもたらすが、実質的には「政府依存」から「企業依存」へと入れ替わったに過ぎない。もしアンカーテナントがコンピューティング戦略を変更したり、推論ワークロードを内製化したり、あるいは従来のGPUへ回帰したりすれば、Cerebrasは深刻な収益悪化に直面することになる。
サプライチェーンとファウンドリーへの依存
アーキテクチャの差別化の裏には、不安定なサプライチェーン依存という課題がある。Cerebrasは完全なファブレス半導体設計企業であり、ウェハー製造を台湾積体電路製造(TSMC)に全面的に依存している。WSE-3は5ナノメートルプロセスで製造されており、次世代のWSE-4は3ナノメートルプロセスが予定されている。膨大な購買力と優先的な割り当てを受ける大手テクノロジー企業とは異なり、Cerebrasのファウンドリーにおける占有率はわずかである。同社はファウンドリーとの間で、長期的な供給や容量確保に関する正式な確約を得ていない。ウェハーの割り当て中断、不利な価格改定、あるいは台湾における地政学的摩擦が発生すれば、積み上がった商業バックログを消化する能力は即座に損なわれる。さらに、ウェハー・スケール製造の物理的特性から、歩留まりには特有の難しさがある。シリコンウェハーに欠陥はつきものであるため、Cerebrasはウェハー表面に冗長な演算コアを配置し、ソフトウェアによるルーティングで物理的な欠陥を回避する設計をとっている。この巧妙な解決策は歩留まり問題を解消する一方、極めて特殊な製造・パッケージング技術を必要とし、代替調達の選択肢を著しく制限している。
競争環境とエコシステム
2026年に2,000億ドルを超えると見込まれるAIアクセラレーター市場は、Nvidiaの絶対的なヘゲモニー(覇権)下にある。同社はデータセンター向けアクセラレーター市場の約80%を支配しており、10年以上にわたる独自のソフトウェア・プラットフォームによる開発者の囲い込みが、その地位を強固にしている。Advanced Micro Devices(AMD)は「Instinct」アクセラレーターシリーズで市場シェア5%〜7%を獲得し、主要な代替サプライヤーとしての役割を果たしている。しかし、汎用シリコンに対する真の長期的脅威は、ハイパースケーラー自身から生じている。GoogleのTPU、AmazonのTrainium、そしてBroadcomやMarvellと共同設計された独自チップなど、各社は大規模な内部ワークロードを自社製シリコンで吸収しつつある。独立系スタートアップの動向としては、2025年12月にNvidiaがGroqを200億ドルで買収したことで構造的な再編が起きた。SRAMを活用して推論速度を最大化していたGroqは、Cerebrasにとって直接の競合相手だった。GroqがNvidiaのエコシステムに吸収された今、Cerebrasは過激な広帯域アーキテクチャを大規模に提供する最も資本力のある独立系企業となったが、SambaNovaやTenstorrentといった専門ハードウェア企業からの継続的な圧力にさらされている。
新製品のドライバーと今後の展望
今後の成長エンジンは、WSE-4アーキテクチャの展開にかかっている。3ナノメートルプロセスへの移行により、Cerebrasは単一ウェハー上により多くのトランジスタを詰め込むことが可能となり、トークン生成あたりの消費電力を低減しつつ、演算能力を拡大できる。さらに同社は、ウェハー全体をフル稼働させる際に発生する膨大な熱密度に対応するため、ラックレベルでのチップ直結型液冷システムの統合を強力に進めている。シリコンの性能向上に加え、成長の主要なカタリストはソフトウェア層にある。同社のコンパイラー・ソフトウェアが、開発者にコードベースの過度な修正を強いることなく、オープンソースモデルや広く普及しているフレームワークをシームレスに取り込めることを証明しなければならない。今後のAWS導入の成功が、この点における決定的な試金石となるだろう。もしエンタープライズ開発者が、従来型のクラスターと同じくらい容易に、ホストされたCerebrasインスタンス上で大規模パラメーターモデルを展開できるようになれば、ターゲット市場はエリート研究機関からメインストリームの企業へと大きく拡大する。
経営陣の実績
CEOのAndrew Feldman氏とCTOのSean Lie氏を中心とする経営陣は、半導体アーキテクチャにおいて際立った運用実績を持つ。彼らは以前、サーバーインフラ企業SeaMicroを創業し、Advanced Micro Devicesに売却した経歴があり、HPC設計において深い信頼を得ている。Cerebrasでの彼らの功績は、半導体業界の多くが「物理的に不可能」と切り捨てたエンジニアリングのビジョンを具現化したことにある。ウェハー・スケールチップの熱膨張、電力供給、欠陥ルーティングを制御し成功させたことは、客観的に見て記念碑的な工学的成果である。さらに、経営陣は2025年後半に極めて高い戦略的柔軟性を見せた。上場を控える中で中東市場への依存が規制上の存続リスクとなっていた際、OpenAIとの変革的な契約を締結することでリスクを排除し、2026年の新規株式公開(IPO)を成功へと導いた。しかし、上場企業としての運営は全く新しい要求を突きつける。純粋な研究開発から世界規模の展開、複雑なサプライチェーン管理、そして四半期ごとの財務執行への移行は、経営陣の運用能力を厳しく試すことになるだろう。
総括
Cerebras Systemsは、AIシリコンの領域において最も大胆なアーキテクチャの逸脱を体現している。メモリーの壁に正面から挑む同社のウェハー・スケール・パラダイムは、業界で最も要求の厳しい推論ワークロードにおいて、スループットと遅延の両面で実証可能な優位性を提供している。大手基盤モデル開発企業との大規模な複数年バックログの確保は、同社の技術に対する比類のない裏付けとなり、今後のサイクルにおいて極めて高い収益加速への明確な道筋を描いている。
一方で、この成長プロファイルに付随する構造的リスクは深刻である。商業基盤は「政府依存」から「企業依存」へと入れ替わったに過ぎず、単一の最重要顧客の戦略的意向に大きく左右される状況にある。外部ファウンドリーへの無防備な依存、発展途上のソフトウェア・エコシステム、そして無限に近い資本と買収した推論技術を持つ競合他社の存在を考慮すれば、実行上の失敗は許されない。同社が現在の市場評価を正当化するためには、ニッチなハードウェア・プロバイダーからスケーラブルなエンタープライズ・ユーティリティへと、完璧に橋渡しを成し遂げる必要がある。