Cerebras CEO:「低速なAIなど誰も求めていない」— 200億ドルのOpenAI契約、AWSとのアーキテクチャ戦略、そして「バブルではない」と断言する理由
Bloomberg Tech 2026、サンフランシスコ — 2026年6月4日
CerebrasのCEOであるAndrew Feldman氏が「半導体史上最大のIPO」と評した上場から2週間。同氏はサンフランシスコで開催された「Bloomberg Tech 2026」でBloombergのTom Giles氏と対談し、同社の事業戦略、ハイパースケーラーとのパートナーシップ・アーキテクチャ、そしてAIインフラへの投資が過熱しているのかという問いに対する明確な見解を語った。その回答は、四半期ごとの投資家向け説明会よりもはるかに示唆に富むものだった。
OpenAIとAWSとの契約は例外ではなく「青写真」
今回の対談で最も重要な新事実は、IPOに向けたCerebrasの商業的勢いの構造と規模に関するものだ。Feldman氏は、AWSとの合意の約45日前に締結された、OpenAIとの「200億ドル超」に及ぶテイク・オア・ペイ(引き取り義務)契約の存在を認めた。これら2つの取引は、Feldman氏が「他のハイパースケーラーにも拡大する」と説明するビジネスモデルを確立した。ただし、一つだけ明確な例外がある。「我々は現在、他社のパーツと自社のパーツを組み合わせ、問題の解決にあたるプロセスを進めている。Nvidia以外のすべてのハイパースケーラーとだ」と彼は語った。さらに追及されると、「つまり、彼ら(Nvidia)以外の全員だ」と認めた。
AWSとの契約はアーキテクチャの観点から興味深く、投資家は注視すべきだ。これは、Cerebrasが既存のクラウドインフラと正面から競合するのではなく、どのようにしてその内部に組み込まれようとしているかを示しているからだ。核心となる洞察は、推論ワークロードを2つの異なる計算処理に分解することにある。1つ目の「プリフィル(prefill)」は入力プロンプトを処理する段階で、高度な並列処理が可能であり、ハイパースケーラーが持つ既存の学習用シリコンで十分に処理できる。2つ目の「デコード(decode)」は実際の回答を生成する段階で、厳密な逐次処理が求められる。こここそがCerebrasのチップが性能上の優位性を発揮する領域だ。「学習処理の一部は既存のインフラを使い、デコードには我々の巨大チップを使う」とFeldman氏は説明した。「そうすることで、極めて優れたソリューションが生まれる」。投資家にとっての示唆は、Cerebrasがハイパースケーラーのインフラを全面的に置き換えようとしているのではなく、推論パイプラインの中で最もレイテンシー(遅延)に敏感で、価値の高いステップに食い込もうとしているという点だ。
「スピード」こそが製品 — 市場の例えはあえて辛辣に
Feldman氏は、スピードの重要性を2009年のGoogleの論文を引用して論じた。それによれば、わずかな応答遅延であっても、ユーザーは意識せずともエンゲージメント、リテンション、セッション時間が有意に低下するという。同氏はこれを市場規模の議論に置き換え、「低速な検索の市場はどれほど大きいか? ダイヤルアップ接続の市場はどれほど大きいか?」と問いかけた。同氏はスピードを単なる性能指標ではなく、製品カテゴリーを定義する特性として位置づけている。Cerebrasは、自社の推論速度が競合より15倍以上速いと主張する。Open Clawの設計者であるPeter Steinberger氏は、Cerebrasの利用について「コーディングの生産性において、トールのハンマーを手に入れたようなものだ」と評した。
「競合より15倍以上高速」という同社の性能主張は、商業的提案の柱であり続けており、OpenAIおよびAWSとの契約はその有力な第三者による裏付けとなっている。競合するアーキテクチャが進化する中で、その性能優位性が持続可能かどうかは正当な疑問だが、今回のインタビューでは直接的な言及はなかった。
250億ドルのバックログと「反バブル」論
AIインフラへの投資がバブルかどうかという問いに対し、Feldman氏は最も直接的かつ経験的な根拠を示した。Cerebrasは現在、AMDやNvidiaを含め、どのサプライヤーも満たすことができない250億ドル超の需要バックログ(受注残)を抱えている。「構築側の供給能力が需要に追いついていない。あまりに乖離している」と彼は語った。同氏による歴史的なバブルの解釈は傾聴に値する。「歴史的に、バブルとは『作れば客が来る』という考えに基づいていた」と述べ、1990年代後半の光ファイバー網構築や1870年代の鉄道建設を例に挙げた。「現在のAIが異例なのは、構築側が需要に全く追いつけていないという点だ」。さらに「我々の顧客やその先の顧客はソフトウェアの速度で動いているが、我々はデータセンターという不動産の速度で動いている」と付け加えた。
この250億ドルというバックログの数字が正確であれば、セクターにとって重要なデータポイントとなる。ただし投資家は、Feldman氏がその内訳や収益化までのタイムラインを明かさなかった点に留意すべきだ。データセンターの展開には長期サイクルが伴うため、この点は極めて重要である。
顧客集中:大口顧客、そしてさらに巨大な顧客
Feldman氏は、顧客集中リスクについても特有の率直さで答えた。OpenAIとの契約前、CerebrasはUAEを拠点とするAI企業G42と2023年後半に10億ドルの契約を締結していた。資金調達の際、投資家は単一顧客への依存を懸念した。その後、CerebrasはOpenAIと200億ドル超の契約を結び、さらにAWSとも契約した。「以前は1社だったが、今も1社だ。ただ、規模が20倍になっただけだ」とFeldman氏は語った。同氏はこれをNvidiaの顧客構成と比較し、「Nvidiaは前四半期に約680億ドルを売り上げたが、その半分を4社が占めている。それが我々のいる世界だ」と述べた。この指摘はもっともだが、集中リスクが解消されたわけではなく、セクター内での「標準的な状態」になったに過ぎない。
また、大口顧客が実際に何を意味するのかという点についても有益な視点を提供した。G42は大学、石油会社、その他UAEエコシステム内の数百の最終ユーザーにサービスを提供するクラウドプロバイダーである。OpenAIの計算需要も、突き詰めれば数十億の個人エンドユーザーを反映している。見出しに現れる顧客数は、実際にサービスを受けている最終需要の広がりを過小評価している可能性がある。
トークン経済は予想以上の速さで成熟へ
トークン制限や価格感応度、企業によるAI計算リソースの割り当てという新たな課題について、Feldman氏はコストコ(Costco)の例えを用いて効率的に説明した。初期の企業によるAI導入は、リストを持たずに倉庫型店舗の全通路を歩き回るようなもので、無駄が多く調整も不十分だった。「Microsoftはある日、『トークンは高価だ』と気づいた」と彼は述べ、この気づきは振り返れば当然のことだと指摘した。「他のどのリソースで、全員に好きなだけ使わせるようなことをするだろうか? 最初から愚かなことだった」。市場は現在、高コストに見合う高機能なフロンティアモデルと、それ以外の用途のためのオープンソースの代替品を使い分けることを学んでいる。Feldman氏は、これを需要破壊の兆候ではなく、健全かつ急速な正常化と捉えている。
データセンターのボトルネックと業界の地域社会との対話不足
Feldman氏は、データセンター拡大に向けた地域社会の支持を得られなかったAI業界の失敗について、異例の率直さで語った。制約は現実的であり、Cerebrasのクラウドサービスも他のハイパースケーラーと同様に、データセンターの可用性によって制限されている。しかし同氏は、政治的な抵抗の多くは「自業自得」であると指摘した。「我々は良き隣人になれたはずだ。地域社会に踏み込み、彼らのプロセスや地方自治体と連携して承認や理解を得ることができたはずだ」。同氏は、業界が雇用創出数や税収への貢献を十分に伝えられなかったこと、そして米国のデータセンターの消費水量がカリフォルニアのアーモンド農家よりも5〜7倍少ないという直感に反する事実を広められなかったことを挙げた。「我々は先を急ぐあまり、データセンターを設置する地域社会のことを考えなかった」と彼は断言した。「我々は失敗したのだ」。
Cerebras自身の対応策は、テキサス州西部、ユタ州の農村部、ルイジアナ州の一部、ナイアガラ、そしてカナダ全域など、安価な電力が豊富な地域に容量を確保することだ。その論理は単純で、人口密集地への近接性よりも電力の可用性を追い求め、トークンは光ファイバーで運ぶというものだ。これは業界が自ら作り出し、まだ大規模には解決できていない問題に対する現実的な回避策である。
「特化型 vs 汎用型」という問いは依然として重要
統合された汎用アーキテクチャが最終的に特化型シリコンを置き換えるのかという避けられない問いに対し、Feldman氏は宣伝的な回答ではなく、分析的な枠組みを示した。結論はリソース環境の形状によって完全に決まると彼は主張する。「特化型がターゲットとするリソースの脈が非常に大きければ、特化型が圧倒して勝利する。リソース環境が小さなポケットの集合体であれば、汎用型が勝つ」。同氏は、ディスクリートGPUの優位性は特化型の勝利であり、モバイルにおけるARMのx86に対する勝利も同様だと述べた。一方で、断片化された用途ではx86のような汎用機が強みを発揮した。同氏の考えでは、AI推論、特にデコード問題は、特化型アーキテクチャを正当化する巨大かつ構造的に明確なワークロードである。モデルの効率化が進み、ハードウェア競争が激化する中で、そのリソースの脈が十分に大きくあり続けられるかどうか。これこそがCerebrasの戦略に対する最大の長期的リスクだが、Feldman氏はそれについて直接的な言及を避けた。