Cerebras-CEO: "Niemand wil trage AI" — Een OpenAI-deal van $20 miljard, de AWS-architectuurstrategie en waarom dit geen zeepbel is
Bloomberg Tech 2026, San Francisco — 4 juni 2026
Twee weken nadat hij de grootste halfgeleider-beursgang (IPO) uit de geschiedenis had volbracht, zat Cerebras-CEO Andrew Feldman tegenover Tom Giles van Bloomberg tijdens Bloomberg Tech 2026 in San Francisco. Hij zette daar de commerciële visie van het bedrijf uiteen, de architectuur van de samenwerking met hyperscalers en zijn ongezouten mening over de vraag of de investeringen in AI-infrastructuur niet te ver op de troepen vooruitlopen. De antwoorden waren verhelderender dan wat de meeste beleggers tijdens een volledig kwartaal aan toelichtingen krijgen.
De OpenAI- en AWS-deals zijn de blauwdruk, niet de uitzondering
Het meest relevante nieuwe inzicht uit het gesprek betreft de structuur en schaal van het commerciële momentum van Cerebras in de aanloop naar de beursgang. Feldman bevestigde een bindende 'take-or-pay'-overeenkomst met OpenAI van "ruim $20 miljard", getekend ongeveer 45 dagen voor een afzonderlijke overeenkomst met AWS. Samen vormen deze twee transacties een commercieel model dat, zo beschreef Feldman, ontworpen is om uit te breiden naar andere hyperscalers — met één duidelijke uitzondering. "We zijn nu bezig om voor een deel van het probleem gebruik te maken van de onderdelen van anderen, en voor een ander deel van ons eigen onderdeel, samen met alle leden van de gemeenschap, andere hyperscalers die niet Nvidia zijn", zei hij. Toen hem het vuur aan de schenen werd gelegd, bevestigde hij: "Dus iedereen behalve hen."
De AWS-deal is architectonisch interessant en verdient de aandacht van beleggers, omdat het laat zien hoe Cerebras zichzelf in de bestaande cloudinfrastructuur wil nestelen in plaats van er frontaal mee te concurreren. Het kerninzicht is een opsplitsing van de inference-werklast in twee afzonderlijke rekenproblemen. Het eerste — 'prefill' genoemd — verwerkt de inkomende prompt en is in hoge mate paralleliseerbaar, wat betekent dat bestaande, op training geoptimaliseerde chips van hyperscalers dit goed kunnen afhandelen. Het tweede — 'decode' genoemd, het genereren van het daadwerkelijke antwoord — is strikt sequentieel, en dat is waar de chip van Cerebras zijn prestatievoordeel behaalt. "We kunnen jullie training deels gebruiken voor de 'pre', en wij gebruiken onze grote chip voor de 'decode'", legde Feldman uit. "En wat we dan krijgen is deze buitengewone oplossing." Voor beleggers impliceert dit dat Cerebras niet probeert de infrastructuur van hyperscalers volledig te vervangen; het bedrijf nestelt zich in de meest latentiegevoelige en waardevolle stap van de inference-pijplijn.
Snelheid is het product — en de marktanalogie is bewust scherp
Feldman onderbouwde het argument voor snelheid met een Google-paper uit 2009, waaruit blijkt dat zelfs kleine toenames in responslatentie de betrokkenheid, retentie en sessieduur van gebruikers aanzienlijk verminderen — zelfs als gebruikers zich niet bewust zijn van de vertraging. Hij vertaalde dit naar een direct argument voor de marktomvang: "Hoe groot is de markt voor traag internet? Hoe groot is de markt voor inbelinternet?" Hij positioneerde snelheid niet als een prestatiespecificatie, maar als het kenmerkende aspect van een productcategorie. Cerebras claimt dat zijn inference meer dan 15 keer sneller is dan die van concurrenten. Peter Steinberger, de ontwerper van Open Claw, werd geciteerd met de uitspraak dat het gebruik van Cerebras "voelde alsof hij de hamer van Thor kreeg" voor programmeerproductiviteit.
De prestatieclaim van het bedrijf — meer dan 15x sneller dan alternatieven — blijft de centrale pijler van het commerciële voorstel, en de successen bij OpenAI en AWS bieden belangrijke validatie door derden. Of die voorsprong in prestaties houdbaar is naarmate concurrerende architecturen evolueren, is een terechte vraag die in het interview niet direct werd beantwoord.
Orderportefeuille van $25 miljard en het anti-zeepbel-argument
Op de vraag of de uitgaven aan AI-infrastructuur een zeepbel vormen, gaf Feldman het meest directe en empirisch onderbouwde argument: Cerebras heeft momenteel een orderportefeuille van meer dan $25 miljard aan vraag die geen enkele leverancier — inclusief AMD en Nvidia — kan invullen. "De bouwers lopen zo ver achter op de vraag, het is absurd", zei hij. Zijn visie op historische zeepbellen is het overwegen waard. "Historisch gezien werden zeepbellen gekenmerkt door het idee: als je het bouwt, komen ze vanzelf", merkte hij op, verwijzend naar de aanleg van glasvezel eind jaren 90 en de spoorwegaanleg in de jaren 1870. "Wat ongebruikelijk is aan AI op dit moment, is dat de bouwers zo ver achterlopen op de vraag." Hij voegde eraan toe: "Onze klanten en hun klanten bewegen zich op de snelheid van software, en wij bewegen ons op de snelheid van vastgoed en datacenters."
Het cijfer van $25 miljard aan orders is, mits accuraat, een significant datapunt voor de sector. Beleggers moeten er wel rekening mee houden dat Feldman geen uitsplitsing gaf van de samenstelling van die portefeuille of de tijdlijn waarbinnen deze naar omzet moet worden omgezet, wat essentieel is gezien de lange cycli van datacenterimplementaties.
Klantconcentratie: één grote klant, en dan een nog grotere
Feldman ging met zijn kenmerkende directheid in op het risico van klantconcentratie. Vóór de OpenAI-deal had Cerebras een bindende overeenkomst van $1 miljard met G42, de AI-kampioen uit de VAE, getekend eind 2023. Toen het bedrijf kapitaal probeerde op te halen, wezen beleggers op de afhankelijkheid van één klant. Daarna sloot Cerebras OpenAI aan voor meer dan $20 miljard en vervolgens AWS. "Ik had er eerst één en nu heb ik er nog steeds één. Alleen is die 20 keer groter", zei Feldman. Hij plaatste dit in context met het concentratieprofiel van Nvidia: "Nvidia deed ongeveer $68 miljard in het afgelopen kwartaal en vier klanten waren goed voor de helft daarvan. Dat is de wereld waarin wij opereren." Het punt is duidelijk, al neemt het het concentratierisico niet weg — het normaliseert het binnen de sector.
Hij bood ook een nuttig nieuw perspectief op wat grote individuele klanten in de praktijk eigenlijk vertegenwoordigen. G42 is een cloudprovider die universiteiten, oliebedrijven en honderden andere eindgebruikers in het ecosysteem van de VAE bedient. De rekenvraag van OpenAI weerspiegelt uiteindelijk miljarden individuele eindgebruikers. Het aantal klanten in de koppen onderschat de werkelijke breedte van de eindvraag die wordt bediend.
Token-economie volwassener dan verwacht
Over de opkomende kwestie van tokenlimieten, prijsgevoeligheid en de toewijzing van AI-rekenkracht door bedrijven, gebruikte Feldman een Costco-analogie die de kern van het probleem efficiënt raakt. Vroege adoptie van AI door bedrijven leek op het doorlopen van elk gangpad in een groothandel zonder boodschappenlijstje — verspillend en slecht afgesteld. "Microsoft werd op een dag wakker en zei: tokens zijn duur", merkte hij op, waarbij hij de realisatie achteraf als voor de hand liggend omschreef. "Welke andere hulpbron laten we iedereen onbeperkt gebruiken? Het is vanaf het begin al ondoordacht." De markt leert nu differentiëren: krachtige 'frontier'-modellen voor taken die de kosten rechtvaardigen, open-sourcealternatieven voor de rest, waarbij interne toewijzing de individuele productiviteitsniveaus weerspiegelt. Feldman ziet dit als een gezonde en snelle normalisatie, niet als een signaal van vraaguitval.
Datacenter-knelpunten en het falen van de sector in maatschappelijke relaties
Feldman was ongebruikelijk openhartig over het falen van de AI-sector om maatschappelijk draagvlak te creëren voor de uitbreiding van datacenters. De beperking is reëel — het cloudaanbod van Cerebras wordt beperkt door de beschikbaarheid van datacenters, net als bij alle hyperscalers — maar hij wees een groot deel van de politieke weerstand toe aan een vermijdbaar eigen doelpunt. "We hadden goede buren kunnen zijn. We hadden de gemeenschappen in kunnen gaan en hun processen en lokale overheden kunnen gebruiken om goedkeuring en steun te krijgen." Hij noemde het falen van de sector om cijfers over werkgelegenheid, belastingbijdragen en het contra-intuïtieve feit dat Amerikaanse datacenters vijf tot zeven keer minder water verbruiken dan de amandelkwekers in Californië, te communiceren. "We zijn vooruitgerend zonder na te denken over de gemeenschappen waarin we deze datacenters plaatsten", zei hij stellig. "We hebben het verpest."
De reactie van Cerebras is om capaciteit te lokaliseren in gebieden met overvloedige en goedkope stroom: West-Texas, het landelijke Utah, delen van Louisiana, Niagara en Canada in bredere zin. De logica is eenvoudig: zoek naar stroombeschikbaarheid in plaats van nabijheid tot bevolkingscentra, en verplaats tokens vervolgens via glasvezel. Het is een pragmatische oplossing voor een probleem dat de sector zelf heeft gecreëerd en nog niet op grote schaal heeft opgelost.
De vraag 'specialist versus generalist' blijft de juiste
Over de onvermijdelijke vraag of geïntegreerde architecturen voor algemeen gebruik uiteindelijk gespecialiseerde chips zullen verdringen, bood Feldman een analytisch kader in plaats van een promotioneel antwoord. De uitkomst, zo betoogde hij, wordt volledig bepaald door de vorm van het hulpbronnenlandschap. "Als de ader van hulpbronnen waarop de specialist zich richt zeer groot is, verplettert de specialist de rest en wint hij. Als het hulpbronnenlandschap bestaat uit veel kleine, verschillende zakjes met hulpbronnen, wint de generalist." Hij noemde de dominantie van de GPU in discrete graphics als een overwinning voor de specialist, de overwinning van ARM op x86 in mobiele apparaten als een ander voorbeeld, en de uiteindelijke breedte van de x86-machine als een overwinning voor de generalist in gefragmenteerde toepassingen. Zijn visie is dat AI-inference — specifiek het decode-probleem — een grote en structureel afzonderlijke werklast vertegenwoordigt die een gespecialiseerde architectuur rechtvaardigt. Of die ader van hulpbronnen groot genoeg blijft naarmate model-efficiëntie verbetert en hardwareconcurrentie toeneemt, is het centrale langetermijnrisico voor de stelling van Cerebras, en daar ging Feldman niet direct op in.