DruckFin

Transcript Cerebras Systems: CEO onthult AI-backlog van $25 miljard en legt uit waarom de AI-bubbel een mythe is

4 juni 2026 - Bloomberg Tech 2026, San Francisco

De grootste halfgeleider-beursgang en het oplossen van een 75 jaar oud chipvraagstuk

Tom Giles: Andrew, slechts twee weken geleden had je een groot evenement.

Andrew Feldman: Jazeker. De grootste beursgang van het jaar tot nu toe.

Tom Giles: De grootste halfgeleider-IPO ooit. Als ik mijn wiskunde goed doe, zit je al heel lang in de sector. Ik volg het al zeer lange tijd. We zien niet veel chipgerelateerde startups, laat staan chip-startups die de beursgang halen. Hoe verandert AI dat?

Andrew Feldman: Nou, om te beginnen zijn chips ontzettend ingewikkeld. De meesten van ons zijn er inmiddels te oud voor of overleden. Voor ons zijn ze hier niet duur om te maken. Dit exemplaar hier is wat wij hebben gebouwd. [Andrew Feldman houdt de enorme Cerebras Wafer-Scale Engine-chip omhoog voor het publiek]. Het is de grootste chip die ooit is gemaakt. Dank u. Ze applaudisseren voor grote chips. Ja, dat is een verandering. Het kostte slechts een half miljard dollar en tien jaar van mijn leven om hem werkend te krijgen. En wat we daarvoor terugkregen, was de snelste AI-processor ooit gebouwd. We losten een probleem op dat al 75 jaar openstond in de computerindustrie: hoe bouw je een grote chip? We hebben het opgelost, we hebben een product geleverd en we waren zo trots. We kondigden dit aan in augustus 2019, en het boeide werkelijk niemand. Niemand gaf erom. Het duurde even voordat de wereld het begreep.

Andrew Feldman: Vanaf 2025 werden de AI-modellen slim genoeg zodat mensen AI daadwerkelijk begonnen te gebruiken. En zodra mensen AI gingen gebruiken, werd snelheid cruciaal. De manier waarop wij AI gebruiken, is door middel van inference. En wat wij doen is de snelste inference ter wereld, niet zomaar een beetje, maar meer dan 15x zo snel. En zo zijn we op deze buitengewone plek beland, met de beursgang van twee weken geleden.

Disintegratie van inference en het AWS-partnerschap

Tom Giles: In de aanloop daarnaartoe scoorde je een aantal zeer belangrijke klantoverwinningen, waaronder AWS. Ik vind die relatie fascinerend omdat het echt illustreert hoe jullie omgaan met inference en hoe jullie het proces 'disintegreren', toch? Waarbij AWS Trainium het ene deel afhandelt, en jullie het deel van de inference voor jullie rekening nemen waar je decodeert. Vertel daar eens wat meer over, en sterker nog, vertel hoe dat een blauwdruk is of kan zijn voor werk met andere hyperscalers.

Andrew Feldman: We hebben een behoorlijk goede periode van 90 dagen achter de rug. We sloten een deal ter waarde van meer dan $20 miljard met OpenAI, een bindende 'take-or-pay'-overeenkomst. En 45 dagen later tekenden we een grote deal met AWS. Als computerarchitect is het idee in de meeste gevallen om naar een probleem te kijken en na te denken over wat de juiste machine daarvoor is. Moet je de machine zelf ontwerpen? Kunnen we de machine van iemand anders gebruiken? Wat we in 2015 en 2016 zagen, was de opkomst van een nieuwe workload. En we dachten: deze workload gaat veel rekenkracht vreten. Deze nieuwe AI gaat een buitengewone hoeveelheid rekenkracht verbruiken. We maakten destijds twee tegendraadse weddenschappen. De eerste was: we bouwen specifieke siliciumchips hiervoor. En de tweede: we bouwen niets dat op een GPU lijkt. We beginnen met een schone lei en bouwen iets totaal anders.

Andrew Feldman: Destijds dachten mensen dat we gek waren, maar we bleken niet dood te zijn, toch? Als je nu tien jaar vooruitspoelt, is er zoveel vraag naar inference omdat de AI, vanaf ongeveer 2025, zo slim werd dat het belangrijke taken kan uitvoeren. En we gebruiken het steeds meer. Dus we keken opnieuw naar het werk. Wat is de essentie van het inference-probleem? Het bestaat uit twee delen. Het bestaat uit een deel genaamd het verwerken van de prompt. Laat je niet misleiden door de ingewikkelde namen die we zomaar verzinnen; het is fantastisch. We noemen dat 'pre-fill', zonder enige reden. En het enige wat dat is, is het verwerken van de prompt. En dan is er een tweede deel, het genereren van het antwoord. Dus je verwerkt de prompt en je genereert het antwoord. We noemen het eerste deel 'pre-fill' en het tweede deel 'decode'.

Andrew Feldman: Het blijkt dat deze twee delen zeer verschillende rekenkarakteristieken hebben. Dus dachten we: er zijn machines die beter zijn dan wij in die 'pre-fill'. Dat is een paralleliseerbaar probleem. Het heeft fundamenteel andere kenmerken dan de 'decode', wat een strikt sequentieel probleem is. Met die observatie gingen we naar AWS en zeiden: we kunnen jullie Trainium-onderdeel gebruiken voor de 'pre-fill', en wij gebruiken onze grote chip voor de 'decode'. Het resultaat is deze buitengewone oplossing. Het werd zeer goed ontvangen. We zijn nu bezig met dat proces waarbij we onderdelen van anderen gebruiken voor een deel van het probleem en onze eigen onderdelen voor het andere deel, samen met alle leden van de gemeenschap, andere hyperscalers die niet Nvidia zijn. Dus iedereen behalve zij.

De strijd tussen gespecialiseerde en algemene chips

Tom Giles: Ik wil daar zo op terugkomen. We hadden het over disintegratie, maar is het in de chipindustrie niet onvermijdelijk dat generalisatie en het loslaten van een gedisintegreerde aanpak uiteindelijk wint? Is er niet bijna een onvermijdelijkheid, en wat gebeurt er als dat zo is?

Andrew Feldman: Nee. Ik denk dat de strijd tussen de specialist en de generalist een zeer interessante strijd is. Of het nu op de savanne in Afrika is, of bij kleine bedrijven die concurreren met grote bedrijven: wat bepaalt of de specialist de generalist verslaat of andersom, is de vorm van het 'resource landscape'. Als de ader van resources waar de specialist zich op richt erg groot is, verplettert de specialist de boel en wint hij. Als het landschap bestaat uit veel kleine, verspreide pockets met resources, wint de generalist.

Andrew Feldman: Waar won x86? In een landschap vol verschillende use-cases. Waar won de GPU? Hij won bij discrete graphics, één specifieke workload. Waar won de x86-machine? Overal. Waarom won hij niet ook in de mobiele telefoon? Omdat ARM iets bouwde dat voor 100% gericht was op batterijduur en een zeer laag stroomverbruik. Dit zijn twee voorbeelden waarbij de specialist de generalist volledig de loef afstak. In andere gevallen was het landschap niet groot genoeg. Industrie-collega's, inclusief ikzelf, probeerden een specialist te bouwen. Er was niet genoeg voor ons om te eten. Dus we aten een beetje en verhongerden terwijl de generalisten alle resources verzamelden. Wat we in 2015 zagen, was dat de opkomst van AI zoveel vraag naar rekenkracht zou creëren dat dit het beste bediend kon worden door een specialist. Dat was een van de winnende observaties.

Is AI een bubbel? De backlog van $25 miljard

Tom Giles: De andere grote klant die je noemde, OpenAI, is uniek gestructureerd. We zien dat OpenAI en andere LLM's steeds creatiever moeten worden in de manier waarop ze deze rekenovereenkomsten financieren en betalen, zoals die met jullie, vanwege deze enorme vraag waar je naar verwijst en die overal om ons heen is. Er worden honderden miljarden dollars uitgegeven. Maak je je zorgen over hun vermogen om de inkomsten te genereren en de financiering aan te trekken die ze nodig hebben om aan hun verplichtingen te voldoen? Misschien is een andere manier om die vraag te stellen: denk je dat er een AI-bubbel is? Kunnen de leiders dit volhouden? Is de groei duurzaam en zal die vraag van gebruikers snel genoeg materialiseren?

Andrew Feldman: Weet je, we lopen allebei al een tijdje mee. Dit is niet onze eerste rodeo. Maar een van de weinige voordelen van niet jong meer zijn, is dat het niet je eerste rodeo is. Ik denk het volgende: historisch gezien werden bubbels gekenmerkt door het idee van 'als je het bouwt, komen ze vanzelf'. Ik zag in het publiek mensen die ik herkende uit de late jaren 90, toen we datanetwerkapparatuur aan het bouwen waren. Mensen legden enorme hoeveelheden glasvezel aan in de veronderstelling dat de vraag wel zou komen. Economen grijpen, om redenen die mij onduidelijk zijn, graag terug naar de spoorwegen en veel goede analogieën uit de jaren 1870. Ook daar gold: als je het bouwt, komen ze.

Andrew Feldman: Wat op dit moment ongebruikelijk is aan AI, is dat de bouwers zo ver achterlopen op de vraag dat het absurd is. We hebben een backlog van meer dan $25 miljard aan vraag, en niemand van ons – niet wij, niet AMD, niet Nvidia – kan de vraag van eindgebruikers bijhouden. En dat is in veel opzichten het tegenovergestelde van een bubbel. Wij jagen onze klanten na, en hun klanten bewegen zich op de snelheid van software, terwijl wij ons bewegen op de snelheid van vastgoed en datacenters. We lopen dus achter.

Datacenter-beperkingen en relaties met de gemeenschap

Tom Giles: Laten we daar wat dieper op ingaan. Je deed een podcast met een van mijn collega's van Bloomberg Intelligence, en je zei dat als er op dit moment een beperking voor jullie is, het de toegang tot datacenters is. We zien in het hele land, zeker in een verkiezingsjaar, veel weerstand en bezwaren van mensen die zeggen: 'ik wil dat niet in mijn achtertuin'. Hoe ga je daarmee om?

Andrew Feldman: Dat zijn twee verschillende dingen. Ten eerste worden we allemaal beperkt door datacenters. Als je nu met ons praat, wij hebben een cloud, we worden beperkt door datacenters. AWS wordt beperkt door hun datacenter-uitrolfase. Iedereen wordt beperkt door datacenter-capaciteit. Dat is één. Ten tweede is het een apart probleem: waarom is de wereld boos op ons? Ze zijn boos op ons omdat we dom zijn geweest. Niet wij in het bijzonder, maar onze sector. We hadden naar deze gemeenschappen toe kunnen stappen en goede buren kunnen zijn. We hadden hun processen en lokale overheden kunnen gebruiken om goedkeuring en draagvlak te krijgen. We hadden goede buren kunnen zijn. We hadden onze eigen kosten kunnen dragen, voldoende geld kunnen betalen voor de ontwikkeling van deze datacenters zodat de lokale gemeenschap nooit voor een dubbeltje opdraaide.

Andrew Feldman: We hadden kunnen delen hoe een datacenter van 150 tot 200 megawatt, wat niet gigantisch is, duizenden banen creëert voor meerdere jaren, alleen al in de bouw. We hadden kunnen delen dat we bijvoorbeeld minder water gebruiken in een gigantisch datacenter dan in een klein restaurant. Wist je dat datacenters in de hele VS minder water verbruiken dan de amandelkwekers in Californië? Niet één, twee, drie of vier keer minder, maar tussen de vijf en zeven keer minder water dan amandelen. Wat wij deden was vooruitrennen, en misschien zijn we als sector een beetje laagbegaafd en praten we liever tegen machines dan tegen mensen, maar we renden vooruit zonder na te denken over de gemeenschappen waarin we deze datacenters plaatsten.

Andrew Feldman: Brad Smith van Microsoft kwam met een oproep tot actie voor iedereen. Het was gewoon gezond verstand. Het had vijf doordachte pijlers, en uiteindelijk kwam het erop neer: behandel ze als je buren. Het is absoluut mogelijk om in een gemeenschap te komen en een datacenter te bouwen waar de gemeenschap blij mee is. Je creëert banen. De belastingbasis stijgt aanzienlijk. We hebben zwaar materieel op locatie, we kunnen een honkbalveld voor de school bouwen. Als sector hadden we beter werk kunnen leveren, maar we hebben het verpest. We hebben de gemeenschap niet voor ons gewonnen.

Tom Giles: En wat ga je anders doen?

Andrew Feldman: Ik ben geen datacenterbouwer. Ik ben een afnemer. Dus we zijn betrokken bij de gemeenschappen waar we datacenters hebben. We zijn in gesprek met de lokale kamer van koophandel. We zijn betrokken bij de gemeenschap voor zover we dat kunnen. We hebben ook datacenters gekozen in landelijke gebieden die ver weg liggen. Je hoort soms dat we niet genoeg stroom hebben in de VS. Dat is niet waar. We hebben genoeg stroom. Het is alleen niet in de buurt van alles. Dus het is iets duurder om er te komen. Onze stroom zit in West Texas, in landelijk Utah, in delen van Louisiana waar niemand wil wonen. Onze stroom zit in Niagara. Canada heeft meer stroom dan ze weten wat ze ermee moeten doen. Ze hebben niet alleen stromend water, ze hebben ook opgesloten aardgas op plekken. Je moet dus naar waar de stroom is. En ik denk dat je moet nadenken over hoe je de resultaten, de tokens, eruit krijgt met glasvezelkabels. Die moet je dus aanleggen. Maar ik denk niet dat het een of-of-situatie is. Wij hebben als sector gewoon slecht werk geleverd door niet goed in gemeenschappen te stappen en goede buren te zijn.

Concentratie van klanten en schalen met G42 en OpenAI

Tom Giles: Als je kijkt naar klantwinsten, zagen we bij je vroege, cruciale relatie met G42 dat je je klantenbestand moet diversifiëren. Dat heb je gedaan met Meta en AWS. Waar moeten we kijken voor de volgende grote overwinningen, en hoe lang duurt het voordat we dat zien materialiseren?

Andrew Feldman: Het is heel curieus, en het kwam nooit in me op. Zeker in de privésector zegt niemand: 'je hebt deze enorme klant, dat is slecht'. We worden verantwoordelijk gehouden voor zo'n significant percentage van je omzet dat het al onze productie telt. Dus eind 2023 sloten we een deal van $1 miljard met de AI-kampioen in de VAE, een bedrijf genaamd G42. Zij waren een van de eersten in de wereld. We gingen naar de markt om geld op te halen, en mensen zeiden: 'je hebt maar één grote klant'. En toen wonnen we OpenAI, en zij sloten een deal van meer dan $20 miljard. En mensen zeiden: 'nu heb je nog steeds maar één grote klant'. Ik had er eerst één, en nu heb ik er nog steeds één, alleen is hij 20 keer groter. Het is een van de grootste deals in de geschiedenis van Silicon Valley. En toen wonnen we AWS.

Andrew Feldman: Ik denk dat de waarheid een paar dingen is. Ten eerste gaat deze sector zeer, zeer grote klanten krijgen. Nvidia deed wat, $68 miljard het afgelopen kwartaal, en vier klanten waren verantwoordelijk voor de helft daarvan. Dat is de wereld waarin we spelen. Er zullen dus buitengewone klantconcentraties zijn. En sommige van die klanten bedienen eigenlijk honderden andere klanten. G42 is dus een cloud voor het VAE-ecosysteem. Er zijn universiteiten in Abu Dhabi. Er zijn oliebedrijven in Dubai. Er zijn honderden verschillende gebruikers, maar ze aggregeren naar één plek, en ze zijn één klant. Op dezelfde manier: wanneer we aan OpenAI verkopen, aan wie verkopen we dan eigenlijk? We verkopen aan miljarden individuele gebruikers die de rekenkracht gebruiken.

Snelheid als 'moat' en het Costco-tijdperk van token-economie

Tom Giles: Ik zou graag een idee krijgen, je weet wel, OpenAI heeft net een model geïntroduceerd dat gebaseerd is op Cerebras. Wat zijn enkele vroege lessen daarvan? Wat zijn de conclusies en wat zijn enkele statistieken die je kunt delen met betrekking tot prestaties, tokens per seconde of wat de statistiek ook is?

Andrew Feldman: Wat we weten, en Google liet dit jaren geleden in 2009 al zien, is dat er een interessant onderzoek is waaruit blijkt dat zelfs zeer kleine veranderingen in de tijd die het kost om een antwoord terug te krijgen, invloed hebben op je plezier van de dienst. Milliseconden langzamer produceren onvoorstelbaar significante resultaten in hoe lang je blijft, hoe vaak je het gebruikt, zelfs als je je er niet bewust van bent. En we weten dit. En als je erover nadenkt, zeg je: hoe groot is de markt voor traag zoeken? Waarom? Hoe groot is de markt voor inbelinternet? Hoeveel zou ik je moeten betalen om breedband eruit te slopen? Duizend per maand. Wil je traag internet thuis? Nee. AI zal hetzelfde zijn. Niemand wil trage AI.

Andrew Feldman: Als ik je vraag om acht seconden te wachten tot een website is geladen, word je gek. Zodra een technologie verweven raakt met wat we elke dag doen, wordt de snelheid waarmee je het gebruikt fundamenteel. En als je zoveel sneller bent, voel je dat in alles wat je doet. De man die Open Coder ontwierp, Peter Steinberger, zei dat ons gebruiken was als hem de hamer van Thor geven. En hij zei dat dat is hoe het voelde om een programmeur te zijn met onze snelheid. Dus je gebruikers zullen productiever zijn. Ze krijgen meer gedaan in een uur. En dat voordeel versterkt zichzelf en neemt toe in de loop van de tijd. Dat is wat snelheid altijd heeft gebracht.

Tom Giles: Er is een prijsgevoeligheid die op dit moment in de markt wordt ingebouwd. Waar we eerder hoorden over 'token maxing', horen we nu over meters en limieten. Is dat reëel, is het wijdverspreid en verandert het het tempo van adoptie?

Andrew Feldman: Ik ga mezelf nu verraden. Ik herinner me nog dat Costco, de eerste groothandel, naar Palo Alto kwam. Het opende in Redwood City, en mijn moeder deed boodschappen bij Costco op dezelfde manier als bij Safeway. Ze liep elk gangpad af. En zoals je weet, is dat een vreselijke fout bij een Costco, toch? Want je maakt twee fouten, en ze kosten $19 per stuk, en je eindigt met een emmer mayonaise die groot is, om een of andere reden waarvan je dacht dat het een goed idee was. Wat twee of drie jaar later gebeurde, was dat niemand meer zo bij Costco winkelde. Je ging naar achteren en haalde de goedkope kip, toch? En je keek op je lijstje, en je ging daarheen, en je haalde de grote doos cupcakes omdat je kind jarig is, en je veranderde volledig de manier waarop je winkelde.

Andrew Feldman: Dat is wat er nu gebeurt met tokens. In het begin is het: 'hé, leef je uit'. En Microsoft werd op een dag wakker en zei: 'tokens zijn duur, wacht, we kunnen niet iedereen zoveel Anthropic laten gebruiken als ze willen'. Wat een vreemde observatie. Welke andere bron laten we iedereen zoveel gebruiken als ze willen? Het is vanaf het begin al onlogisch. Natuurlijk moet je middelen toewijzen in je organisatie. Er zijn mensen die je uit de weg moet gaan; ze zijn onvoorstelbaar productief in alles. Er zijn andere mensen die je moet meten. Zo werkt de wereld, toch? Heb je Spark of GPT-4 of het high-end model nodig voor elk probleem? Je hebt geen Ferrari nodig om naar de supermarkt te gaan. Gebruik een goedkoper open-source model. En wat we leren is hoe we bij Costco moeten winkelen. We leren dat we nu deze overvloed hebben. En we leren hoe we die emmer mayonaise van $18 niet moeten kopen. We moeten een stap terug doen en tegen onszelf zeggen: oké, we gebruiken hier de dure modellen en daar gebruiken we open-source modellen. En hier zijn wat mensen die we aan elk van deze buckets toewijzen. En zo gaan we te werk. En ik denk dat dit de les is die je extreem snel ziet gebeuren.

Diepgaande analyse van Cerebras Systems

De wafer-scale architectuur en de fysieke 'moat'

In het landschap van high-performance computing worden de training en inferentie van kunstmatige intelligentie fundamenteel beperkt door de 'memory wall'. Dit verwijst naar de tijd en energie die verloren gaat bij het verplaatsen van data tussen geheugenbanken en de rekenprocessor. De dominante marktarchitectuur lost dit op door losse graphics processing units te koppelen via snelle optische netwerken en high-bandwidth memory. Cerebras Systems omzeilt dit fysieke knelpunt volledig. Door gebruik te maken van een volledige siliciumwafer van 46.225 vierkante millimeter, fungeert de Wafer-Scale Engine als één enkele, aaneengesloten processor. De huidige iteratie, de WSE-3, bevat 4 biljoen transistors en 900.000 voor kunstmatige intelligentie geoptimaliseerde cores. Het echte architecturale wapen is echter de 44 gigabyte aan on-chip static random-access memory. Door modelgewichten direct op de wafer op te slaan, levert Cerebras een geheugenbandbreedte van 21 petabyte per seconde. Vergeleken met de huidige vlaggenschipprocessors beschikt de WSE-3 over aanzienlijk meer rekenkernen en een enorme vermenigvuldiger in geheugenbandbreedte. Dit structurele verschil stelt modellen met extreem veel parameters in staat om native op één enkel systeem te draaien zonder de latentieboete van inter-chipcommunicatie, wat resulteert in een substantieel voordeel in tokens-per-seconde voor kritieke inferentieworkloads.

Bedrijfsmodel en omzetgeneratie

Cerebras hanteert een hybride verdienmodel dat actief transformeert van kapitaalintensieve hardwareverkoop naar een utility-model met hogere marges. Historisch gezien kwam de omzet bijna uitsluitend uit de verkoop van CS-3 supercomputersystemen aan soevereine entiteiten en nationale laboratoria. Vandaag de dag splitst het commerciële model zich op. Het bedrijf verwerft kapitaal vooraf via losse hardware-implementaties, maar genereert terugkerende inkomsten via support- en onderhoudscontracten, die doorgaans 15% tot 20% van de initiële hardwareprijs per jaar bedragen. Bovendien zet Cerebras agressief in op een AI-as-a-service-model via zijn AI Model Studio. Deze cloudgebaseerde API voor inferentie en training stelt bedrijven in staat om toegang te krijgen tot wafer-scale rekenkracht zonder exorbitante kapitaalinvesteringen vooraf. Tegelijkertijd licentieert de onderneming zijn eigen softwarestack als een standalone enterprise-product. Deze strategische verschuiving is bedoeld om de inherente cycliciteit van de verkoop van halfgeleiderhardware te dempen en de brutomarges structureel te verhogen boven de basislijn van 40% tot 45% die wordt behaald op directe hardwareleveringen.

Klantconcentratie en vraagfactoren

De meest kritieke factor in de analyse van Cerebras is de extreme klantconcentratie. Gedurende zijn geschiedenis vóór de beursgang opereerde het bedrijf vrijwel als een exclusieve hardwareleverancier voor de Verenigde Arabische Emiraten. Entiteiten zoals G42 en de Mohamed bin Zayed University of Artificial Intelligence waren historisch verantwoordelijk voor maximaal 86% van de totale omzet; een afhankelijkheid die diepe geopolitieke en regelgevende kwetsbaarheden met zich meebracht. Het commerciële narratief verschoof echter materieel eind 2025, toen OpenAI een meerjarig computercontract ter waarde van ruim $20 miljard tekende, aangevuld met een werkkapitaallening van $1 miljard. Deze transactie veranderde de koers van het bedrijf fundamenteel en leverde een definitieve technische validatie op van 's werelds meest veeleisende bouwer van fundamentele modellen. Daarnaast heeft Amazon Web Services toegezegd om in de tweede helft van 2026 hardware van Cerebras in zijn datacenters in te zetten. Hoewel de gecontracteerde backlog zorgt voor een ongekende omzetvisibiliteit, ruilt het in feite soevereine concentratie in voor bedrijfsconcentratie. Als de hoofdafnemer zijn computerstrategie wijzigt, inferentieworkloads in-house haalt of terugkeert naar traditionele graphics processing units, loopt Cerebras een aanzienlijk omzetrisico.

Supply chain-architectuur en afhankelijkheid van de foundry

Onder de architecturale differentiatie ligt een precaire afhankelijkheid in de supply chain. Cerebras is een pure fabless halfgeleiderontwerper die voor de fabricage van wafers volledig afhankelijk is van Taiwan Semiconductor Manufacturing Company. De WSE-3 wordt geproduceerd op het 5-nanometer-procedé, waarbij de volgende generatie, de WSE-4, gepland staat voor het 3-nanometer-knooppunt. In tegenstelling tot gevestigde technologieconglomeraten die beschikken over enorme inkoopkracht en prioritaire allocatie, vertegenwoordigt Cerebras slechts een fractie van het totale volume bij de foundry. Het bedrijf heeft geen geformaliseerde langetermijnafspraken over levering of capaciteitsallocatie. Elke verstoring in de wafer-allocatie, ongunstige prijsaanpassingen of geopolitieke spanningen in Taiwan zouden het vermogen van het bedrijf om zijn omvangrijke commerciële backlog uit te voeren direct aantasten. Bovendien brengen de natuurkundige aspecten van wafer-scale productie zeer specifieke opbrengstuitdagingen met zich mee. Omdat geen enkele siliciumwafer volledig vrij is van defecten, engineeren de technici van Cerebras hieromheen door redundante rekenkernen over het oppervlak te etsen en software-routing te gebruiken om fysieke imperfecties te omzeilen. Hoewel deze elegante oplossing het opbrengstprobleem oplost, vereist het hypergespecialiseerde productie- en verpakkingstechnieken die de mogelijkheden voor alternatieve inkoop ernstig beperken.

Concurrentielandschap en ecosysteemdynamiek

De markt voor AI-accelerators, die in 2026 naar schatting meer dan $200 miljard waard zal zijn, opereert onder de absolute hegemonie van Nvidia. De marktleider beheert ongeveer 80% van de markt voor datacenter-accelerators; een diepgewortelde positie die wordt versterkt door meer dan tien jaar aan 'developer lock-in' via zijn eigen softwareplatform. Advanced Micro Devices fungeert als het voornaamste commerciële alternatief, met een marktaandeel van 5% tot 7% voor zijn Instinct-acceleratorserie. De echte langetermijnbedreiging voor commerciële chips komt echter van de hyperscalers zelf. Interne custom silicium, zoals Google's Tensor Processing Unit, Amazon's Trainium en eigen chips ontworpen in samenwerking met Broadcom en Marvell, absorberen enorme interne workloads. Binnen het ecosysteem van onafhankelijke startups vond in december 2025 een structurele herschikking plaats toen Nvidia Groq overnam voor $20 miljard. Groq, dat ook zwaar leunde op static random-access memory om inferentiesnelheden te maximaliseren, concurreerde direct met Cerebras voor latentiegevoelige workloads. Nu Groq is opgenomen in het dominante ecosysteem, staat Cerebras bekend als de best gekapitaliseerde onafhankelijke aanbieder van radicale high-bandwidth-architecturen op schaal, al staat het onder aanhoudende druk van gespecialiseerde hardware-uitdagers zoals SambaNova en Tenstorrent.

Nieuwe productdrivers en vooruitzichten

De toekomstige groeimotor leunt zwaar op de succesvolle uitrol van de WSE-4-architectuur. De overstap naar het 3-nanometer-procedé stelt Cerebras in staat om exponentieel meer transistors op één wafer te plaatsen, wat tegelijkertijd het energieverbruik per gegenereerde token verlaagt en de rekenkracht vergroot. Bovendien integreert het bedrijf agressief vloeistofkoelsystemen direct op de chip op rack-niveau, een noodzakelijke fysieke evolutie gezien de immense thermische dichtheid die ontstaat bij het gebruik van een volledige wafer op piekcapaciteit. Naast de uitvoering op siliciumniveau ligt de primaire groeikatalysator in de softwarelaag. De compiler-software van het bedrijf moet bewijzen dat deze naadloos open-source modellen en veelgebruikte frameworks kan verwerken zonder dat ontwikkelaars hun codebases ingrijpend hoeven aan te passen. Het succes van de aanstaande implementatie bij Amazon Web Services zal in dit opzicht als de ultieme lakmoesproef dienen. Als enterprise-ontwikkelaars modellen met enorme aantallen parameters net zo moeiteloos op een gehoste Cerebras-instantie kunnen inzetten als op een conventioneel cluster, breidt de totale adresseerbare markt zich met succes uit van eliterecherchelaboratoria naar mainstream bedrijfsmatige toepassingen.

Trackrecord van het management

De directie, onder leiding van Chief Executive Officer Andrew Feldman en Chief Technology Officer Sean Lie, beschikt over een uitstekende operationele staat van dienst in halfgeleiderarchitectuur. Het team richtte eerder serverinfrastructuurbedrijf SeaMicro op en verkocht dit aan Advanced Micro Devices, waarmee zij diepgaande geloofwaardigheid opbouwden in het ontwerp van high-performance computing. Hun ambtstermijn bij Cerebras wordt gekenmerkt door het uitvoeren van een engineeringvisie die de bredere halfgeleiderindustrie voorheen als fysiek onmogelijk beschouwde. Het succesvol beheren van de thermische expansie, stroomvoorziening en defect-routing van een wafer-scale chip is een objectief monumentale technische prestatie. Bovendien toonde het management eind 2025 uitzonderlijke strategische wendbaarheid. Geconfronteerd met existentiële regelgevende blokkades met betrekking tot hun omzetblootstelling in het Midden-Oosten voorafgaand aan een geplande beursgang, schakelde de leiding agressief om en wist de transformatieve OpenAI-overeenkomst veilig te stellen, waarmee de beursgang van 2026 succesvol werd gedesriskeerd. Echter, opereren als beursgenoteerde entiteit brengt een geheel nieuwe set eisen met zich mee. De overgang van puur onderzoek en ontwikkeling naar grootschalige wereldwijde implementatie, complex supply chain-beheer en financiële uitvoering per kwartaal zal de operationele bandbreedte van het directieteam rigoureus op de proef stellen.

De scorekaart

Cerebras Systems vertegenwoordigt de meest gedurfde architecturale afwijking in het landschap van AI-silicium. Door de 'memory wall' frontaal aan te vallen, levert het wafer-scale paradigma aantoonbare voordelen in doorvoer en latentie voor de meest veeleisende inferentieworkloads in de industrie. Het veiligstellen van een enorme meerjarige backlog bij de toonaangevende bouwer van fundamentele modellen biedt een ongekende validatie van de onderliggende technologie en onderstreept een duidelijk pad naar buitengewone omzetversnelling in de komende cycli.

Daartegenover staan de structurele risico's die aan dit groeiprofiel kleven. De commerciële basis heeft slechts soevereine afhankelijkheid ingeruild voor bedrijfsconcentratie, waardoor de firma zeer kwetsbaar blijft voor de strategische grillen van één enkele cruciale klant. In combinatie met een onafgedekte afhankelijkheid van externe foundry-allocatie, een zich nog ontwikkelend software-ecosysteem en een gevestigde concurrent die gewapend is met effectief oneindig kapitaal en een recent overgenomen inferentie-concurrent, is de marge voor uitvoeringsfouten nihil. Het bedrijf moet de kloof van niche-hardwareleverancier naar geschaalde enterprise-utility foutloos overbruggen om zijn huidige marktpositionering te rechtvaardigen.

Disclaimer: Dit artikel is uitsluitend bedoeld voor informatieve doeleinden en vormt geen beleggingsadvies of een aanbeveling om effecten te kopen, verkopen of aan te houden. Onze analisten bieden gedetailleerde verslaggeving van bedrijfsevents maar kunnen fouten maken, doe altijd je eigen onderzoek. De geuite opvattingen en meningen weerspiegelen niet noodzakelijkerwijs die van DruckFin. We hebben niet alle hierin gebruikte informatie onafhankelijk geverifieerd en deze kan fouten of weglatingen bevatten. Raadpleeg een gekwalificeerde financieel adviseur voordat je een beleggingsbeslissing neemt. DruckFin en haar dochterondernemingen wijzen elke aansprakelijkheid af voor eventuele verliezen die voortvloeien uit het vertrouwen op deze inhoud. Zie voor de volledige voorwaarden onze Gebruiksvoorwaarden.