Nvidia-transcript: Jensen Huang onthult toekomst van agentic computing, 50% kapitaalteruggave en Vera Rubin CPU-architectuur

GTC Taipei 2026 Financial Analyst Q&A, juni 2026

Belangrijke aankondiging over kapitaalteruggave

Jensen Huang opende de sessie met een belangrijke financiële aankondiging. Nvidia is van plan om dit jaar, volgend jaar en daarna 50% of meer van de vrije kasstroom terug te geven aan aandeelhouders. Dit volgt op het eerder aangekondigde aandeleninkoopprogramma van $80 miljard en een verhoging van het dividend met een factor 25. Huang benadrukte dat het bedrijf van plan is om aandeleninkopen en dividenden in de loop van de tijd verder te verhogen, wat hij omschreef als een substantiële toezegging aan de aandeelhouders.

Het grote idee: Agentic Computing-patroon

Huang besteedde veel tijd aan het toelichten van wat hij het 'grote idee' noemt waar hij al twee jaar over spreekt. Het computermodel van AI is 'agentic' (handelend), en agents zijn de moderne applicaties. Deze agents kunnen redeneren, tools gebruiken en toegang krijgen tot langetermijngeheugen. Dat geheugen kan gestructureerd of ongestructureerd zijn. Agents kunnen tools gebruiken die op een pc staan, in de cloud, of het nu gaat om ontwerpsoftware, programmeertools, database-retrieval, databaseverwerking of chipontwerptools. Dit computermodel zal overal draaien, net zoals applicaties in het verleden overal draaiden: in de cloud, op pc's, in werkstations, in auto's en zelfs in humanoïde robots.

Deze benadering van computing is gedistribueerd en gedesaggregeerd, wat betekent dat elk onderdeel van het agent-computermodel op verschillende plekken in het datacenter draait. Hopper was gebouwd voor pre-training. Grace Blackwell introduceerde inference naast pre-training en post-training. MVLink 72 maakte het mogelijk om de goedkoopste tokens ter wereld te genereren, niet met 20%, maar met een factor 20. Nvidia is nu de goedkoopste manier om tokens te genereren. Het doel is niet om een goedkoop datacenter te hebben, maar om product te produceren tegen lage kosten. Nvidia's Grace Blackwell genereert tokens tegen de laagste kosten ter wereld.

Vera Rubin-architectuur

Vera Rubin is ontworpen voor pre-training, post-training, inference en het draaien van agents. Dit computermodel is gedesaggregeerd en gedistribueerd. Verschillende delen van die workload draaien op verschillende onderdelen van Vera Rubin. Het zware deel dat geld verdient voor AI is token-generatie. Daarom is het maximaliseren van het aantal GPU's belangrijk, want wat bedrijven verkopen zijn tokens. Bedrijven zullen beginnen met de vraag hoeveel GPU's er in een datacenter van één gigawatt passen, omdat dat de omzet maximaliseert.

Het middenstuk is volledig 'thinking', wat zeer rekenintensief is. 'Thinking' omvat het lezen van de context, het doornemen van alle documenten, het redeneren erover, het opstellen van een plan en het handelen, oftewel het genereren van commando's voor tools. De feedback van de tool komt terug en het systeem evalueert of het antwoord correct is. Dit heen en weer gaan vereist dat tool-gebruik zeer snel is, omdat de AI aan het wachten is. Daarom werkt Nvidia samen met de gehele software-industrie om hun applicaties te versnellen. Adobe heeft zijn applicatie versneld en Adobe Photoshop en Premiere voor het eerst in decennia volledig opnieuw ontworpen. Nvidia versnelt Cadence, Synopsys, Ansys en Siemens.

CPU's moeten niet alleen makkelijk of goedkoop te huren zijn. Ze moeten snel reageren, en daarom is single-threaded performance belangrijk. Niet multi-threaded, niet multi-core, maar één CPU die één taak uitvoert voor één AI moet supersnel zijn. Omdat het gedesaggregeerd is, dacht Nvidia na over hoe de juiste CPU te ontwerpen en waar deze te plaatsen. Vera Rubin is 's werelds beste dataprocessor voor geheugensystemen. Een AI moet beschikken over langetermijngeheugen en kortetermijngeheugen. Geheugen is data. Het verplaatsen van data door het hele datacenter vereist veel bandbreedte.

Vera heeft de meeste IO-bandbreedte. Vera heeft ook de meeste CPU-naar-CPU-bandbreedte, omdat bij dataverwerking de CPU's met elkaar moeten communiceren. Er is geen 'chiplet tax' omdat alles op één gigantische die zit. Nvidia had er vier of zes kleine dies van kunnen maken, maar elke keer dat je de die oversteekt, is er een chiplet tax. De CPU-naar-CPU-bandbreedte is drieënhalf keer hoger. De cross-sectionele bandbreedte in de chip is absoluut de beste ter wereld. De IO-bandbreedte is absoluut de beste ter wereld, niet met 15%, maar met factoren.

Custom CPU-coreontwerp

Grace was de eerste CPU waarvoor Nvidia dit besloot. Vera was de tweede generatie. De CPU-core in Vera is volledig custom omdat Nvidia wilde dat deze CPU de hoogste instructies per klokcyclus (IPC) ter wereld zou hebben. De CPU haalt 10 instructies op, decodeert er 10 en voert er 10 tegelijk uit, helemaal door de pipeline heen. Geen enkele CPU ter wereld doet dat. Vera is niet ontworpen voor mensen. Vera is ontworpen voor agents, die erg ongeduldig zijn. Accelerated computing ontworpen voor agents. Dit hele systeem is niet alleen ontworpen voor pre-training of inference, maar om agents te draaien.

PC-heruitvinding met Microsoft

Ongeveer drie jaar geleden sprak Huang met Satya Nadella en zei dat AI in de toekomst ook op een apparaat moet draaien, omdat mensen hulp willen die altijd bij hen is. Op dit moment, als iemand tegen zijn laptop wil praten, moet hij wachten tot hij terug is in zijn kamer. In de toekomst, als iemand zijn laptop iets wil laten doen, appt hij het gewoon via WhatsApp. De laptop wordt een AI, een assistent die de hele dag beschikbaar is. Mensen willen niet noodzakelijkerwijs alles in de cloud draaien, want als het lokaal kan draaien, is het gratis, net als bij laptops en telefoons.

Huang en Nadella, Microsoft en Nvidia, besloten een geheel nieuwe lijn computers te creëren. Deze hele lijn computers is de eerste ter wereld met tensor-processing, parametercompressie en een besturingssysteem dat een veilige sandbox mogelijk maakt, omdat mensen hun agents in een sandbox willen plaatsen en ze toestemming willen geven. De hele lijn omvat werkstations, desktops en laptops. De afgelopen drie jaar hebben ze dag en nacht gewerkt. Alles is nu compatibel. Elke belangrijke applicatie is getest en de prestaties zijn gebenchmarkt.

De hele pc-industrie, de hele computerindustrie, niemand uitgezonderd, iedereen gaat meedoen om de computer opnieuw uit te vinden. Dit is letterlijk de eerste heruitvinding van de pc in 40 jaar. Het gedrag van een pc gaat veranderen. Hij zal alles wat hij voorheen deed beter doen, en daarnaast zal hij ook een assistent zijn.

Foundational models en ecosysteem

Nvidia kondigde enkele 'foundational models' aan, de meest geavanceerde fysieke AI-modellen ter wereld. Dit zijn de koplopers op het gebied van fysieke AI-modellen voor robotsystemen en autonoom rijden. Nvidia heeft die beschikbaar gesteld aan het ecosysteem. Het idee is dat zodra je dat model hebt, je er een agentic workflow in plaatst en het overal draait. Dat is de toekomst. Nvidia vindt computing in elk opzicht opnieuw uit.

CPU-marktkans

Gevraagd naar het doel van $20 miljard voor de CPU-divisie, legde Huang uit dat vóór Vera elke CPU was gebouwd voor mensen. De kenmerken van CPU's uit het verleden en de kenmerken van CPU's in de toekomst zullen heel anders zijn. Vera is de eerste met zo'n buitengewone IPC, zo'n buitengewone bandbreedte per core, zo'n buitengewoon aantal cores met onderlinge bandbreedte en zo'n buitengewone energie-efficiëntie. De CPU's van de toekomst voor de agent-wereld zijn heel anders dan de CPU's van het verleden.

Elk datacenter met Nvidia GPU's zal waarschijnlijk gewoon Vera gebruiken. Nvidia verkoopt miljoenen GPU's. Deel dat door twee en dat is het aantal CPU's in de head-node. Buiten de head-node zijn CPU's nodig om de workload te orkestreren, en ook in de storage-server. Deze storage-server-CPU is zeer krachtig. In de wereld van Nvidia GPU's zullen de CPU's waarschijnlijk in alle drie de configuraties van Nvidia zijn. Dit verdubbelt effectief het aantal CPU's.

Nvidia's CPU-marktaandeel zal waarschijnlijk hoger zijn dan het GPU-marktaandeel, omdat Nvidia een GPU-marktaandeel van 100% heeft en meer CPU's zal verkopen buiten de Nvidia GPU-omgeving. Wanneer Nvidia met iemand samenwerkt aan MVLink Fusion, verkoopt het switches, NIC's en CPU's. Nvidia Vera zal ook buiten de Nvidia GPU's worden verkocht. Voor dataverwerking, de belangrijkste workload ter wereld in de cloud, gaat Nvidia veel CPU's verkopen. Het bedrijf zal ook veel CPU's verkopen voor EDA en simulatie, omdat single-threaded performance zo belangrijk is.

De CPU's van het verleden en de CPU's van de toekomst hebben verschillende ontwerpcentra. Nvidia richt zich op een markt van nul miljard dollar genaamd 'agents'. Agents is een markt van nul miljard dollar omdat het zes maanden geleden niet bestond. Vandaag de dag hebben agents nuttige AI mogelijk gemaakt en nu drijft het een enorme vraag aan. Vera is daarvoor gebouwd en de tijd is rijp.

Redeneren over de toekomst: CPU-naar-GPU-ratio

Huang benadrukte dat het vermogen om de toekomst te voorspellen draait om redeneren, niet om gissen of hopen. Hij legde uit dat welk vermogen bedrijven ook hebben, ze alleen geld verdienen met tokens. AI-bedrijven kunnen geen CPU-core huren. Ze willen geen CPU-core huren. Ze willen tokens verkopen. Het bedrijfsmodel is tokens. Bedrijven willen twee dingen: de ASP (gemiddelde verkoopprijs) van tokens verhogen, wat betekent ze zo slim mogelijk maken met grote modellen, en de doorvoer zo hoog mogelijk maken om zoveel mogelijk tokens te produceren.

Deze fabriek wordt alleen gewaardeerd op tokens. Het eerste wat Huang klanten zou adviseren, is het aantal Vera Rubin MVLink 72's in het datacenter te maximaliseren. Ten tweede: plaats zo weinig mogelijk CPU's als nodig is om de GPU's te ondersteunen. Bedrijven willen het aantal Vera Rubins maximaliseren omdat ze daarmee zoveel mogelijk geld kunnen verdienen. Als je $50 of $60 miljard uitgeeft aan een datacenter, kun je er maar beter veel geld mee verdienen. CPU's verdienen dat geld niet terug. Ze genereren geen tokens. Waarom zouden bedrijven $30 miljard aan CPU's willen die niets doen?

Waar draaien de agents? Draaien ze vandaag allemaal in de cloud? Ja. Maar waar gaan ze in de toekomst draaien? Overal. Ze hebben allemaal CPU's. Daarom heeft Nvidia overal geweldige CPU's. Vandaag de dag is er geen andere keuze dan de agent in de cloud te draaien. Bij Nvidia heeft het bedrijf agents, en die draaien momenteel allemaal in de cloud, maar Nvidia probeert ze allemaal terug te halen. Ze zouden gewoon op laptops moeten draaien en dan kunnen ze de AI-modellen in de cloud of elders aanroepen. Dus de CPU's zouden gedistribueerd worden. Nvidia gaat nog steeds veel CPU's verkopen.

De reden is heel simpel. Er zijn vandaag 1 miljard computergebruikers. Morgen zijn er tientallen miljarden agents die computers gebruiken. Per definitie heeft deze hele nieuwe populatie intelligentie computers nodig om te werken. Ze gaan veel CPU's, laptops, werkstations en Vera Rubins nodig hebben om te 'denken'. De CPU-markt gaat veel groter worden, maar hij kan qua waarde redelijkerwijs niet in de buurt komen van de GPU.

Enterprise softwarestack

Gevraagd naar de enterprise-business, legde Huang uit dat de enterprise-stack de manier is waarop Nvidia elk enterprise-softwarebedrijf zal helpen een 'agentic' bedrijf te worden. Het bedrijf toonde één voorbeeld met Cadence. Het computermodel heeft vier onderdelen: model harness, tools en skills, en runtime. Deze vier dingen zijn de ingrediënten, de operationele structuur, het besturingssysteem van agents. Nvidia werkt samen met alle SaaS-bedrijven. Alles is open, behalve de Nvidia AI Enterprise-laag. Dat is de runtime-laag voor enterprise. Nvidia rekent ongeveer $1.000 tot $1.500 per GPU per jaar.

Die softwarelicentie groeit uiteraard. Wanneer bedrijven het draaien, wanneer SaaS-bedrijven het in de cloud draaien, is dat de softwarelicentie. Huang gelooft dat dit een behoorlijk grote zakelijke kans is. Het zou om miljarden en miljarden moeten gaan.

PC-strategie en waardepropositie

Huang legde uit waarom Nvidia de pc-markt betreedt. Het bedrijf zit al lang in de pc-industrie. Nvidia is niet uit op het bouwen van nog een commodity-apparaat. Dat zou totaal niet bij hen passen. Het bedrijf bouwt niet zomaar een CPU omwille van de CPU. Nvidia bouwt een CPU omdat de wereld is veranderd of omdat het bedrijf de wereld wil veranderen. Lang geleden, toen Huang in de grafische industrie begon, was de ASP van een grafische kaart $49. Het topsegment was $100. Nvidia heeft nu uiteraard grafische kaarten van $1.500, $2.500, $5.000, $8.000. Het bedrijf heeft opnieuw uitgevonden wat graphics betekenen en doen, en het daarom veranderd van een grafische kaart in een GPU.

Nvidia gaat hetzelfde doen met pc's. Het bedrijf is er niet ingestapt om een pc te bouwen. Nvidia gaat hervormen wat een pc is. Een pc is tegenwoordig als een typemachine. Het is een apparaat waarop mensen typen en klikken. In de toekomst wordt het een assistent die altijd draait. Wanneer die pc verandert van een slimme typemachine in een agentic systeem, een slimme AI-assistent die altijd op de achtergrond draait, altijd beschikbaar is, altijd paraat staat, en vaak laat weten dat iets klaar is, verandert die manier van denken over een assistent de waardepropositie.

Misschien denken mensen vandaag dat dat $1.500 waard zou moeten zijn, maar het idee van een assistent van $10.000 die elke dag wordt gebruikt om dingen te doen, is niet onlogisch. Net zoals het vroeger logisch was om een telefoon van $99 te hebben, terwijl mensen nu $2.000 uitgeven aan smartphones. Het is een logische zaak, maar de categorie moet opnieuw worden uitgevonden. Wat Satya en Huang doen, wat Microsoft en Nvidia doen, is deze categorie opnieuw uitvinden, alles meenemen waar mensen van houden aan pc's, het beter maken, maar het hele concept van een personal computer in zijn geheel opnieuw uitvinden. Het is nu een persoonlijke AI. Daarom zit Nvidia in deze markt, niet om de pc omlaag te halen en tot een commodity te maken. Dat doet Nvidia nooit.

Denk aan 10 jaar geleden. Huang ging de auto-industrie in en de embedded controller van een auto, de computer in de auto, kostte ongeveer $29. Hij zei dat het bedrijf niet probeert te concurreren voor die $29. Wat Nvidia wil doen, is die auto opnieuw uitvinden tot een robotica-auto, tot een autonoom rijdende auto. Het eerste wat het bedrijf moet doen, is hem software-programmeerbaar maken en het chassis, de architectuur ervan, herdefiniëren. Nu is Hyperion overal. Er bestaat niet zoiets als een Hyperion van $29. Nvidia heeft opnieuw uitgevonden wat een auto kan zijn. In elk van deze categorieën is het bedrijf de boel gewoon opnieuw aan het uitvinden. Dat is de Nvidia-manier.

Optics en Copper-strategie

Gevraagd naar optics in het datacenter, legde Huang uit dat mensen koper moeten gebruiken zolang ze kunnen, zoveel ze kunnen. Ze moeten optics gebruiken wanneer dat moet. Koper begon aanvankelijk met zeer korte afstanden, maar dankzij de SerDes die Nvidia heeft uitgevonden, kan het bedrijf nu – in het geval van MVLink – de langst werkende SerDes in de geschiedenis aanbieden. Nvidia liet het volledige backplane van een rack draaien. Niemand dacht dat dat mogelijk was. Als resultaat nam Nvidia koper en veranderde het in 'sexy koper'. Het bedrijf bracht de sexappeal terug naar koper.

Vanwege het koper, omdat Nvidia koper sexy maakte, maakte het bedrijf ook de connectoren – deze micro-connectoren waar ze met Amphenol aan werkten – sexy. Het bedrijf moet koper behouden en zo lang mogelijk gebruiken omdat het betrouwbaar en extreem kosteneffectief is. Nvidia moet echter optics gebruiken waar dat moet. Eén meter of zo is ongeveer de limiet. Het bedrijf denkt dat het misschien iets verder kan, maar niet 10 keer verder.

De datacenters die Nvidia bouwt, gaan van – in het geval van het eerste OpenAI-systeem – 18.000 GPU's. Dat was Ampere. De eerste OpenAI-supercomputer was 18.000. In het Hopper-tijdperk was dat ongeveer 100.000. In het Blackwell-tijdperk zit het aan de limiet van ongeveer 250.000 of 200.000. Maar nu, in het Vera Rubin-tijdperk, is het minstens een half miljoen. Een half miljoen GPU's heeft behoorlijk geavanceerde netwerken nodig. Dat is waar Spectrum 6 voor is ontworpen. Spectrum 6 is 's werelds eerste 800 gigabit CPO en is ontworpen om op te schalen voor AI-fabrieken die honderdduizenden, een miljoen gigantische systemen groot zijn. Koper heeft geen schijn van kans om dat te doen.

Nvidia schaalt op met koper. Het bedrijf schaalt misschien verder op met silicon photonics, met optics. Dan schaalt Nvidia uit met optics en schaalt over met optics. De bottom line is dat het bedrijf veel koper, veel connectoren en veel optics nodig zal hebben, en daarom is Nvidia partnerschappen aangegaan met en heeft het geïnvesteerd in Coherent, Lumentum en Corning. Het partnerschap met Marvell gaat over het voorbereiden van de wereld om te kunnen opschalen met Nvidia, uitschalen met Nvidia. Nvidia's supply chain is behoorlijk cool.

Inference en adoptie van agents

Gevraagd naar inference, legde Huang uit dat inference naar pc's komt wanneer RTX Spark de pc's bereikt. De reden daarvoor is simpel. Wat is een agent? Agent staat gelijk aan nuttige AI. Deze nuttige AI is niet ontworpen om alle software op de pc te herschrijven. De agent gaat het besturingssysteem, DirectX, Adobe Photoshop, Autodesk gebruiken. De agent is eindelijk slim genoeg, dat computermodel is eindelijk slim genoeg om de tools op computers te gebruiken om mensen te helpen hun werk te doen.

De meeste mensen, zelfs de experts, kennen slechts een fractie van de werkelijke functies van Adobe Photoshop, Adobe Premiere, Lightroom. Nu, met agents, zal de agent de skill-bestanden, de handleidingen, de bedieningshandleidingen van al deze tools leren door ze simpelweg te lezen. Deze agents worden nu experts in elke tool. Het enige wat mensen hoeven te doen, is de agent vragen hoe ze iets moeten doen. Ze hoeven de werkelijke commando's niet te kennen. De agent zal helpen het te doen. Plotseling zullen alle pc's nuttiger zijn. Pc's worden 'agentic'. Dat is allemaal inferencing. Elke keer dat de agent 'denkt', is hij aan het inferencen. Inference staat gelijk aan denken. Om iets te doen, moet de agent eerst denken. Om iets te doen, moet hij een plan bedenken. Hij moet inferencen. Wanneer agents hun intrede doen, is dat het moment waarop inference een vlucht neemt, want toen kwamen agents en arriveerde nuttige AI.

Wat het datacenter betreft, zou Huang gokken – hoewel hij het niet precies weet omdat Nvidia-systemen vandaag de dag voor training worden gebruikt – dat klanten later, wanneer het bedrijf met Vera Rubin komt, alle Grace Blackwell-systemen nemen en ze gebruiken voor inference. Dat is een van de schoonheden van Nvidia's systeem. Onderzoekers vergroten hun prestaties voor training elk jaar met factoren, in plaats van vast te zitten aan een datacenter dat alleen voor inference of alleen voor training is gebouwd. Het systeem is volledig 'fungible' (uitwisselbaar). Nvidia heeft het om goede redenen zo gebouwd.

Wanneer iets uitwisselbaar is, stijgt het nut ervan. Wanneer het nut stijgt, daalt de TCO (Total Cost of Ownership). Wanneer het nut stijgt, wordt de levensduur verlengd. Wanneer de levensduur wordt verlengd, daalt de TCO. Huang is ervan overtuigd dat Nvidia's platforms de laagste TCO's ter wereld hebben. Hij kan het bewijzen. De A100 is al hoeveel jaar afgeschreven? Drie of vier. Ze slaan munten met $3 tot $4 per uur. Hier is een chip die gratis is en $3 per uur verdient, 24 uur per dag. Dat is beter dan toen Huang busboy was.

AI-perceptie en -adoptie aanpakken

Gevraagd naar het feit dat AI impopulairder is dan kernenergie en hoe het Amerikaanse publiek kan worden gewonnen om AI en de uitbouw van infrastructuur te steunen, zei Huang dat dit eigenlijk de meest optimistische vraag was. In Azië is AI geliefd. In de Verenigde Staten wordt AI gehaat. De reden daarvoor is dat veel mensen woorden gebruiken die bedoeld zijn om hun bedrijf te positioneren, bedoeld om 'regulatory capture' te veroorzaken. Ze moeten daar slim in zijn, want het is schadelijk voor het land.

Als de Verenigde Staten, Zuid-Amerika of Europa geen AI gebruiken en het vergelijken met kernbommen – wat volkomen belachelijk is – dan moet iedereen AI hebben, en niemand een kernbom. Die vergelijking is belachelijk. Het is onzinnig. Het is hyperbolisch zonder goede reden. Het maakt mensen bang. Als de industrie uiteindelijk gemeenschappen bang maakt om AI niet te gebruiken, heeft het de gemeenschap en het land een enorme slechte dienst bewezen. Dat is Huangs grootste zorg.

Natuurlijk moet AI veilig worden gebouwd. Natuurlijk moet er beleid zijn in de eindmarkten om te voorkomen dat het onjuist wordt gebruikt. Natuurlijk moeten veiligheid, beveiliging, functionaliteit, al deze dingen kloppen. Het is de verantwoordelijkheid van de technologie-industrie, de productmakers, de servicemakers om ervoor te zorgen dat dat waar is. Het idee dat de ene partij de enige partij is die aan veiligheid bouwt, is onzin. Het is alsof slechts één autofabrikant veilige auto's bouwt en alle andere auto's willekeurig mensen vermoorden. Het is de taak van de hele industrie. Het is de verantwoordelijkheid van de hele industrie om geweldige producten, veilige producten, beveiligde producten te maken.

Het is mogelijk om veilig te zijn en je zorgen te maken, en tegelijkertijd optimistisch te zijn. Dit zijn geen tegenstrijdige ideeën. De wereld moet tegelijkertijd bouwen aan veiligheid, beveiliging en een optimistische toekomst. Beide ideeën zijn mogelijk. Het kost veel werk. De industrie moet er heel serieus mee omgaan. Maar één ding dat niet moet worden gedaan, is de gemeenschap bang maken door te denken dat deze technologie gevaarlijk is en dat hun kinderen er daarom niet mee bezig moeten zijn. Huang vertelt beide kinderen dat ze AI moeten gebruiken. Hij wil niet dat ze achterblijven. Zijn advies aan zijn kinderen is de ultieme test van hoe hij over de technologie denkt.

Niemand gaat zijn kinderen adviseren om geen AI te gebruiken. Laat ze niet achterblijven. Terwijl analisten dingen schrijven die mensen lezen, zou iedereen AI moeten hebben. Maar de industrie moet het serieus nemen. Bouw het goed. Bouw het veilig. Bouw het beveiligd.

Economie van kosten per gigawatt

Gevraagd naar de kosten per gigawatt die stijgen van $50 miljard naar $90 miljard, vroeg Huang wat beter is voor een datacenter van één gigawatt: $50 miljard aan computers bezitten of $1 biljoen aan computers? Eén biljoen is beter. De reden daarvoor is dat het één gigawatt blijft. Om $1 biljoen aan computers te ondersteunen, moet dat $1 biljoen aan computers zeer productief zijn en moet de energie-efficiëntie ervan buitenproportioneel hoog zijn. Huang projecteerde simpelweg 'goodness' (goede uitkomsten). Het alternatief is dom.

Dit jaar kan er voor $50 miljard aan computers in één gigawatt worden geplaatst. Als er volgend jaar slechts $10 miljard in kan, moet je jezelf afvragen of dat goed nieuws is als iemand je vertelt dat hun dollars per gigawatt, hun compute per gigawatt, laag is. Huang projecteert simpelweg goede technische principes. Dat is waar Nvidia ongelooflijk goed in is. Het bedrijf is ongelooflijk goed in 'perf per watt'. Perf per watt is het enige dat telt.

Het is mogelijk om drie keer de perf per watt te hebben. Zeer mogelijk. Het is niet mogelijk om de kosten met drie keer te verlagen. De reden daarvoor is heel simpel. Netto van brutomarges zijn er nog steeds geheugens, kabels, stroomgeneratoren en MLCC's. Je kunt niet alles weg-cost-reducen. Wat wel kan worden verlaagd is een bepaald percentage, maar het is niet ongebruikelijk dat Nvidia's perf per watt drie keer, 10 keer zo hoog is. Daarom is perf per watt absoluut van vitaal belang.

Nvidia's extreme co-design-capaciteit, het feit dat het bedrijf over het hele rack en de hele softwarestack heen ontwerpt, stelt Nvidia in staat om er letterlijk alles uit te persen, om het slim te architecteren zodat de energie-efficiëntie ongelooflijk is. Perf per watt is van wereldklasse en Huang blijft geloven dat dit Nvidia's stralende vermogen zal zijn en het belangrijkste kenmerk van een AI-fabriek in de toekomst.

Rationale voor openbaarmaking van bedrijfssegmenten

Gevraagd naar de motivatie voor het hersegmenteren van de financiële cijfers, legde Huang uit dat het doel van openbaarmaking is om uit te leggen hoe het bedrijf werkt. Wanneer alles op één grote hoop in het datacenter wordt gegooid, laat dat helemaal niet zien hoe het bedrijf werkt. Het is gewoon één groot getal. De vraag is hoe het bedrijf werkt.

Het bedrijf werkt op drie manieren binnen de hyperscalers alleen al. Eén: Nvidia brengt klanten naar de hyperscalers. Daarom zit het bedrijf in elke cloud. Ze distribueren op veel manieren Nvidia-compute omdat Nvidia hen klanten brengt, grote klanten. Ze houden Nvidia in hun cloud omdat het bedrijf hen klanten brengt. Het feit dat het ecosysteem zo rijk is, stelt Nvidia in staat hen veel klanten te brengen.

Nummer twee: Nvidia draait hun interne workloads: search, dataverwerking, SQL-queries, een hoop dingen, spraak, transcriptie. Nvidia's transcriptiemodellen zijn de beste ter wereld. Het bedrijf draait een hoop dingen: computergraphics, remote pc's. Dat is allemaal Nvidia. Dus er is al die interne workload, niet-AI-dingen, klassieke accelerated computing-dingen.

En dan is er een derde die AI is. Het is Anthropic. Het bedrijf is erg blij dat het met hen groeit. Het is OpenAI. Het is XAI. De business met CSP's wordt in die textuur beschreven. Dat alleen al is genoeg voor mensen om over na te denken.

Dan is er een tweede categorie, namelijk OEM's zoals HP, Dell en Lenovo, en zij verkopen aan industriële partijen en OEM's, of ze verkopen aan wat 'NCP's' worden genoemd, de NeoClouds of AI-native clouds of AI-clouds. CoreWeave vertrouwt op Nvidia. Lambda vertrouwt op Nvidia voor veel dingen, inclusief het helpen opzetten van hun hele datacenter. Ze willen niet in stukjes kopen. Ze willen de referentiearchitectuur kopen. De reden daarvoor is dat die hele softwarestack zo ingewikkeld is en ze gewoon niet genoeg engineers hebben, noch willen ze zoveel engineers hebben. Ze willen snel bewegen. Wendbaarheid is hun vaardigheid, hun geheime saus.

Ze kunnen land, stroom en een casco veiligstellen. Ze vinden het en ze zitten over de hele wereld. Ze zitten in Australië, ze zitten in Europa, ze zitten overal in de Verenigde Staten en ze zijn super slim in het vinden van land, stroom en casco omdat ze regionaal zijn. Land is regionaal. Land zit niet in de cloud. Nu kunnen ze land, stroom en casco vinden. Ze hebben Nvidia's computing-referentiearchitectuur nodig. Ze hebben de softwarestack nodig. Ze hebben Nvidia nodig om hen naar klanten te brengen. En daarna hebben ze financiering nodig. Nvidia doet een kleine investering in hen om voor hen hun reputatie veilig te stellen, om hun investering te verankeren. Dan kunnen ze zelf 90% ophalen. Dan brengt Nvidia klanten naar hen toe en ze binden dat hele ding samen.

Die hele tweede categorie, zij zijn niet echt ontwerpers van architecturen. Ze zijn geen nieuwe ASIC's aan het architecteren. Dat willen ze niet doen. Hun doel is niet om een computer te ontwerpen en te bouwen. Hun doel is om een computer te bedienen voor een dienst. Ze willen geen computer ontwerpen. Ze willen een computer bedienen. Dat hele tweede segment, zo blijkt, is 50% van de business. Het groeit 100% per jaar. Op de lange termijn zal het waarschijnlijk nog groter zijn. De reden daarvoor is niet dat de CSP's gaan afnemen. Het is omdat er te veel dingen aan de 'edge' zijn.

Elke fabriek gaat een 'fabrieksbrein' hebben. Die agentic workload gaat in elke fabriek draaien. Die computer kan niet in de cloud zitten. Er zijn veel bedrijven die dat willen vanwege industriële redenen of telco-redenen, of gewoon omdat het regionaal of soeverein moet zijn, of vanwege gegevensbescherming, ze moeten de datacenters bouwen en controleren. Die markt gaat behoorlijk groot worden.

Het derde segment is robotica en edge. Geloof je in de toekomst van robotica? Geloof je in fysieke AI? Zo ja, dan zal Nvidia niet in allemaal zitten, maar het bedrijf zal in vele zitten. Nvidia wil graag een hele nieuwe lijn edge-systemen introduceren. Dat zijn de drie categorieën: cloud service providers, AI-clouds en enterprise en industrieel, en dan robotica-edge.

Door het op die manier openbaar te maken, kan het echt helpen met de granulariteit van de business en kunnen mensen zelf beslissen hoe ze elk van deze segmenten willen projecteren. Dit leidde Huang tot de conclusie dat Nvidia marktaandeel wint en dat is vreemd, niet omdat het bedrijf het van iemand afpakt, maar omdat de toekomst van AI op al deze verschillende manieren groeit. Als je nadenkt over de wereld van AI, begon Nvidia met wat mensen een zeer grote positie vinden. Het bedrijf groeit nu met Anthropic en al de AI-modellen, OpenAI enzovoort. Maar er is een heel ander segment van AI waar mensen niet over praten en het is onderbediend. Het was pas onlangs dat Michael Dell hun kwartaalcijfers volledig overtrof en geen van hen waren CSP's. Het bedrijf heeft het volledig waargemaakt.

Bewijs van productiviteitsimpact

Gevraagd naar het recessierisico, gaf Huang bewijs van de productiviteitsimpact van AI. Het grootste aantal werknemers in dollars ter wereld zijn software-engineers: $3 biljoen tot $4 biljoen. Niet inclusief alle marketingmensen die coderen of supply chain-mensen die coderen, alleen de programmeurs. Deze drie of vier biljoen dollar per jaar aan arbeid droeg in 2023 300 miljoen 'submits' bij. Je submit de software wanneer je klaar bent met programmeren, getest hebt en het naar productie committe. Dan 400 miljoen submits, dan 500 miljoen submits in 2025. Vorig jaar was 500 miljoen.

De manier om daarover na te denken is dat $3 biljoen aan opex 500 miljoen submits aan software bijdroeg. In de eerste paar maanden van 2026, in de eerste paar maanden, ging het van 500 miljoen per jaar naar 1,4 miljard per jaar. Het verdrievoudigde in omvang. Dus wat is er net gebeurd? De productiviteit van $3 biljoen is net verdrievoudigd. De industrie produceerde meer dan $6 biljoen aan productiviteit. Het is een waanzinnige productiviteitsgenerator.

Ondertussen blijven mensen praten over hoe software-engineers ontslagen gaan worden. Als er een software-engineer is die agents kan gebruiken bij $3 biljoen aan opex en meer dan $6 biljoen kan genereren, gaan bedrijven die persoon niet ontslaan. Ze gaan er meer aannemen. Het slaat nergens op om die persoon te ontslaan. Bedrijven gaan er meer aannemen zodat ze nog meer kunnen genereren. De wereld heeft veel code die gegenereerd moet worden. Code staat gelijk aan probleemoplossing. Code staat gelijk aan BBP-groei. Code staat gelijk aan innovatie.

Er is nu absoluut bewijs dat er veel dingen zijn waarop je geld kunt besparen, maar het enige waar je niet op wilt bezuinigen is software-coding. Dat is wat Nvidia voor de kost doet. Dat is wat de machine doet. Het genereert code, genereert tokens.

Ondersteuning van de supply chain

Huang ging direct in op vragen over de supply chain. Nvidia heeft de steun van het hele ecosysteem en de supply chain om te voorzien in een zeer robuuste groei. Het bedrijf groeide bijna 100% jaar-op-jaar vanaf een basis die al erg groot was. Nvidia heeft het vermogen met de steun van de supply chain om zeer robuust te groeien. Het bedrijf heeft echter niet genoeg aanbod en de reden daarvoor is dat de wereldwijde supply chain aanbodbeperkt is. Maar Nvidia heeft de steun van het ecosysteem om een zeer robuuste groei te realiseren, ruim voldoende ter ondersteuning van welke guidance dan ook die is verstrekt.

Verder lezen

Samsara onder de loep: Het AI-besturingssysteem voor de fysieke economie

2026-06-27

Coherent Deep Dive: De Indiumfosfide-gracht en de bottleneck in AI-optica

2026-06-27

Aravolta: GPU-afschrijving varieert 30-45% op basis van werkelijke workload, waardoor sectorgemiddelden voor kredietverstrekkers achterhaald zijn

2026-06-27

Trump-regering valt Iran aan uren na staakt-het-vuren, wat zorgt voor nieuwe volatiliteit op grondstoffenmarkten

2026-06-27

OpenAI's Noam Brown: Benchmark-overzichten misleiden beleggers over modelcapaciteiten

2026-06-27

All In Podcast: Chinese open-source AI-modellen dagen Amerikaanse frontier labs uit terwijl geheugenknelpunt inflatie in de sector aanjaagt

2026-06-27

Disclaimer: Dit artikel is uitsluitend bedoeld voor informatieve doeleinden en vormt geen beleggingsadvies of een aanbeveling om effecten te kopen, verkopen of aan te houden. Onze analisten bieden gedetailleerde verslaggeving van bedrijfsevents maar kunnen fouten maken, doe altijd je eigen onderzoek. De geuite opvattingen en meningen weerspiegelen niet noodzakelijkerwijs die van DruckFin. We hebben niet alle hierin gebruikte informatie onafhankelijk geverifieerd en deze kan fouten of weglatingen bevatten. Raadpleeg een gekwalificeerde financieel adviseur voordat je een beleggingsbeslissing neemt. DruckFin en haar dochterondernemingen wijzen elke aansprakelijkheid af voor eventuele verliezen die voortvloeien uit het vertrouwen op deze inhoud. Zie voor de volledige voorwaarden onze Gebruiksvoorwaarden.