NVIDIA-transcript: Vera Rubin nu in volledige productie en een gloednieuwe CPU speciaal voor AI-agents

NVIDIA GTC Taipei 2026 Keynote met Jensen Huang — 1 juni 2026, Taipei, Taiwan

Welkom en de staat van het ecosysteem

Jensen Huang werd enthousiast onthaald tijdens GTC Taiwan. Hij opende het evenement door stil te staan bij de omvang van de bijeenkomst en merkte op dat er in heel Taiwan 70 gelijktijdige lanceerevenementen plaatsvonden waar de keynote live werd bekeken. Hij stelde zijn ouders in het publiek voor onder applaus en bedankte de artiesten van de pre-show.

Huang reflecteerde op de breedte van het NVIDIA-ecosysteem. Hij merkte op dat wanneer mensen aan een ecosysteem denken, ze vaak alleen de softwarestack en de ontwikkelaarsgemeenschap boven op de door NVIDIA gebouwde computersystemen voor zich zien. Hij benadrukte echter dat het ecosysteem van NVIDIA zich uitstrekt tot ver stroomopwaarts naar de toeleveringsketen in Taiwan, waar alles begint, en stroomafwaarts tot aan datacenters en uiteindelijk de eindgebruikers. Hij sprak zijn waardering uit voor het Taiwanese ecosysteem en noemde het het beste ecosysteem voor toeleveringsketens ter wereld. Hij vertelde dat hem de avond ervoor was verteld dat het jaarlijkse bbp van Taiwan naar verwachting met bijna 10 procent zou groeien, wat hij ongelooflijk noemde.

Agentic AI is gearriveerd: De revolutie in softwareproductiviteit

Huang begon zijn keynote met een centraal thema: twee jaar geleden begon hij te spreken over hoe AI was geëvolueerd van generatieve AI naar de volgende golf, die hij 'agentic AI' noemde. Hij verklaarde dat agentic AI nu is gearriveerd en dat nuttige AI een feit is.

Om dit punt te illustreren, verwees hij naar GitHub als een van de eerste toepassingen van agentic AI in softwareontwikkeling. Hij omschreef de professionele softwaremarkt als een sector met ongeveer 30 tot 40 miljoen professionele softwareontwikkelaars wereldwijd. Vervolgens presenteerde hij gegevens over GitHub-commits — de maatstaf voor ontwikkelaars die code downloaden, aanpassen en terugplaatsen. In 2023 waren er 300 miljoen commits. In 2024 waren dat er 400 miljoen en in 2025 500 miljoen. In de eerste paar maanden van 2026 was dit aantal bijna verdrievoudigd.

Huang vertaalde dit naar economische termen: 30 miljoen softwareontwikkelaars vertegenwoordigen ongeveer drie biljoen dollar aan bbp in jaarsalarissen, wat op zijn beurt economische groei genereert in de rest van de economie. Die drie biljoen dollar aan salarissen levert nu bijna drie keer zoveel output op — effectief negen biljoen dollar aan productiviteit uit drie biljoen dollar aan salarissen. Hij noemde dit het potentieel en de belofte van AI.

Hij sprak het narratief dat AI banen zou vernietigen krachtig tegen en noemde dit volslagen onzin. Hij betoogde dat het tegenovergestelde gebeurt: er worden juist meer software-engineers aangenomen omdat de output per engineer zo buitengewoon is geworden. Als je een software-engineer kunt aannemen en negen biljoen dollar aan productief werk kunt genereren, waarom zou je er dan minder aannemen? Hij zei dat dit effect zeer binnenkort zichtbaar zal zijn in de economie.

Tokens als de nieuwe inkomstenbron en het computermodel achter agents

Huang koppelde deze productiviteitsrevolutie vervolgens aan de vraag naar rekenkracht. Hij legde uit dat er een buitengewone vraag is naar tokens, omdat men, als men dit soort output kan produceren, er simpelweg meer van wil maken. Tokens zijn nu winstgevende inkomstenbronnen en omdat AI nu rendabel is, willen bedrijven meer AI-fabrieken bouwen en meer tokens genereren. Dit is volgens hem precies de reden waarom de vraag naar rekenkracht in Taiwan is geëxplodeerd en waarom alle bedrijven in het ecosysteem zo goed presteren.

Hij beschreef een fundamentele verandering in het computermodel. Het oude model omvatte een applicatie, code die in die applicatie draaide en een besturingssysteem. Het nieuwe model is een 'agent', bestaande uit een large language model (of meerdere) in een 'harness'. Dat harness orkestreert het model om productief werk te verrichten. Het regelt input, begrip, observatie, redenering, actie en het gebruik van tools. Tools kunnen spreadsheets, webbrowsers, dataverwerkingsengines en database-engines zijn. De agent beheert het kortetermijnwerkgeheugen en het langetermijngeheugen, net zoals mensen dat doen.

Hij noemde het gebruik van tools specifiek als een grote doorbraak. Hij merkte op dat veel mensen hem hadden verteld dat agentic AI softwarebedrijven failliet zou laten gaan. Hij zei dat het tegenovergestelde waar is: omdat er zoveel agents zullen zijn en de wereld niet langer beperkt wordt door het aantal mensen, gaan die agents meer tools gebruiken dan ooit tevoren. Dit is volgens hem een ongelooflijke tijd voor softwarebedrijven, maar de software moet wel op een manier aan de agent worden gepresenteerd dat de agent deze kan gebruiken.

CUDA-X libraries: De schatkamer van NVIDIA voor het tijdperk van agents

Huang omschreef de duizend CUDA-X libraries van NVIDIA als de schatkamer van het bedrijf. Hij legde uit dat NVIDIA deze libraries nu kan presenteren aan agents, die ze effectiever kunnen gebruiken dan mensen. Hij herleidde dit tot CUDA, dat 20 jaar geleden werd gebouwd als een enkele architectuur voor versneld rekenen. De libraries bestrijken een breed scala aan vakgebieden: cuLitho voor computationele lithografie, cuOpt voor beslissingsoptimalisatie, cuDSS voor 'direct sparse solvers', AI-Q voor diepgaand onderzoek in gestructureerde en ongestructureerde documenten, Aerial voor AI RAN, PhysicsNeMo voor differentieerbare fysica en Parabricks voor genomics.

Hij merkte op dat alle CUDA-X libraries nu worden voorzien van 'skills' — in essentie een handleiding die de AI leest en leert gebruiken. Hij zei dat het vermogen van agents om deze libraries te gebruiken ongelooflijk zal zijn, en dat alle CUDA-X libraries worden klaargestoomd om als tools voor agents te dienen.

De gedesaggregeerde architectuur van agentic computing

Huang liep door de gedistribueerde architectuur die ten grondslag ligt aan agentic AI. Hij omschreef de agent als het ultieme gedesaggregeerde en gedistribueerde computermodel, waarbij veel verschillende computers worden geactiveerd om het werk van één agent te verwerken. Het model, het harness, de tools, de skills en de runtime draaien allemaal in verschillende delen van een datacenter.

Hij gaf een analogie: zie het model als het brein, het harness als het lichaam en de tools als items in een werkplaats. De werker — de agent — werkt met tools in die werkplaats op een buitengewoon grote schaal. Elke stap van het proces draait in een ander deel van de computer. Wanneer het large language model aan het denken is — context verwerken, redeneren, plannen, handelen — wordt een volledig rack van Grace Blackwell NVLink 72 geactiveerd. Wanneer de agent een tool gebruikt, wordt een CPU ingezet. Het beveiligingsharness draait op CPU's en een beveiligingsprocessor genaamd de DPU, NVIDIA's BlueField. De orkestratie van alles draait op een CPU.

Hij noemde het geheugensysteem een van de moeilijkste onderdelen. Werkgeheugen, genaamd KV-caching, omvat compressie en ophalen van zowel gestructureerde als ongestructureerde data, met complexe ontologische relaties tussen verschillende datastructuren. Hij zei dat het geheugensysteem van AI het opslagsysteem volledig zal revolutioneren.

Huang zei dat dit probleem van gedesaggregeerd, gedistribueerd en heterogeen rekenen precies de reden is waarom NVIDIA zijn volgende generatie heeft gebouwd: Vera Rubin.

Vera Rubin: De eerste multi-rack AI-supercomputer op pod-schaal — nu in volledige productie

Huang introduceerde Vera Rubin niet als een enkele chip of alleen een GPU. Hij zei dat Vera Rubin het volledige systeem is — van begin tot eind. Het omvat Vera Rubin NVL72 GPU's, Vera CPU's, een revolutionair opslagsysteem, ConnectX-9 netwerken, de DOCA-softwarestack en een beveiligingsprocessor die ervoor zorgt dat alles versleuteld is in rust, in beweging en tijdens gebruik. Hij noemde Vera Rubin de meest ambitieuze onderneming in de geschiedenis van NVIDIA, waaraan alle 40.000 ingenieurs van het bedrijf werken, samen met het bredere ecosysteem.

Hij deed een grote aankondiging: Vera Rubin is nu in volledige productie. Hij zei dat de toeleveringsketen die voor Vera Rubin is opgezet twee keer zo groot is als die voor Grace Blackwell, en dat wat voorheen twee uur duurde om één Grace Blackwell-rack te assembleren, nu slechts vijf minuten kost. Hij bedankte het Taiwanese ecosysteem voor deze prestatie.

Er werd een video getoond waarin de productie en technische details van Vera Rubin werden beschreven. Het systeem begint bij TSMC met een 3-nanometerproces, CoWoS advanced packaging en HBM4-geheugen van Micron, SK Hynix en Samsung. De Vera Rubin GPU beschikt over zes biljoen transistors en meer dan 18.000 componenten op één board. De Vera Rubin NVL72 verwerkt prompt- en contextbegrip, redenering en planning. Het systeem gebruikt een nieuwe modulaire compute-tray met een nieuwe PCB-midplane, ConnectX-9 SuperNIC's en BlueField-4 DPU's, allemaal onderhoudsvriendelijk zonder kabels. Er zijn 18 compute-trays en negen hot-swappable NVLink-switch-trays. Nieuwe, zeer efficiënte vloeistofgekoelde busbars transporteren meer dan 5.000 ampère — het equivalent van 20 elektrische auto's bij volledige acceleratie. In totaal vormen 1,3 miljoen componenten dit MGX-rack van de derde generatie. De video feliciteerde Microsoft, Dell en CoreWeave met het opzetten van hun Vera Rubin NVL72-engineering racks.

De video beschreef ook het Vera CPU-rack, dat 256 CPU's in één vloeistofgekoeld rack huisvest om modellen te orkestreren, geheugen te beheren en tools te starten. Het Vera LPX-rack, vormgegeven door Foxconn en Quanta, huisvest 256 Groq LPU's verdeeld over 16 trays met 40 petabyte per seconde aan SRAM-bandbreedte voor ultra-lage latentie. Terwijl NVL72 tokens genereert met de hoogste doorvoer, genereert het LPX-rack ze met de laagste latentie. De video belichtte ook Vera BlueField-4 STX voor opslagverwerking en in-silicon beveiliging, en NVIDIA Spectrum-X Ethernet Photonics, omschreven als 's werelds eerste Ethernet-switch met 200-gigabit co-packaged optics. Het complete systeem — vijf verbonden racksystemen — werd omschreven als een supercomputer voor AI-agents, gebouwd met 150 toeleveranciers in heel Taiwan.

Na de video werden de fysieke racksystemen op het podium gebracht. Huang toonde de Vera Rubin NVL72, het LPX-rack, het Vera CPU-rack met 256 vloeistofgekoelde CPU's, het Vera BlueField-opslag- en beveiligingsverwerkingssysteem en de Mellanox-netwerkswitch, die hij de eerste CPO ter wereld noemde. Hij benadrukte het verwijderen van kabels en slangen uit het ontwerp, mogelijk gemaakt door een PCB-midplane die beide kanten van het rack verbindt, wat de assemblagetijd drastisch verkort en de betrouwbaarheid verbetert.

NVIDIA DSX: AI-fabrieksarchitectuur op schaal

Voorafgaand aan de diepe duik in Vera Rubin presenteerde Huang het DSX-framework van NVIDIA voor AI-fabrieksarchitectuur. Hij beschreef hoe de wereld racet om AI-fabrieken te bouwen en noemde het de grootste infrastructuurbouw in de menselijke geschiedenis. Hij merkte op dat AI-fabrieken op gigawatt-niveau die begonnen bij 20 tot 30 miljard dollar, nu op 50 tot 60 miljard dollar liggen en binnenkort 80 tot 100 miljard dollar per gigawatt zullen bereiken. Hij zei dat deze fabrieken de eerste keer direct goed moeten werken, omdat de kapitaalkosten enorm zijn.

Een video beschreef DSX Sim, een Omniverse-blauwdruk waarmee partners een NVIDIA Vera Rubin AI-fabriek kunnen ontwerpen en valideren voordat er ook maar één rack is besteld — van het plannen van de lay-out en het simuleren van stroom en koeling tot het ontwerpen van het netwerk en het valideren van elke integratie in een digitale tweeling. DSX OS voorziet, bedient, monitort en herstelt vervolgens de infrastructuur. DSX MaxLPS laat operators veilig meer GPU's inzetten binnen hetzelfde stroombudget; hij merkte op dat de huidige AI-fabrieken tot 40 procent te veel stroom reserveren. Het systeem beschikt over baanbrekende vloeistofkoeling bij 45 graden Celsius die minder water en energie verbruikt. DSX Flex leest real-time signalen van het elektriciteitsnet en past het stroomverbruik dynamisch aan wanneer het net ontlasting nodig heeft. De video stelde dat er voor het einde van het decennium 100 gigawatt aan AI-fabrieken online zal zijn.

Huang legde uit dat NVIDIA een AI-infrastructuurbedrijf is geworden, niet alleen een GPU- of systeembedrijf. Hij beschreef de economische logica: rekenkracht is omzet, prestaties per watt zijn omzet, en het vermogen om snel een fabriek op te zetten, met hoge doorvoer te draaien, betrouwbaarheid te behouden en de levensduur te verlengen zijn allemaal kritieke factoren die de volledig geïntegreerde aanpak van NVIDIA adresseert. Hij zei dat de tokenkosten van NVIDIA de laagste ter wereld zijn — niet met 10 procent, maar met veelvouden — vanwege extreme co-design in het hele systeem.

NVIDIA Vera CPU: De eerste CPU gebouwd voor agents, niet voor mensen

Huang stapte vervolgens over op wat hij een nieuwe belangrijke groeimotor noemde: de Vera CPU, specifiek gebouwd voor het tijdperk van agents.

Hij betoogde dat alle CPU's tot nu toe waren gemaakt voor mensen — mensen die in een wereld leven die in seconden wordt geteld en die CPU-cores in de cloud huren tegen uurtarieven. Agents zijn fundamenteel anders. Ze zijn ongeduldig. Ze leven in een wereld die in nanoseconden wordt geteld. Wanneer een agent een tool gebruikt of een database benadert, moet het antwoord zo snel mogelijk terugkomen. Elk moment van wachten weerhoudt de agent ervan om door te gaan naar de volgende stap. En omdat CPU's zich in het kritieke pad bevinden naast extreem dure GPU-infrastructuur die token-inkomsten genereert, moeten deze CPU's zowel krachtig als zeer energiezuinig zijn.

Hij schetste vier bepalende eigenschappen van Vera. Ten eerste: instructies per klokslag — de hoogste ter wereld met 10 instructies opgehaald, gedecodeerd en uitgevoerd per klokslag, wat de beste single-threaded prestaties en lage latentie in zijn klasse levert. Ten tweede: bandbreedte per core — van wereldklasse. Ten derde: totale bandbreedte rondom en in de chip — aangezien agentic systemen fundamenteel gedesaggregeerd en gedistribueerd zijn, worden netwerken en databeweging het probleem. Vera beschikt over een tweede generatie schaalbare coherentie-fabric die alle 88 Olympus-cores op een monolithisch mesh verbindt met 3,6 terabyte per seconde, zonder overschrijding van trip-grenzen. Het is de eerste CPU die PCIe Gen 6 gebruikt en de eerste die LPDDR5X-geheugen gebruikt met 1,2 terabyte per seconde — twee tot drie keer de bandbreedte van de krachtigste CPU's op de markt — terwijl meerdere fouten tegelijkertijd worden gecorrigeerd zonder de bandbreedte in gevaar te brengen. Ten vierde: energie-efficiëntie — waardoor het systeem zoveel mogelijk CPU in de fabriek kan verpakken zonder stroom weg te nemen van de token-generatie.

Een video gaf meer details over de technische architectuur van de Vera CPU. De NVIDIA Olympus-core in het hart van Vera is gebouwd voor moderne datacenter-workloads, waaronder Python-runtimes met veel branches, tool-aanroepen en sandbox-code-uitvoering. Elke core beschikt over een neurale branch-predictor die twee genomen branches per cyclus evalueert, een 10-wide decode-engine, een grote out-of-order-engine en geavanceerde prefetchers met een nieuwe graph-engine. De video beschreef hoe Vera 40 procent lagere piekgeheugenlatentie bereikt ten opzichte van x86. Geheugen-coherente NVLink chip-to-chip verbindt GPU's direct met de CPU en kan Vera ook schalen naar meerdere sockets. Vera levert 1,8 keer de agentic sandbox-prestaties van x86 CPU's.

Terug op het podium presenteerde Huang benchmarkresultaten. Hij liet zien dat SQL drie keer sneller draaide op Vera — wat hij buitengewoon noemde, aangezien SQL een van de moeilijkste workloads is om te versnellen. Hij presenteerde ook real-time streamverwerkingsresultaten voor de New York Stock Exchange, waar de Vera CPU zes keer sneller draait, wat hij toeschreef aan de bandbreedteverbeteringen, single-threaded instructie-uitvoering en verbeteringen aan de interne en externe bandbreedte van de architectuur.

Hij merkte op dat bijna alle grote OEM's en ODM's in Taiwan Vera ondersteunen. Hij zei dat de 'early adopters' de agentic-bedrijven zijn, en dit vertegenwoordigt een nieuwe markt die nooit eerder bestond — CPU's voor agents. Hij stelde dat er veel meer agents zullen zijn dan mensen, en agents zijn erg ongeduldig, waardoor deze markt zeker groter zal zijn dan de vorige. Hij voegde eraan toe dat de bestellingen al binnen zijn en voorspelde dat Vera de snelste en meest succesvolle productlancering in de geschiedenis van NVIDIA zal worden.

NVIDIA Agent Toolkit voor Enterprise AI

Huang presenteerde wat hij omschreef als de belangrijkste conclusie van de keynote: de NVIDIA Agent Toolkit voor Enterprise AI. Hij zei dat elk bedrijf agents zal draaien, elk bedrijf agents binnen zijn muren zal hebben, en elk bedrijf zich afvraagt hoe ze agents veilig kunnen draaien en hoe ze agents kunnen bouwen voor hun eigen workloads.

De toolkit heeft vier componenten. Ten eerste: modellen — large language models, hoe slimmer, goedkoper en sneller, hoe beter. Ten tweede: een harness om alles te orkestreren. Ten derde: tools met skills — inclusief CUDA-X libraries. Ten vierde: een runtime — het besturingssysteem dat alles bij elkaar houdt, wat NVIDIA 'OpenShell' noemt. OpenShell is een zeer veilig harness voor enterprise-gebruik dat de agent beschermt, het verankert in beveiligingsbeleid, privacy beschermt, rechten en privileges beheert en identiteit beschermt. Het is open source en wordt breed geadopteerd, onder meer door Red Hat, Canonical en Microsoft. De toolkit bevat ook open agentic harnesses zoals OpenClaw en Hermes.

Als demonstratie van de toolkit in actie beschreef Huang een partnerschap met Cadence om een super-agent voor chipontwerp te bouwen. Een video toonde de agent — georkestreerd door Codex of Claude Code, aangedreven door Nemotron en beveiligd door NVIDIA OpenShell — die een workflow voor ontwerpverificatie uitvoerde. Sub-agents handelen RTL-generatie, testbench-creatie, regressietesten en debugging af. De Chip Stack-agents draaien honderden simulaties met Cadence Xcelium en formele verificatie met JasperGold. Wat voorheen weken duurde voor teams, kost nu uren — verificatiecycli zijn meer dan 40 keer sneller.

Huang zei dat NVIDIA duizenden chipontwerpers heeft en honderdduizenden Cadence super-agents zal inhuren om naast hen te werken, zodat het bedrijf nog verder kan versnellen. Hij kondigde vervolgens Nemotron 3 Ultra aan, omschreven als 's werelds eerste model gebaseerd op een hybride architectuur die State Space Models combineert met een Mixture of Experts. Hij zei dat het vijf keer sneller en 30 procent goedkoper is om te draaien dan zelfs de meest kostenefficiënte modellen ter wereld, en vergeleek het gunstig met de beste open modellen ter wereld. Net als bij eerdere Nemotron-modellen brengt NVIDIA niet alleen het model uit, maar ook alle trainingsdata en trainingsscripts, zodat iedereen het kan nemen, kan uitbreiden en er zijn eigen versie van kan maken. Hij merkte op dat NVIDIA momenteel werkt aan Nemotron 4.

Hij somde enterprise-softwarepartners op die al met de toolkit werken: Cadence, CrowdStrike, ServiceNow, Palantir en SAP. Hij herhaalde zijn visie dat agents deze bedrijven niet zullen ontwrichten, maar de grootste kans ooit zullen creëren voor enterprise-softwarepartners.

De pc opnieuw uitvinden: RTX Spark, Windows-machines en het DGX Station

Huang verschoof de aandacht naar personal computing en plaatste de discussie in de context van de 40-jarige geschiedenis van de pc. Hij zei dat Microsoft en NVIDIA de pc opnieuw gaan uitvinden voor het tijdperk van agents, nadat ze drie jaar lang hebben samengewerkt om fundamenteel te heroverwegen hoe de pc zal werken.

Hij introduceerde RTX Spark, omschreven als alles wat NVIDIA in 33 jaar heeft geleerd, gedestilleerd in één chip. RTX Spark beschikt over een Blackwell RTX GPU met 6.144 Tensor Cores, één petaflop aan AI-prestaties, een aangepaste 20-core Grace CPU gebouwd in samenwerking met MediaTek, NVLink-fusie, 128 gigabyte aan verenigd geheugen, het 3-nanometerproces van TSMC en 70 miljard transistors. Hij zei dat 100 procent van de NVIDIA-software erop draait — digitale biologie, seismische verwerking, astrofysica, alle fysica, biologie, genomics, AI en computergraphics — en elke applicatie die Windows ooit heeft gedraaid. Hij zei dat Microsoft en NVIDIA alles nauwgezet hebben geoptimaliseerd zodat de computer alles draait wat de wereld ooit heeft gecreëerd, plus agents.

Een video demonstreerde een agent die lokaal op RTX Spark draaide en hielp bij het ontwerpen van een huis. De agent werkte via een OpenShell-sandbox die het Hermes-harness draaide, verbonden met Claude Sonnet in de cloud, gebruikmakend van tools op de laptop, waaronder Rhino voor 3D-modellering en Blender voor rendering. De agent modelleerde de locatie, vormde het terrein, stelde gebouwvormen voor die geoptimaliseerd waren voor kosten en comfort, genereerde interieurindelingen, plaatste deuren, ramen en structurele elementen automatisch, detecteerde en herstelde zijn eigen fouten, exporteerde het model vanuit Rhino naar Blender met behoud van materialen en objecteigenschappen, en gebruikte het Flux 2 generatieve AI-model om fotorealistische renders te produceren vanuit meerdere gezichtspunten en lichtomstandigheden.

Hij belichtte ook Adobe als partner en merkte op dat zij de kern van Photoshop en Premiere hebben herontworpen voor RTX Spark, waardoor de applicaties twee keer zo snel zijn geworden en ze agent-vriendelijk zijn ontworpen via een MCP-server die interactie met agents op de laptop mogelijk maakt.

Huang kondigde vervolgens een bredere nieuwe pc-lijn aan: drie revolutionaire Windows-machines voor desktop, laptop en workstation, allemaal 100 procent Windows-compatibel, 100 procent CUDA en 100 procent NVIDIA AI Tensor Core. Hij toonde een MSI-desktopversie van het RTX Spark-platform en omschreef deze als in staat om 24 uur per dag, zeven dagen per week een agent te draaien, zonder 'meter anxiety', verbonden met het hele huis van de gebruiker — laptop, display, camera's, apparaten en beveiligingssysteem — functionerend als een persoonlijke AI-agent die in de loop van de tijd slimmer wordt.

Hij kondigde ook het DGX Station aan, compatibel met Windows, met 768 gigabyte aan geheugen, 20 petaflops aan rekenkracht en acht terabyte per seconde aan geheugenbandbreedte, in staat om een model met een biljoen parameters te draaien en bij het bureau van een ontwikkelaar te staan. Hij zei dat dit het begin is van een nieuwe productfamilie — een nieuwe lijn — met een roadmap die voor elke toekomstige architectuurgeneratie een desktop, laptop en workstation zal opleveren.

Hij vergeleek de verwachte transformatie van de pc met wat er met de telefoon is gebeurd. Twintig jaar geleden was een telefoon een telefoon. Tegenwoordig gebruiken mensen hun telefoon nauwelijks meer om te bellen. Hij sprak zijn overtuiging uit dat de pc over 10 jaar totaal anders zal zijn — dat net zoals elk huis tegenwoordig een thuisbioscoop en huishoudelijke apparaten heeft, er ooit in elk huis een AI-supercomputer zal staan die 24/7 alle agents en assistenten van de eigenaar draait. Hij zei dat dit meer zal voelen als R2-D2 of C-3PO dan als een traditionele pc, en dat deze heruitvinding net zo groot is als de transformatie van de telefoon naar de smartphone.

Fysieke AI: Cosmos 3, autonome voertuigen en humanoïde robotica

Huang stapte over op fysieke AI en robotica en merkte op dat agentic AI in essentie een digitale robot is — het begrijpt, redeneert, plant en handelt. Hetzelfde computermodel zal in allerlei fysieke systemen draaien.

Hij beschreef de uitdaging van data voor fysieke AI: trainingsdata voor taalmodellen werd geschreven vanuit het menselijk perspectief, maar robot-trainingsdata moet vanuit het perspectief van de robot komen. Het meeste videodata in de wereld is vanuit een derdepersoonsperspectief, niet vanuit de eerste persoon. Hij schetste een ladder van vooruitgang van teleoperatie en menselijke demonstratie via simulatiegebaseerde training, daarna leren van derdepersoonsdata die wordt geprojecteerd naar de eerste persoon, en uiteindelijk een World Foundation Model dat de fysieke wereld vanuit elk perspectief begrijpt.

Huang kondigde Cosmos 3 aan en noemde het de grens van fysieke AI. Hij zei dat NVIDIA absoluut de beste ter wereld is in fysieke AI en omschreef Cosmos 3 als een foundation model voor elk werk dat de fysieke wereld betreft — fabrieksrobots, elke robot die in een fysieke omgeving opereert. Een video beschreef Cosmos als een open frontier omni-model gebouwd op een nieuwe Mixture of Transformers-architectuur. Pixels, actie, geluid en taal stromen in een autoregressieve transformer die redeneert, plant en een diffusie-transformer instrueert die genereert wat er daarna komt. Cosmos kan functioneren als een vision-language model dat de fysieke wereld observeert en begrijpt, als een wereldmodel dat fysica-accurate synthetische video genereert, als een simulator die de lus sluit voor beleidstraining en evaluatie, en als de basis van NVIDIA OmniDreams — een actie-geconditioneerd wereldmodel dat de toekomst frame voor frame voorspelt. Cosmos is open — het model, de data en de trainingsmethodologie worden allemaal publiekelijk vrijgegeven.

Hij kondigde vervolgens Alpamayo 2 Super aan, omschreven als een open model voor zelfrijdende auto's en 's werelds eerste redenerende autonome voertuig. Hij merkte op dat merken die ongeveer 80 procent van de autofabrikanten ter wereld vertegenwoordigen zich hebben aangemeld voor NVIDIA DRIVE Hyperion, en dat ongeveer 97 procent van de mobiliteitsdiensten ter wereld verbinding maakt met NVIDIA. Een demonstratievideo toonde een Mercedes-voertuig dat door stedelijke rijscenario's navigeerde — voetgangers, stopborden, rijstrookwisselingen, snijdende voertuigen en geblokkeerde rijstroken beherend — terwijl het systeem zijn redenering in real-time verwoordde. Huang grapte dat, hoewel de auto die de hele tijd tegen zichzelf praat een passagier gek zou maken, de narratie staat voor denken, en dat is precies wat ze willen.

Hij sprak vervolgens over humanoïde robotica en beschreef het NVIDIA Isaac GR00T-platform als de volledige stack voor humanoïde robotica — model, datageneratie, simulatie, runtime en besturingssysteem. Hij kondigde de NVIDIA Isaac GR00T referentie-humanoïde robot aan, omschreven als volledig geïntegreerd met 25 vrijheidsgraden op elke hand gemaakt door Sharpa, 31 vrijheidsgraden in totaal, 1,80 meter lang en 68 kilogram zwaar, draaiend op het nieuwe Jetson Thor-platform en de volledige Isaac GR00T-softwarestack. Hij zei dat het platform primair is gebouwd voor hoger onderwijs en universitaire onderzoekers, voor wie het bouwen van zo'n robot vanaf nul waanzinnig moeilijk zou zijn. Een video beschreef de volledige workflow: simulatie opzetten in Isaac Lab, demonstraties vastleggen met Isaac Teleoperation, synthetische data genereren met Omniverse en Cosmos, beleid trainen, evalueren in Isaac Lab Arena en implementeren via Isaac ROS op Jetson Thor, waarbij elk element modulair en open is.

Afsluitende samenvatting

Huang sloot af met een samenvatting van de belangrijkste aankondigingen. Vera Rubin is in volledige productie — niet alleen een GPU, maar een volledig gedesaggregeerd gedistribueerd agent-verwerkingssysteem. NVIDIA is een AI-infrastructuurbedrijf geworden. De Vera CPU is een revolutionaire nieuwe architectuur gebouwd voor agents, niet voor mensen, met eigenschappen die fundamenteel verschillen van alle eerdere CPU's. De bestellingen zijn al binnen en het wordt verwacht de snelste en meest succesvolle productlancering van NVIDIA te worden. Microsoft en NVIDIA hebben een compleet nieuwe lijn pc's gecreëerd voor het tijdperk van agents, waarbij elke pc-OEM ter wereld zich bij het initiatief aansluit. Hetzelfde agentic computermodel zal zich repliceren over clouds, ondernemingen, pc's, robots, satellieten, basisstations en fabrieken.

Hij sprak zijn vertrouwen uit dat de manier waarop mensen over de personal computer denken ingrijpend zal veranderen, en bedankte het Taiwanese ecosysteem voor zijn partnerschap, vriendschap en buitengewone werk van het afgelopen jaar. Hij sloot af door iedereen welkom te heten op Computex 2026.

NVIDIA Deep Dive

De architectuur van rekenkracht

NVIDIA heeft zijn metamorfose van een leverancier van losse grafische processors tot een full-stack architect van het intelligentietijdperk voltooid. Het bedrijfsmodel rust fundamenteel op het ontwikkelen en vermarkten van versnelde computerplatforms die kunstmatige intelligentie, high-performance computing en geavanceerde datavisualisatie aandrijven. In plaats van louter standaardchips te verkopen, levert NVIDIA volledig geïntegreerde infrastructuur. Het ecosysteem omvat de onderliggende hardware, waaronder grafische processors (GPU's) en centrale processors (CPU's), evenals cruciale netwerkapparatuur voor datacenters zoals InfiniBand- en Ethernet-switches. Deze hardwarelaag wordt zwaar versterkt door een uitgebreide, eigen softwarestack, waardoor het bedrijf waarde kan creëren in de gehele datacenterarchitectuur.

De financiële vertaling van deze full-stack strategie is verbijsterend. In het eerste kwartaal van het boekjaar 2027 rapporteerde het bedrijf een totale omzet van $81,6 miljard, een stijging van 85% op jaarbasis. Het segment Data Center overtreft inmiddels ruimschoots de legacy gaming-tak, met een omzet van $75,2 miljard in hetzelfde kwartaal. Cruciaal is dat NVIDIA netwerken met succes heeft getransformeerd van een bijproduct naar een zelfstandige structurele pijler. De omzet uit datacenter-netwerken alleen al bereikte $14,8 miljard in het kwartaal, grotendeels gedreven door de adoptie van Spectrum-X Ethernet en NVLink-interconnects. Bovendien breidt het bedrijf zijn terugkerende softwareomzet systematisch uit via NVIDIA AI Enterprise, dat wordt gemonetiseerd voor ongeveer $4.500 per GPU per jaar, waardoor abonnementsinkomsten met hoge marges boven op de hardwarebasis worden gelegd. Deze operationele hefboomwerking is duidelijk terug te zien in het winstprofiel van het bedrijf, met brutomarges van 74,9% en een vrije kasstroom van $48,6 miljard in slechts één kwartaal.

Het ecosysteem: klanten, leveranciers en concurrenten

Het klantenbestand van NVIDIA weerspiegelt de dubbele motoren van de wereldwijde uitrol van kunstmatige intelligentie. Momenteel is de omzetverdeling binnen het segment Data Center in exact evenwicht: ongeveer 50% van de vraag komt van hyperscale cloudserviceproviders, waaronder Microsoft, Alphabet, Amazon en Meta, terwijl de overige 50% is verdeeld over soevereine AI-initiatieven, zakelijke datacenters en industriële toepassingen. Deze diversificatie is een cruciale risico-mitigerende factor, die bewijst dat de vraag naar versnelde rekenkracht met succes is verbreed buiten een geconcentreerd handjevol cloudinfrastructuur-giganten.

Aan de aanbodzijde blijven de voornaamste kwetsbaarheid en beperking van NVIDIA structureel verbonden aan Taiwan Semiconductor Manufacturing Company. De fysieke complexiteit van de multi-chip-systemen van het bedrijf maakt het sterk afhankelijk van de CoWoS-capaciteit voor geavanceerde verpakkingstechnologie van de foundry. Tegen eind 2026 zal de totale maandelijkse CoWoS-capaciteit naar verwachting 120.000 tot 130.000 wafers bedragen, waarvan NVIDIA een aanzienlijk aandeel van 60% opeist. Daarnaast is het bedrijf sterk afhankelijk van geheugenleveranciers zoals SK Hynix en Micron voor cruciale High Bandwidth Memory-modules, wat een uiterst complexe, gelaagde toeleveringsketen creëert waarin elk knelpunt onmiddellijk de gerealiseerde omzet afremt.

Het concurrentielandschap intensiveert zich langs twee verschillende vectoren: rivalen in standaardchips en interne engineering bij hyperscalers. Advanced Micro Devices blijft de meest zichtbare concurrent in de verkoop van chips, met de uitrol van zijn MI350- en toekomstige MI400-architecturen. De veel existentiëlere dreiging komt echter van NVIDIA's grootste klanten. De inzet door Alphabet van zijn eigen TPU v6e Trillium en TPU v7 Ironwood, naast de Trainium 2 van Amazon, vertegenwoordigt geloofwaardige, zwaar gefinancierde pogingen om de marges van NVIDIA te omzeilen. Nu cloudproviders proberen de totale eigendomskosten te optimaliseren en de absolute afhankelijkheid van één enkele leverancier te verminderen, krijgen interne chip-programma's vrijwel onbeperkte kapitaaltoezeggingen.

Marktaandeel en het fort van CUDA

Ondanks toenemend concurrentiegeweld wijst onze analyse van de datacenter-acceleratormarkt in 2026 uit dat NVIDIA nog steeds ongeveer 80% van het wereldwijde marktaandeel naar omzet in handen heeft. De Instinct-portfolio van Advanced Micro Devices heeft een duurzame maar bescheiden voet aan de grond gekregen, met een marktaandeel van ongeveer 5% tot 7%. Deze aanhoudende marktdominantie is niet enkel een kwestie van rekenkracht; het wordt zwaar beschermd door het softwareplatform Compute Unified Device Architecture (CUDA) van NVIDIA. In bijna twee decennia is dit ecosysteem de definitieve lingua franca geworden voor parallel computing en de ontwikkeling van kunstmatige intelligentie.

Concurrenten kunnen NVIDIA vaak bijhouden of theoretisch overtreffen op basis van ruwe hardwarespecificaties, zoals geheugenbandbreedte of teraflops per seconde. Om NVIDIA echter te verdringen, moeten zakelijke ontwikkelaars ervan worden overtuigd om een zeer volwassen, uitgebreid gedocumenteerd software-ecosysteem in te ruilen voor opkomende alternatieven. Bovendien wordt het marktaandeel in toenemende mate beschermd door netwerkdominantie. Naarmate AI-modellen schalen naar biljoenen parameters, vereist het trainen ervan de perfecte synchronisatie van tienduizenden processors. Het vermogen van NVIDIA om de volledige rack-scale architectuur te verkopen, waarbij verwerkingseenheden, switches en data processing units naadloos worden geïntegreerd, creëert een geïntegreerde prestatiestandaard die gefragmenteerde concurrenten nauwelijks kunnen kopiëren. Deze diepe structurele verankering zorgt ervoor dat de toetredingsdrempel onbetaalbaar hoog blijft.

Generatiehorizonten: Blackwell en Rubin

De hardware-productcyclus is de centrale katalysator voor toekomstige omzetversnelling. Nu de Hopper-architectuur het fundament heeft gelegd voor de boom in generatieve computing, drijft de lopende volumetoename van de Blackwell-generatie begin 2026 de infrastructuurimplementaties aan. NVIDIA heeft echter al de volgende verouderingscyclus ontworpen met de introductie van zijn Vera Rubin-platform, dat in de tweede helft van 2026 op grote schaal beschikbaar zal zijn voor de cloud. De Rubin-productfamilie vertegenwoordigt een diepgaande architecturale sprong.

De kern-R100-unit binnen het Rubin-platform maakt gebruik van een 3nm-proces en integreert 336 miljard transistors, een enorme uitbreiding ten opzichte van de vorige generatie. Het laat de industrie overstappen op de volgende generatie HBM4-geheugen, wat 288GB aan geheugencapaciteit en 50 PFLOPS aan FP4-rekenkracht per chip biedt. Minstens zo cruciaal is dat de Rubin-generatie de eigen Vera-CPU van NVIDIA agressief naar het datacenter pusht. Door de kernaccelerator te koppelen aan een ARM-gebaseerde processor, valt NVIDIA expliciet de algemene servermarkt aan, waarmee een gloednieuwe totale adresseerbare markt van $200 miljard wordt ontsloten. Het management claimt dat het Rubin-platform tot een 10x lagere kostprijs per inferentie-token op schaal levert, wat de unieke economie van implementatie volledig reset en de industrie dwingt tot een onvrijwillige upgradecyclus.

Industriedynamiek en disruptieve nieuwkomers

De markt voor datacenterinfrastructuur is structureel verschoven van kapitaaluitgaven gebaseerd op algemene rekenkracht naar gespecialiseerde intelligentiefabrieken. De voornaamste kans ligt in de proliferatie van agentic frameworks en gelokaliseerde edge computing. Naarmate de vraag naar inferentie exponentieel stijgt, gedreven door toepassingen die in staat zijn tot realtime spraak, video en autonoom redeneren, breidt de behoefte aan gelokaliseerde rekenkracht de totale adresseerbare markt uit tot voorbij de traditionele hyperscale-faciliteiten. Bovendien zorgt de opkomst van soevereine kunstmatige intelligentie, waarbij natiestaten miljarden investeren om gelokaliseerde infrastructuur op te bouwen, voor een zeer duurzame, ongecorreleerde laag van vraag.

Daarentegen wordt de industrie geconfronteerd met ernstige fysieke en thermodynamische beperkingen. De voornaamste bedreiging voor voortdurende uitrol is niet de beschikbaarheid van kapitaal, maar de stroom- en thermische dichtheid. De concurrentiemaatstaf verschuift snel van absolute prestaties naar tokens per megawatt. Deze exacte dynamiek creëert een kans voor disruptieve nieuwkomers die zich specifiek richten op inferentie-workloads met een laag stroomverbruik en een hoge doorvoer. Bedrijven als Cerebras en Groq zijn de speculatieve durfkapitaalfase voorbij en sluiten actief commerciële contracten, waarbij ze gebruikmaken van unieke wafer-scale integratie en gelokaliseerde SRAM-architecturen om knelpunten in het geheugen met hoge bandbreedte volledig te omzeilen. Hoewel deze nieuwkomers de ijzeren greep van NVIDIA op het trainen van zware modellen niet bedreigen, vormen ze een geloofwaardige, zeer specifieke dreiging voor de toekomstige omzetpool uit inferentie.

Trackrecord van het management

Onder leiding van Jensen Huang heeft het managementteam een ongeëvenaard trackrecord laten zien in technologische anticipatie en uitvoering in de toeleveringsketen. De afgelopen drie jaar heeft het management de architecturale verschuiving naar versnelde computing correct geïdentificeerd en agressief capaciteit voor wafers veiliggesteld, lang voordat de bredere markt de schaal van de naderende vraag begreep. Deze bereidheid om miljarden vast te leggen in niet-annuleerbare inkoopverplichtingen stelde NVIDIA in staat om de beginfase van de infrastructuur-boom in feite te monopoliseren.

Het raamwerk voor kapitaalallocatie van het management is parallel aan de operationele kasstroom volwassen geworden. NVIDIA, historisch gezien beschouwd als een volatiele groeientiteit, is snel getransformeerd in een structureel voertuig voor kasrendement. Alleen al in het eerste kwartaal van het boekjaar 2027 keerde het bedrijf ongeveer $20,0 miljard uit aan aandeelhouders, kondigde het een 25-voudige verhoging van het kwartaaldividend aan en autoriseerde het een extra aandeleninkoopprogramma van $80,0 miljard. De operationele precisie die nodig is om een overgang van de Hopper-architectuur naar Blackwell, en onmiddellijk daarna naar Rubin, te beheren zonder de omzet van het lopende kwartaal te kannibaliseren of catastrofale voorraadafschrijvingen te ondergaan, onderstreept een directieteam dat opereert op het absolute hoogtepunt van industrieel vakmanschap.

De scorekaart

NVIDIA staat als de bepalende infrastructuurleverancier van het moderne computertijdperk, waarbij ongeëvenaarde hardware-engineering wordt gecombineerd met een diep verankerde softwaregracht. De enorme schaal van de financiële uitvoering, blijkend uit een kwartaalomzet van $81,6 miljard en onberispelijke brutomarges van 74,9%, toont een bedrijfsmodel aan dat volledig is bevrijd van de cyclische aard van de legacy-halfgeleiderindustrie. De strategische uitbreiding naar volledige rack-scale systemen, eigen netwerkapparatuur en CPU's via het aanstaande Vera Rubin-platform zorgt er vrijwel zeker voor dat het bedrijf op middellange termijn een toenemend percentage van de wereldwijde kapitaaluitgaven in datacenters zal opvangen.

De overgang van een absoluut monopolie naar een dominante marktleider is in volle gang. De snelle volwassenwording van custom silicon bij hyperscalers, naast aanhoudende hardware-iteraties van directe concurrenten en nieuwkomers die zich richten op gespecialiseerde inferentie-architecturen, zal de historische foutmarge van het bedrijf onvermijdelijk onder druk zetten. Hoewel fysieke beperkingen in verpakkingstechnologie en een stroomknelpunt in de gehele sector de volumegroei op korte termijn afremmen, blijven de prijszettingsmacht en de kleverigheid van het ecosysteem absoluut. Ondersteund door een gelijkmatig verdeelde omzetmix van cloud tot onderneming en een proactieve transformatie naar een softwaregedefinieerd ecosysteem, behoudt het kernbedrijfsmodel een diepgaande structurele duurzaamheid.

Verder lezen

ERock onder de loep: Explosieve groei in orderportefeuille botst met kapitaalintensiteit en industriële grootmachten

2026-06-08

Forbright onder de loep: Het heruitvinden van commercieel bankieren via asset-light provisies en digitale depositogroei

2026-06-08

Parabilis Medicines onder de loep: Superieure β-Catenin-werkzaamheid versus hindernissen bij intraveneuze toediening en geopolitieke concentratierisico's

2026-06-08

Liftoff Mobile onder de loep: Ontkoppeling en dominantie in de onafhankelijke app-economie

2026-06-08

NVIDIA-transcript: Vera Rubin AI-platform in volle productie nu agents de economie van computing transformeren

2026-06-06

Bloomberg Live: Broadcom-topman Hock Tan ziet af van overnames — en OpenAI-chips liggen op schema voor productie eind dit jaar

2026-06-05

Disclaimer: Dit artikel is uitsluitend bedoeld voor informatieve doeleinden en vormt geen beleggingsadvies of een aanbeveling om effecten te kopen, verkopen of aan te houden. Onze analisten bieden gedetailleerde verslaggeving van bedrijfsevents maar kunnen fouten maken, doe altijd je eigen onderzoek. De geuite opvattingen en meningen weerspiegelen niet noodzakelijkerwijs die van DruckFin. We hebben niet alle hierin gebruikte informatie onafhankelijk geverifieerd en deze kan fouten of weglatingen bevatten. Raadpleeg een gekwalificeerde financieel adviseur voordat je een beleggingsbeslissing neemt. DruckFin en haar dochterondernemingen wijzen elke aansprakelijkheid af voor eventuele verliezen die voortvloeien uit het vertrouwen op deze inhoud. Zie voor de volledige voorwaarden onze Gebruiksvoorwaarden.