DruckFin

NVIDIA-transcript: Vera Rubin AI-platform in volle productie nu agents de economie van computing transformeren

GTC Taipei 2026 Keynote - 1 juni 2026

Jensen Huang betrad het podium tijdens GTC Taipei om aan te kondigen dat het ambitieuze Vera Rubin-platform van NVIDIA nu in volle productie is. Hij bestempelde dit als de meest ingrijpende verschuiving in computing sinds de revolutie van de pc. De keynote, die gelijktijdig werd uitgezonden naar 70 evenementen in Taiwan, benadrukte dat bruikbare AI gearriveerd is en dat de economische fundamenten van computing fundamenteel zijn veranderd.

De economie van AI: Tokens staan gelijk aan omzet

Huang opende met overtuigend bewijs dat agent-gebaseerde AI is verschoven van belofte naar productiviteit. Op basis van GitHub-commitdata liet hij zien dat waar 30 miljoen softwareontwikkelaars in 2023 historisch gezien 300 miljoen commits produceerden, dat aantal in 2025 was gestegen naar 500 miljoen. In de eerste maanden van 2026 is het aantal commits bijna verdrievoudigd tot circa 900 miljoen.

De economische implicaties zijn aanzienlijk. Huang legde uit dat drie biljoen dollar aan salarissen voor ontwikkelaars nu een resultaat genereert waarvoor voorheen negen biljoen dollar aan menselijke productiviteit nodig was. Dit is het eerste tastbare bewijs dat AI meetbare bbp-groei genereert. Hij benadrukte dat, in tegenstelling tot de vrees voor het verdwijnen van banen, bedrijven juist meer software-engineers aannemen omdat de output per engineer zo waardevol is geworden.

Deze productiviteitsgolf heeft geleid tot een ongekende vraag naar compute-infrastructuur. Huang merkte op dat omdat tokens nu winstgevende omzetunits zijn, AI-bedrijven er aanzienlijk meer van willen genereren, wat de explosieve groei van het Taiwanese halfgeleider-ecosysteem aanjaagt. Hij verwees naar de verwachte bbp-groei van bijna 10 procent in Taiwan als direct bewijs voor deze vraag naar rekenkracht.

Het agent-gebaseerde computermodel begrijpen

Huang nam uitgebreid de tijd om uit te leggen hoe agents fundamenteel verschillen van traditionele applicaties. Een agent bestaat uit een large language model dat zich in een 'harness' bevindt die observatie, redenering, planning en actie orkestreert. De agent gebruikt tools – spreadsheets, webbrowsers, databases of gespecialiseerde computing-engines – die allemaal door de harness worden beheerd, vergelijkbaar met hoe een besturingssysteem applicaties beheert.

De demonstratie omvatte het genereren van een GIF-animatie van de Taipei 101-toren met eenvoudige tekstprompts, het creëren van CAD-bestanden voor 3D-printen op basis van mondelinge beschrijvingen en het uitvoeren van complexe taken via natuurlijke taal. Huang benadrukte dat het computing-patroon is verschoven van het opstarten van applicaties en het klikken op knoppen naar het uitleggen van de intentie aan AI, die vervolgens code genereert of tools gebruikt om output te produceren.

Een belangrijke onthulling betrof het gebruik van tools. Huang weerlegde de misvatting dat agent-gebaseerde AI softwarebedrijven overbodig zou maken. Hij betoogde juist het tegenovergestelde: omdat de wereld niet langer beperkt zal zijn door het aantal menselijke werknemers, zullen agents exponentieel meer tools gebruiken dan mensen ooit zouden kunnen. Dit biedt een ongekende kans voor softwarebedrijven, mits hun tools op een manier worden aangeboden die agents kunnen benutten.

De uitdaging van gedisaggregeerde computing

Het agent-gebaseerde computermodel vertegenwoordigt de ultieme gedisaggregeerde en gedistribueerde computerarchitectuur. Verschillende componenten draaien op verschillende onderdelen van een datacenter. Het denkproces van het large language model activeert volledige racks van Grace Blackwell NVLink 72-systemen. Het gebruik van tools activeert CPU's die compilers, Python, JavaScript of versnelde computing-bibliotheken draaien. Security-harnesses draaien op CPU's en DPU's zoals NVIDIA's BlueField. Orkestratie vindt plaats op CPU's die de gehele workflow beheren.

Geheugenbeheer bleek een van de meest complexe uitdagingen. Het werkgeheugen, genaamd KV-caching, moet zowel de compressie als de opvraging van gestructureerde en ongestructureerde data afhandelen. De ontologie en de relaties tussen datastructuren zorgen voor buitengewoon ingewikkelde verwerkingseisen. Huang voorspelde dat de geheugensystemen van AI de opslaginfrastructuur volledig zullen revolutioneren.

Deze heterogene, gedisaggregeerde architectuur is precies de reden waarom NVIDIA Vera Rubin heeft gebouwd. Huang benadrukte dat Vera Rubin geen enkele chip is, maar een compleet end-to-end systeem inclusief GPU's, CPU's, opslagsystemen, ConnectX-9-netwerken, security-processors en softwarestacks. Alles implementeert confidential computing omdat AI-modellen zo kostbaar zijn. Elk systeemcomponent zou op zichzelf al een revolutie betekenen; samen vormen ze NVIDIA's meest ambitieuze onderneming.

NVIDIA als infrastructuurbedrijf

Huang legde uit dat NVIDIA is getransformeerd van een GPU-bedrijf naar een systeembedrijf en nu naar een infrastructuurbedrijf. Het ecosysteem omvat inmiddels stroomgeneratoren, koelsystemen en netbeheerders. Het doel van NVIDIA is het bouwen van complete infrastructuurstacks zodat klanten AI-fabrieken kunnen bouwen.

Hij introduceerde DSX – de infrastructuur-blueprint die volgt op RTX voor GPU's en DGX voor systemen. DSX omvat DSX Sim, een op Omniverse gebaseerde simulator waarmee partners complete AI-fabrieken ontwerpen en valideren voordat ze ook maar één rack bestellen. Ze plannen lay-outs, simuleren stroom en koeling, ontwerpen netwerken en testen elke wijziging in een digitale tweeling.

DSX OS voorziet, bedient, monitort en herstelt infrastructuur, waardoor geïnstalleerde systemen worden omgezet in vertrouwde, multi-tenant, veerkrachtige AI-ready capaciteit. Doorbraken zijn onder meer DSX MaxLPS, waarmee operators meer GPU's binnen hetzelfde stroombudget kunnen inzetten door overprovisioning te verlagen van 40 procent naar bijna nul, wat miljarden aan jaarlijkse omzet toevoegt. Vloeistofkoeling bij 45 graden Celsius verbruikt minder water en energie. Dynamische stroomtoewijzing verdeelt stroom tussen racks en wint 'gestrande' watts terug. AI-agentteams coördineren continu om koeling en stroom in balans te brengen om aan de werklast te voldoen.

Huang liet zien hoe DSX AI-fabrieken fungeren als flexibele energie-assets die coöperatief samenwerken met het elektriciteitsnet. DSX Flex leest real-time netwerksignalen en past het stroomverbruik dynamisch aan wanneer het net ontlasting nodig heeft. Met 100 gigawatt aan AI-fabrieken die voor het einde van het decennium online worden verwacht, vertalen deze efficiëntieverbeteringen zich in enorme economische voordelen.

De vier factoren voor concurrentievoordeel

Huang presenteerde wat hij beschouwt als het definitieve kader voor het evalueren van investeringen in AI-infrastructuur. Hij toonde een curve die laat zien hoe snel infrastructuur online komt, wat de doorvoersnelheid, betrouwbaarheid en nuttige levensduur zijn. Omdat deze systemen 50 tot 100 miljard dollar kosten, heeft elke factor een dramatische impact op het rendement.

De tijd tot de eerste token ('time to first token') is enorm belangrijk. NVIDIA's volledig geïntegreerde aanpak – waarbij elk onderdeel is mee-ontworpen en het hele systeem wordt gesimuleerd – maakt een veel snellere implementatie mogelijk dan bij concurrenten. Het bedrijf heeft zelf voor miljarden dollars aan infrastructuur gebouwd om te garanderen dat alles correct werkt.

Doorvoersnelheid per watt is omzet. Wanneer een datacenter een capaciteit van één gigawatt heeft, is dat het maximum. Elke token is winstgevend, dus doorvoersnelheid per watt staat direct gelijk aan omzet. Huang benadrukte dat het kiezen voor goedkopere chips zonder rekening te houden met prestaties per watt economisch irrationeel is. Hij stelde nadrukkelijk: hoe meer je koopt, hoe meer je verdient.

Betrouwbaarheid – gemeten als de gemiddelde tijd tussen interrupties – is op grote schaal extreem waardevol. Datacenters bevatten miljoenen kabels en componenten. NVIDIA's ervaring met operaties op zeer grote schaal gedurende vele jaren creëert een aanzienlijk voordeel in harmonieuze, betrouwbare werking.

De levensduur van het systeem zorgt voor de meest dramatische verschillen. In de vier jaar sinds de introductie van Hopper is AI volledig veranderd. Zes jaar geleden, tijdens Ampere, zag AI er totaal anders uit. De industrie verschoof van CNN's naar Transformers, naar 'mixture of experts', naar agent-gebaseerde systemen. Als de architectuur niet flexibel is en het ecosysteem niet rijk, is de nuttige levensduur van de asset kort. Omdat NVIDIA-systemen wereldwijd opereren en softwareontwikkelaars met CUDA beginnen, garandeert het ecosysteem een lange levensduur en lage totale eigendomskosten.

Vera Rubin: Aankondiging volledige productie

Huang kondigde aan dat Vera Rubin nu in volle productie is – een uitspraak die op aanhoudend applaus werd onthaald. De toeleveringsketen die NVIDIA voor Vera Rubin heeft opgezet, is twee keer zo groot als die voor Grace Blackwell. De productiecapaciteit is dramatisch verbeterd: assemblage die voorheen twee uur per Grace Blackwell-rack kostte, duurt nu vijf minuten. Miljoenen vierkante meters aan productiecapaciteit zijn online gekomen om Grace Blackwell te ondersteunen en worden nu opgeschaald voor Vera Rubin.

De videopresentatie gaf details over het productiewonder in de toeleveringsketen. De zeven nieuwe chips die Vera Rubin vormen, ondergaan honderden verwerkingsstappen bij TSMC met behulp van drie-nanometer procestechnologie, CoWoS advanced packaging en HBM4-geheugen van Micron, SK Hynix en Samsung. De Vera Rubin GPU bevat zes biljoen transistors met meer dan 18.000 componenten op één bord.

Vera Rubin NVL72 regelt het denkwerk – promptverwerking, contextbegrip, redenering en planning. Een nieuwe modulaire compute-tray beschikt over een gestroomlijnde PCB-midplane. ConnectX-9, SuperNICs en BlueField-4 DPU's zijn onderhoudsvriendelijk toegankelijk zonder kabels voor veerkracht en schaalbaarheid. Achttien compute-trays en negen hot-swappable NVLink switch-trays zijn verbonden via nieuwe, uiterst efficiënte vloeistofgekoelde busbars die meer dan 5.000 ampère transporteren – gelijk aan 20 elektrische auto's bij volledige acceleratie. In totaal vormen 1,3 miljoen componenten het derde-generatie MGX-rack.

Huang feliciteerde Microsoft, Dell en CoreWeave met het operationeel krijgen van Vera Rubin NVL72 engineering-racks. Het Vera CPU-rack bevat 256 CPU's in één vloeistofgekoeld rack, die modellen orkestreren, geheugen verplaatsen en tools lanceren. Foxconn en Quanta produceerden het Vera LPX-rack met 256 Groq LPU's verdeeld over 16 trays, wat 40 petabyte per seconde aan SRAM-bandbreedte levert voor ultra-lage latentie. Terwijl NVL72 tokens genereert met de hoogste doorvoersnelheid, genereert LPX ze met de laagste latentie.

Vera BlueField-4 STX dient als AI-geheugenopslag – opslagverwerking versneld door BlueField-4, die geheugen, opslag en in-silicon security verbindt. NVIDIA Spectrum-X Ethernet Photonics is 's werelds eerste Ethernet-switch met 200-gigabit co-packaged optica, gebruikmakend van het TSMC CoWoS-proces, chip-scale packaging en ultra-high-powered laser-dies op indiumfosfide.

Het complete systeem bestaat uit vijf verbonden rack-scale systemen. Het betrof 150 partners in de toeleveringsketen in Taiwan en miljoenen vierkante meters fabrieksvloer op honderden locaties. Huang benadrukte dat Vera Rubin niet alleen is gebouwd om AI te draaien, maar specifiek om agents te draaien. De complexiteit van de agent-architectuur vertegenwoordigt de laatste grote doorbraak in de informatica, waarvoor het meest geavanceerde computersysteem ter wereld nodig is.

Vera Rubin hardware-demonstratie

Fysieke racksystemen werden op het podium getoond voor inspectie. Huang liet de Vera Rubin NVL72 zien, het LPX-rack, het Vera CPU-rack met 256 vloeistofgekoelde CPU's, het Vera BlueField-opslagverwerkings- en securitysysteem, en de Mellanox-netwerken met 's werelds eerste co-packaged optica.

Het ontwerp elimineert kabels, slangen en ventilatoren. Een PCB-midplane verbindt beide zijden van wat voorheen uitgebreide bekabeling vereiste. De verbeteringen in betrouwbaarheid en veerkracht zijn aanzienlijk. Huang toonde de Vera CPU-tray en opslagtray met twee Vera CPU's, vier ConnectX-9-units en enorme opslagcapaciteit. Het Groq LPX-rack biedt zeer lage latentie-inferentie, wat de doorvoermogelijkheden van Vera Rubin uitbreidt. De NVLink switch-tray vertegenwoordigt revolutionaire technologie die NVIDIA in staat stelt het grootste netwerkbedrijf ter wereld te worden.

NVIDIA Vera CPU: Computing voor agents

Huang introduceerde de Vera CPU als fundamenteel anders dan alle voorgaande processors. Traditionele CPU's werden gemaakt voor mensen die in een wereld leven die in seconden wordt geteld, met cloud-economie gebaseerd op het huren van CPU-cores per uur. Agents leven in een wereld die in nanoseconden wordt geteld. Ze zijn ongeduldig. Wanneer agents tools gebruiken of databases benaderen, verhindert elk moment van wachten hen om naar de volgende stap te gaan. CPU's zo latentie-arm en interactief mogelijk maken is essentieel.

Binnen Vera Rubin-systemen vervullen CPU's drie functies. Twee CPU's in elk Vera Rubin-rack orkestreren en beheren GPU's, beheren de KV-cache en regelen rack-software. Grace BlueField CPU's bieden security en isolatie. Vera compute CPU's verwerken de harness, de orkestratie van AI-modellen, het gebruik van tools en databasetoegang. Vera BlueField CPU's drijven de snelste opslagservers ooit aan.

Deze systemen bevinden zich op het kritieke pad van het duurste onderdeel van het datacenter. De economie draait om token-generatie en de CPU-infrastructuur mag deze primaire functie niet hinderen. Dit vereiste dat NVIDIA vanaf nul een volledig nieuwe architectuur bouwde – een CPU die de wereld nog nooit heeft gezien, gebouwd voor agents in plaats van mensen.

Huang schetste vier bepalende kenmerken. Ten eerste moet het aantal instructies per klokslag (IPC) ongelooflijk hoog zijn omdat de latentie kort moet zijn. Single-threaded prestaties, niet doorvoersnelheid, moeten van wereldklasse zijn. Vera behaalt de hoogste IPC ter wereld door 10 instructies per klokslag op te halen, te decoderen en uit te voeren.

Ten tweede moet de bandbreedte per core uitzonderlijk zijn voor het snel verplaatsen van data in en uit de CPU. Ten derde moet de totale bandbreedte door het hele systeem van wereldklasse zijn. Omdat agent-gebaseerde systemen fundamenteel gedisaggregeerd en gedistribueerd zijn, wordt netwerken de centrale uitdaging. Data moet zo snel mogelijk bewegen tussen CPU-cores, tussen CPU en opslag, en tussen CPU en GPU. De bandbreedte rond en in het systeem moet alle eerdere standaarden overtreffen.

Vera is de eerste CPU gebouwd op radicale limieten met een fabric die alle CPU-cores verbindt met de snelheid van het licht – 3,6 terabyte per seconde zonder grensoverschrijdingen. Alle CPU-cores communiceren met extreem hoge bandbreedte en werken samen in plaats van individueel te worden gehuurd. De cross-sectionele bandbreedte is ongekend. Vera is de eerste CPU die PCIe Gen 6 en LPDDR5 gebruikt met 1,2 terabyte per seconde – twee tot drie keer de bandbreedte van de best presterende CPU's op de markt.

Ten vierde is energie-efficiëntie cruciaal. Het aantal CPU's zal vrij hoog zijn omdat er miljarden agents zullen zijn in vergelijking met slechts één miljard mensen die traditionele CPU's gebruiken. Agents gebruiken CPU's met weinig geduld omdat de kosten van aangrenzende GPU's te hoog en te waardevol zijn. CPU's moeten zowel performant als extreem energiezuinig zijn om CPU-inzet te maximaliseren zonder stroom weg te nemen van de token-generatie.

Vergeleken met de best presterende x86-processors zijn de verbeteringen in de echte single-threaded prestaties van Vera buitengewoon. Huang merkte op dat een verbetering van vijf procent op CPU's ongelooflijk is, tien procent opmerkelijk, maar de snelheidsverhogingen van Vera zijn simpelweg ongehoord.

Vera CPU-prestatiebenchmarks

De videopresentatie gaf details over de NVIDIA Olympus-core in het hart van Vera, specifiek gebouwd voor moderne datacenter-werklasten, inclusief branch-zware Python-runtimes, tool-calls en sandbox-code-executie. Elke core is afgestemd op doorvoersnelheid met een neurale branch-predictor die twee genomen branches per cyclus evalueert, een 10-wide decode-engine die elke cyclus meer werk binnenhaalt, een grote out-of-order engine die instructies in beweging houdt, en geavanceerde prefetchers met een nieuwe graph-engine die de volgende data-opvraag anticipeert.

Vera is de eerste CPU die LPDDR5X-geheugen gebruikt terwijl deze meerdere fouten tegelijkertijd corrigeert zonder de bandbreedte in gevaar te brengen. Het behaalt 40 procent lagere piekgeheugen-latentie versus x86, waardoor cores gevoed blijven tijdens opvraging, analytics en sandbox-executie. NVIDIA's tweede-generatie schaalbare coherentie-fabric verenigt alle 88 Olympus-cores op een monolithisch mesh. Geheugen en cores zijn niet verdeeld over chiplets, wat 50 procent snellere communicatie tussen cores mogelijk maakt dan bij traditionele CPU's. Geheugen-coherente NVLink chip-to-chip verbindt GPU's direct met de CPU en kan Vera schalen naar meerdere sockets voor enorme inter-CPU bandbreedte.

Huang presenteerde benchmarkresultaten die het publiek versteld deden staan. SQL – de beroemdste domeinspecifieke taal ooit gemaakt – draait drie keer sneller op Vera, niet 10 of 25 procent sneller. Voor real-time streamverwerking, met name belangrijk voor fabrieken en effectenbeurzen, levert Vera een zesvoudige snelheidsverhoging. Hij benadrukte de samenwerking met Lynn Martin, president van de New York Stock Exchange, en merkte op dat dit systeem wereldwijd in real-time draait.

Deze x-factor verbeteringen op echte werklasten zijn zeldzaam voor CPU's. Huang sprak zijn trots uit over de prestatie van het team en gaf een voorproefje van een buitengewone roadmap. Partnerships met early adopters beslaan de hele industrie, waarbij Taiwanese ODM's en computerfabrikanten systemen op de markt brengen. De early adopters zijn agent-gebaseerde bedrijven, wat het begin markeert van een nieuwe markt die voorheen niet bestond – CPU's voor agents in plaats van mensen. Deze markt zal zeker groter zijn dan eerdere CPU-markten omdat er veel meer agents dan mensen zullen zijn, en agents zijn erg ongeduldig.

De NVIDIA Agent Toolkit voor Enterprise AI

Huang benadrukte dat het applicatiepatroon dat hij beschreef – agents met harnesses die large language models orkestreren – het komende decennium van computing zal bepalen. Elk bedrijf zal een agent-bedrijf worden met agents die intern draaien. Elk bedrijf zal besturingssystemen voor agents nodig hebben en zich afvragen hoe ze agents veilig kunnen draaien en agents voor hun werklasten kunnen bouwen.

De NVIDIA Agent Toolkit voor Enterprise AI voorziet in deze behoeften. Huang merkte op dat NVIDIA alles in het volle zicht bouwt – bij het bekijken van eerdere GTC's blijkt dat de aankondigingen van vandaag jaren geleden al werden aangekondigd. Hij bespreekt deze toolkit al enkele jaren en heeft naar dit moment toegewerkt.

Bedrijven hebben vier dingen nodig om agents als services te bouwen of intern te bedienen. Ten eerste modellen – large language models die slim, goedkoop en snel zijn. Ten tweede een harness om alles te orkestreren. Ten derde tools die modellen willen gebruiken, samen met vaardigheden. De CUDA-X-bibliotheken zullen geweldige tools worden voor toekomstige agents. Ten vierde een runtime – het besturingssysteem dat alles bij elkaar houdt.

De toolkit bevat modellen die gebruikers kunnen aanpassen, evenals diverse wereldklasse open modellen, met meer in het vooruitzicht. Het draait agents van elke provider – Claude Code, Codex of andere – binnen NVIDIA OpenShell, een uiterst veilige harness voor zakelijk gebruik. OpenShell beschermt agents, houdt ze verankerd in veiligheidsbeleid, beschermt privacy, verleent passende rechten en privileges, en beschermt identiteit. Deze open-source harness wordt wereldwijd geadopteerd door Red Hat, Canonical, Microsoft en vele anderen.

De runtime is volledig geoptimaliseerd voor het NVIDIA AI-platform, dat overal aanwezig is. OpenShell draait in elke cloud, on-premises en zelfs op apparaten. Gebruikers hebben tools en bibliotheken die agents kunnen gebruiken, modellen om aan te passen of als zodanig te gebruiken, en agent-harnesses zoals OpenClaw en Hermes. Deze kunnen on-premises of waar dan ook draaien. Dit vertegenwoordigt het besturingssysteem van de moderne onderneming.

Cadence Chip Design Super Agent

Een van Huangs favoriete use-cases betreft chipontwerpers, wat hij het allerbelangrijkste noemde wat NVIDIA doet. Het bedrijf werkte samen met Cadence om een chipontwerp-superagent te bouwen, georkestreerd door Codex of Claude Code. Het verwerkt RTL- en architectuurdiagrammen, schema's of specificaties als input, samen met alles wat reparatie behoeft. Samen creëerden ze superagents die zijn geoptimaliseerd voor het NVIDIA-platform met Nemotron.

De demonstratie liet zien hoe honderdduizenden NVIDIA-chips samenkomen om AI-fabrieken te maken die 's werelds frontier AI-modellen aandrijven. Het ontwerpen van deze chips en hun systemen vormt een van de zwaarste technische uitdagingen – biljoenen transistors in driedimensionale circuits op microscopische schaal, waarbij elke gate en draad op picoseconden is gesynchroniseerd en in perfecte harmonie samenwerkt zonder foutmarge.

Fysieke prototypes zijn te traag en kostbaar, dus werken ingenieurs digitaal. Elke chip begint als architecturale specificatie vertaald naar RTL – de taal van chipontwerp. RTL moet worden geverifieerd in simulatie. Een enkele bug kan een chip met maanden vertragen. Bij NVIDIA besteden duizenden ingenieurs jaarlijks miljarden compute-uren aan het schrijven, draaien en debuggen van miljoenen tests in een cyclus die teams weken kost.

Om deze cyclus in te korten, bouwden Cadence en NVIDIA een ontwerp-verificatieagent. Codex orkestreert het proces. Cadence Chip Stack lanceert de RTL-verificatielus, aangedreven door Nemotron en beveiligd door OpenShell, waarbij expert-subagents worden opgeroepen voor RTL-generatie, testbench-creatie, regressietesten en debugging. Het systeem stuurt zichzelf aan, voert honderden simulaties uit met Cadence Xcelium en formele verificatie met JasperGold. Ontwerpfouten worden onthuld en code-bugs hersteld. Wat voorheen weken duurde, duurt nu uren – verificatiecycli zijn meer dan 40 keer sneller.

Huang benadrukte de implicaties: van weken naar uren. NVIDIA heeft duizenden chipontwerpers en zal honderdduizenden Cadence-superagents inhuren om het bedrijf te versnellen, wat grotere ambities, meer geweldige creaties en snellere uitvoering mogelijk maakt.

Nemotron 3 Ultra: Het fundamentmodel

De agent-toolkit begint met uitstekende modellen die partners zoals Cadence kunnen aanpassen en tunen voor hun expertise, waardoor ze eigen superagents met bedrijfseigen kennis creëren. Huang introduceerde Nemotron 3 Ultra, NVIDIA's volgende open model dat zich toelegt op het bouwen van open modellen voor de wereld, zodat iedereen zijn eigen agents kan creëren.

Nemotron-modellen bieden niet alleen het model, maar ook alle trainingsdata en trainingsscripts. Via een coalitie van geweldige partners die data aan elkaar bijdragen, traint Nemotron op een van de grootste suites van langlopende redeneermodellen en datasets voor het oplossen van taken en het gebruik van tools ter wereld. Alles – model, trainingsscripts en data – is volledig beschikbaar gesteld. Dit is open modellen op hun best, het beste open modelsysteem ter wereld, met het simpele doel gebruikers in staat te stellen alles te nemen, aan te vullen, te verbeteren en het zich eigen te maken.

Nemotron 3 Ultra is vijf keer sneller dan voorgaande modellen – 's werelds eerste model gebaseerd op een hybride architectuur van State Space Models met Mixture of Experts. De architectuur is ongelooflijk snel, zodat gebruikers snel kunnen denken. Wanneer ze snel denken, kunnen ze langer denken tegen dezelfde kosten. Het is ook 30 procent goedkoper en vereist 30 procent lagere kosten in totale FLOPs en totale inferentietijd dan zelfs de meest kostenefficiënte modellen ter wereld. Het is frontier-slim, vijf keer sneller, 30 procent goedkoper en volledig open. NVIDIA zet volledig in op deze richting. Nemotron 3 is actueel, Nemotron 4 is in ontwikkeling.

Ecosysteem van enterprise softwarepartners

Huang ging in op de misvatting dat agents bestaande enterprise-softwaremarkten zouden verstoren. Hij stelde nadrukkelijk: precies het tegenovergestelde. De toolkit stelt bedrijven als Cadence, CrowdStrike, ServiceNow, Palantir en SAP in staat de grootste kans ooit te creëren. Agents zullen zorgen voor een ongekende vraag naar enterprise-softwaremogelijkheden, aangeboden als tools die agents kunnen gebruiken.

De drie belangrijkste aankondigingen tot nu toe: Vera Rubin in volle productie, Vera CPU gebouwd voor een nieuwe generatie computing met agents, en de NVIDIA Enterprise AI Toolkit die elk bedrijf en elke enterprise-softwareleverancier in staat stelt agents te bouwen.

De personal computer opnieuw uitvinden

Huangs relatie met Taiwan en vele partners begon 40 jaar geleden met de pc-revolutie. De moderne computerindustrie begon in Taiwan met Windows 1, Windows 2, Apple 1 en Apple 2. Tegen de tijd dat NVIDIA 33 jaar geleden arriveerde, definieerde Windows 3.1 de pc. Windows 95 maakte de pc persoonlijk en transformeerde deze van een zakelijke tool naar een consumentenelektronica-apparaat dat iedereen zou moeten hebben.

Dat computing-platform slaagde door intelligent ontwerp. Windows was niet alleen gedisaggregeerd, maar correct geabstraheerd met de juiste architectuur – systeem-BIOS, open chipsets, het besturingssysteem met drivers die tijdens runtime installeerbaar zijn, en een abstractielaag met multimedia-API's die de pc openden voor wat we vandaag de dag kennen. Elk element was essentieel voor de populariteit van de pc.

Veertig jaar later vinden Microsoft en NVIDIA de pc opnieuw uit. Huang gaf een voorproefje van een gesprek met Satya Nadella dat de volgende avond gepland stond om hun samenwerking toe te lichten. Het kostte drie jaar om volledig opnieuw uit te vinden hoe de pc zal werken om klaar te zijn voor dit moment.

Het agent-computingpatroon zal draaien in AI-clouds, binnen ondernemingen en op pc's. Wanneer een pc een autonome agent heeft die de gebruiker begrijpt, kan worden toegesproken, naar de gebruiker kan kijken en kan worden gevraagd om zaken te archiveren, onderzoek te doen en vele andere taken uit te voeren, wat gebeurt er dan met die pc? Het nieuwe besturingssysteem is het oude besturingssysteem plus large language models. Large language models zijn de moderne versie van DirectX – een intelligentie-extensie van de pc met input en output, die prompts en computervisie begrijpt en video en geluid genereert. De applicatielaag wordt vervangen door een agent-gebaseerde runtime. De agent is de moderne applicatie.

Introductie van NVIDIA RTX Spark

De videopresentatie introduceerde RTX Spark als het hoogtepunt van 33 jaar leren van NVIDIA, gedistilleerd in één chip – een heruitvinding van de pc voor het tijdperk van AI. Agents die native draaien, verbonden met lokale of cloud-modellen, worden persoonlijke AI's die voor de veiligheid in een sandbox draaien, continu werken en taken voltooien. De chips en het besturingssysteem moeten samen evolueren.

RTX Spark bevat een Blackwell RTX GPU met 6.144 Tensor Cores die één petaflop aan AI-prestaties levert. Een aangepaste 20-core Grace CPU werd gebouwd in samenwerking met MediaTek, gefuseerd door NVLink met 128 gigabyte aan verenigd geheugen. Met behulp van TSMC's drie-nanometer proces bevat het 70 miljard transistors. In nauwe samenwerking met Microsoft werd een Windows-platform voor agents gecreëerd. Dit is het begin van een nieuwe revolutie in personal computing, beginnend met RTX Spark.

Huang benadrukte dat dit de mooiste chip ooit is, gemaakt in samenwerking met MediaTek. Hij merkte op dat hij Rick Tsai in het publiek zag. De chip is buitengewoon omdat het 33 jaar duurde om hem te bouwen, in de zin dat 100 procent van de NVIDIA-software erop draait. Digitale biologie, seismische verwerking, astrofysica, alle CUDA-gerelateerde fysica, biologie, genomics, AI en computergraphics werken zonder problemen. Elke applicatie die NVIDIA ooit heeft gemaakt en elke applicatie die Windows ooit heeft gedraaid, werkt op dit systeem. Microsoft en NVIDIA hebben alles nauwgezet geoptimaliseerd, zodat deze computer letterlijk alles draait wat de wereld ooit heeft gecreëerd, plus agents.

Het systeem kan een lokaal Nemotron 3 Ultra-model, Nemotron 3, Claude Code, Codex of andere modellen in de cloud of op het netwerk draaien. Een demonstratie toonde een architecturale ontwerpworkflow waarbij een agent die lokaal op RTX Spark draait, helpt bij het ontwerpen van een huis met laptop-tools. Met een OpenShell-sandbox die de Hermes-harness draait, verbonden met Claude Sonnet in de cloud, selecteert de gebruiker een locatie, deelt conceptschetsen en moodboards, en geeft een tekstuele beschrijving van de vereisten en ontwerpintentie.

De agent opent Rhino en modelleert de locatie, geeft vorm aan terrein, afstanden en bouwvolume. Het stelt bouwvormen voor die zijn geoptimaliseerd voor kosten, comfort en kwaliteit. Met de vorm gedefinieerd, genereert het de indeling van het interieur met muren, circulatie en kamers. De gebruiker kan op elk moment ingrijpen om aanpassingen te doen of wijzigingen aan te brengen. Deuren, ramen en structurele elementen worden automatisch geplaatst. De agent detecteert zijn eigen fouten en herstelt ze. Wanneer goedgekeurd, exporteert hij het model vanuit Rhino naar Blender, waarbij materialen en objecteigenschappen met behoud van ontwerpcontext worden overgedragen. De gebruiker finetunet materialen en kiest opnames. Blender rendert het huis. De agent gebruikt generatieve AI met het Flux 2-model om renders fotorealistisch te maken met meerdere standpunten en lichtomstandigheden. Wat ooit een complexe workflow was, wordt nu begeleid en vereenvoudigd door een agent die op RTX Spark werkt – ontworpen met de snelheid van de verbeelding.

Adobe-partnership en industriële steun

Ontwikkelaars zijn enthousiast over de mogelijkheden van RTX Spark – versnelling, softwaremogelijkheden en partnerships die het voor iedereen ongelooflijk maken. Adobe heeft de architectuur en de kern van Photoshop en Premiere opnieuw ontworpen voor RTX Spark, wat twee keer de snelheid oplevert. De applicaties zijn al snel en zullen nu twee keer zo snel zijn. Ze zijn ook ontworpen om agent-vriendelijk te zijn met MCP-servers die kunnen interageren met agents op de laptop.

Het aantal partners dat RTX Spark op de markt brengt, is buitengewoon. Huang noemde dit de eerste grote pc-heruitvinding in 40 jaar. Hij sprak zijn blijdschap uit dat het wereldwijde ecosysteem zich bij dit streven heeft aangesloten. In essentie zal elke grote pc-fabrikant RTX Spark ondersteunen en ongelooflijk slimme, krachtige en mooie laptops bouwen.

Volledige heruitvinding van de pc-lijn

RTX Spark vertegenwoordigt de heruitvinding van de laptop, maar Microsoft en NVIDIA vinden de hele pc opnieuw uit. Huang kondigde een geheel nieuwe lijn aan – drie revolutionaire Windows-machines voor desktop, laptop en workstation – allemaal 100 procent Windows-compatibel, 100 procent CUDA, 100 procent NVIDIA AI Tensor Core. Alles wat op NVIDIA draait op platforms over de hele wereld, draait op deze systemen. Dit is de eerste volledig opnieuw ontworpen, opnieuw uitgevonden lijn pc's in 40 jaar.

Het desktopsysteem van MSI kan 24/7 agents draaien zonder meter-restricties. Gebruikers kunnen agents downloaden die continu draaien zonder angst voor verbruikskosten. Het systeem verbindt door het hele huis – met laptops, displays, camera's, apparaten, boilers, beveiligingssystemen. Het wordt een persoonlijke AI-agent die na verloop van tijd slimmer wordt naarmate Nemotron evolueert door versies 3, 4, 5, 6 en verder. De agent zit thuis en helpt bij taken zoals het boeken van reizen.

Het DGX Station vertegenwoordigt de workstation-oplossing – compatibel met Windows, draait alles in Windows, met 768 gigabyte aan geheugen, wat de uitvoering van modellen met biljoenen parameters mogelijk maakt. Dit is een ongekende mogelijkheid. Met 20 petaflops en acht terabyte per seconde geheugenbandbreedte staat dit systeem naast het bureau van de ontwikkelaar. Voor ontwikkelaars van large language models en agents biedt deze rekenkracht op het bureau alles wat nodig is voor ontwikkeling, waarna cloud-implementatie volgt.

De toekomst van personal computing

Huang trok een vergelijking met telefoons van 15 tot 20 jaar geleden. De telefoon van vandaag wordt voor bijna alles gebruikt behalve voor bellen – het betekent iets heel anders dan in het verleden. Hij is er zeker van dat de pc een soortgelijke transformatie zal ondergaan. Over 10 jaar zal de pc totaal anders zijn dan de huidige tool waarbij je applicaties opstart, klikt en typt.

Huang theoretiseerde dat, net zoals elk huis tegenwoordig home-theaters, grote tv's, grasmaaiers en vaatwassers heeft, er op een dag AI-supercomputers in huizen zullen staan die alle agents en assistenten draaien en continu allerlei dingen doen. Mensen zullen AI-agentcomputers in hun huizen willen hebben. Na verloop van tijd lijken deze meer op R2-D2 of C-3PO – meer op metgezellen dan op pc's.

Er is geen twijfel dat deze heruitvinding van de computer even significant is als de heruitvinding van de telefoon tot de smartphone. Dit is het begin van die reis, het begin van een nieuwe productlijn. NVIDIA heeft een roadmap voor deze gloednieuwe productfamilie. Elke generatie architectuur zal een desktop, laptop en workstation bevatten.

Huang sprak zijn grote tevredenheid en eer uit dat 100 procent van de wereldwijde pc-industrie zich bij NVIDIA heeft aangesloten om de pc opnieuw uit te vinden – een nieuwe lijn, een nieuw begin.

Fysieke AI en het Cosmos 3-fundamentmodel

Agent-gebaseerde AI is in essentie een digitale robot die begrijpt, redeneert, plant, handelt en tools gebruikt. Agent-gebaseerde AI zal op alle computers draaien – humanoïde robotica-computers, robotica-computers van alle soorten, zelfrijdende autocomputers, satellieten, GeForce-systemen, de nieuwe pc-lijn, landbouwapparatuur, productieapparatuur, zware industriële apparatuur. Zelfs basisstations – radiostations van de toekomst – zullen agent-gebaseerd zijn, verkeer begrijpen en coördineren met andere stations om het energieverbruik te minimaliseren en tegelijkertijd de spectrale efficiëntie te verhogen.

Alles zal agents draaien. Vandaag de dag is NVIDIA grotendeels aanwezig in het datacenter, maar Huang is er zeker van dat er wereldwijd tientallen miljarden, en uiteindelijk honderden miljarden, agent-gebaseerde systemen en computers zullen draaien.

Het grootste probleem is data. Voor taalmodellen was alle Engelse taal op het internet die voor training werd gebruikt, geschreven vanuit een menselijk perspectief – wij schreven en lazen het. Echter, het creëren van data voor AI-robotica vereist het perspectief van de robot. Het meeste videodata in de wereld is vanuit derdepersoonsperspectief, niet vanuit de eerste persoon. Voor agent-gebaseerde systemen, robotica-systemen en fysieke AI is data het moeilijkste probleem.

NVIDIA is opgeklommen op een ladder die begint bij teleoperatie – menselijke demonstratie vergelijkbaar met de doorbraak van reinforcement learning op basis van menselijke feedback. Simulatie met Omniverse maakt reinforcement learning met verifieerbare beloningen mogelijk. Deze systemen bootstappen AI-modellen – fysieke AI-modellen. Uiteindelijk kan leren van derdepersoonsdata worden geprojecteerd naar de eerste persoon. Door bootstrapping ontstaat een Wereld-fundamentmodel dat de fysieke wereld vanuit elk perspectief begrijpt – derdepersoon, eerste persoon, van binnen en van buiten. Dit vertegenwoordigt een grote doorbraak.

Huang kondigde Cosmos 3 aan als de frontier van fysieke AI. Terwijl veel mensen aan taalmodellen werken, is NVIDIA absoluut de beste ter wereld in fysieke AI. Dit is het fundamentmodel voor al het robotica-werk. Iedereen die een robot wil creëren – fabrieksrobots, robots die in fabrieken werken, elk type robot dat de fysieke wereld betreft – heeft nu een metgezel in Cosmos 3 die kan begrijpen en redeneren. Het kan genereren, simuleren en in de loop kan het zelfs het beleid zelf zijn. Het voert wereldwijd ranglijsten aan.

De video legde uit hoe de echte wereld oneindig en onvoorspelbaar is. Fysieke AI heeft data nodig, maar echte data is onmogelijk te schalen. Voor fysieke AI is compute data. Cosmos is een open frontier omni-model voor fysieke AI, gebouwd op een nieuwe Mixture of Transformers-architectuur. Pixels, actie, geluid en taal stromen in de autoregressieve transformer, die redeneert, plant en de diffusie-transformer instrueert die genereert wat er daarna komt.

Ontwikkelaars trainen Cosmos na (post-training) over verschillende embodimenten en use-cases heen. Als VLM kijkt Cosmos naar de fysieke wereld, begrijpt wat er gebeurt, beschrijft scènes en markeert wat belangrijk is. Als wereldmodel genereert Cosmos fysica-accurate synthetische video op basis van een afbeelding, tekst of video. Als simulator sluit Cosmos de lus voor beleidstraining en evaluatie. Als fundament van NVIDIA OmniDreams – een actie-geconditioneerd wereldmodel – voorspelt Cosmos de toekomst frame voor frame.

Post-training transformeert Cosmos in een wereld-actiemodel – waarnemen, redeneren, plannen, acties genereren voor robots van elke soort, voor alles wat beweegt. Dit vertegenwoordigt een nieuw soort data, een nieuw soort leraar gegenereerd door compute. Cosmos biedt het fundament voor ontwikkelaars in het tijdperk van fysieke AI.

Net zoals tekstdata plus compute AI geeft, is compute nu data nu we AI hebben. Gebruik Cosmos 3 om modellen te trainen. Cosmos is een open modelsysteem precies zoals Nemotron – open model, open data, open trainingsmethodologie zodat gebruikers het kunnen verbeteren en Cosmos tot hun eigen bedrijfseigen model kunnen maken. NVIDIA heeft geweldige partners die in veel verschillende industrieën werken.

Alpamayo 2 Super voor autonome voertuigen

Huang kondigde Alpamayo 2 Super aan, een open model voor zelfrijdende auto's. NVIDIA werkt samen met autobedrijven over de hele wereld. Merken die zich hebben aangemeld voor NVIDIA DRIVE Hyperion – en DRIVE Hyperion-auto's bouwen – vertegenwoordigen ongeveer 80 procent van de wereldwijde autofabrikanten. Er zullen enorme aantallen DRIVE Hyperion-systemen zijn die Alpamayo 2 Super of elke andere NVIDIA-stack kunnen draaien. NVIDIA verbindt ook met ongeveer 97 procent van de wereldwijde mobiliteitsdiensten, dus bij het implementeren van Alpamayo 2 Super op de DRIVE Hyperion-runtime met het Halos-besturingssysteem, zal het wereldwijd met al deze diensten verbinden.

De demonstratie toonde een autonoom Mercedes-voertuig dat complexe scenario's navigeert. De auto legt verbaal zijn redenering uit: wegrijden wanneer de rijstrook vrij is, naar links opschuiven vanwege stilstaande voertuigen die rijstroken blokkeren, stoppen bij stopborden en kruispunten, voorrang verlenen aan voetgangers, afstand houden van invoegende voertuigen, rijstrookstromen afhandelen, afstand houden van vrachtwagens, navigeren rond obstakels. De aankondiging van de bestemming sluit de demonstratie af. Hoewel continue verbale output vervelend zou zijn voor passagiers, vertegenwoordigt de continue interne dialoog het denken – Alpamayo 2 Super is een redenerende auto.

Isaac GR00T-platform en referentierobot

De technologie die voor autonome voertuigen is gecreëerd, is van toepassing op humanoïden, hoewel er nog veel nieuwe doorbraken moeten plaatsvinden. NVIDIA Isaac GR00T is de humanoïde robotica-stack – model, datageneratie, simulatie en runtime inclusief besturingssysteem. Dit vertegenwoordigt het complete GR00T-platform.

Elk NVIDIA-systeem volgt exact dezelfde architectuur, of het nu gaat om agent-gebaseerde systemen in de cloud, agent-gebaseerde systemen voor pc's, robotica-systemen voor zelfrijdende auto's of robotica-systemen voor humanoïde robots. In elk geval bouwt NVIDIA alles volledig met verticale integratie, volledige integratie, co-design en extreme co-design. Wanneer het voor iedereen wordt opengesteld om te gebruiken – welke onderdelen men ook wenst, wat gebruikers ook willen – helpt NVIDIA zelfs met aanpassingen.

Wat ontbrak, is een referentieplatform voor robotica-systemen. Deze systemen zijn extreem ingewikkeld met veel motoren en sensoren, maar erg kwetsbaar. NVIDIA heeft een manier nodig om referentieplatforms te leveren, net zoals het doet met pc's, DGX'en, clouds en zelfrijdende auto's. Nu doet NVIDIA dit voor robots.

Huang kondigde de NVIDIA Isaac GR00T referentie-humanoïde robot aan – volledig geïntegreerd. Elke hand heeft 25 vrijheidsgraden, gemaakt door Sharpa. De robot heeft 31 vrijheidsgraden, is 1,80 meter lang en weegt 68 kilo. Huang grapte dat hij het eerste kenmerk deelt (dichter bij 1,80 meter) en het tweede (dichter bij 68 kilo), hoewel de specifieke cijfers variëren. Dit platform draait op de nieuwe Jetson Thor en NVIDIA's volledige softwarestack – datageneratiestack, datasimulatiestack en runtime – allemaal geïntegreerd in een robot die voor iedereen is ontworpen om te gebruiken. Het is gebouwd voor hoger onderwijs en universitaire onderzoekers, omdat het bouwen van dergelijke systemen onafhankelijk waanzinnig moeilijk is.

De video legde uit dat de volgende sprong in AI robots voor algemeen gebruik zijn – humanoïden. Maar er een bouwen is moeilijk. Elk team begint vanaf nul en voegt simulatoren, teleoperatiesystemen, datapijplijnen en trainingsinfrastructuur samen. Maanden van opzet gaan vooraf aan onderzoek.

Isaac GR00T is een open ontwikkelingsplatform voor humanoïde robots – open modellen, simulatie- en trainingsbibliotheken en datageneratoren, plus de robotcomputer volledig vooraf geconfigureerd en binnen enkele uren klaar voor gebruik. Stel eerst de simulatieomgeving in in Isaac Lab. Leg demonstraties vast met Isaac Teleoperation op echte of gesimuleerde robots. Genereer synthetische data met Omniverse en Cosmos, waarbij één demonstratie wordt geschaald naar duizenden. Train beleidslijnen en evalueer ze in Isaac Lab Arena. Implementeer via Isaac ROS draaiend op Jetson Thor.

Elk element is modulair en open – gebruik NVIDIA's componenten of wissel ze in voor alternatieven. GR00T drijft robotica-onderzoek aan in elke discipline voor elk domein, van onderzoekslaboratoria tot fabrieksvloeren. Eén open platform met een nieuwe editie: Isaac GR00T referentie-ontwerprobots gebouwd op NVIDIA's open platform, klaar voor frontier-onderzoek voor elk lab, overal. Het tijdperk van robotica begint hier met NVIDIA Isaac GR00T.

Computing-patroon voor het volgende decennium

Huang vatte de uitgebreide veranderingen in de computerindustrie van de afgelopen zes maanden samen. Alles veranderde omdat agents werden gerealiseerd en samenkwamen met de nieuwste frontier-modellen, waardoor het voor AI nu mogelijk is om nuttig werk te doen.

Het computing-patroon zal zich in alle domeinen herhalen. Dit computing-patroon – een agent met een model, een harness die tools met vaardigheden gebruikt, draaiend in een runtime – is van toepassing, of het nu in een cloud, on-premises, op een pc of in een robot is. De runtime varieert, maar het computing-patroon blijft identiek. Verschillende harnesses en modellen zullen worden gebruikt op basis van voorkeur. Gebruikers zullen ze verbeteren voor eigen gebruik, waardoor superagents ontstaan om aan anderen aan te bieden voor hun werk.

Dit agent-gebaseerde platform, dit agent-gebaseerde patroon – NVIDIA heeft een Enterprise AI Toolkit. Dit is een prachtige manier voor iedereen om met AI aan de slag te gaan en voor NVIDIA vertegenwoordigt het een prachtige groeikans.

Vera Rubin is in volle productie. Terwijl Grace Blackwell werd gecreëerd om AI te verwerken, met name inferentie, werd Vera Rubin gecreëerd om agents te draaien. Het is in volle productie. Het is veel meer dan een GPU – een volledig gedisaggregeerd, gedistribueerd agent-verwerkingssysteem.

NVIDIA is een infrastructuurbedrijf geworden, niet alleen een GPU-bedrijf of systeembedrijf, maar een infrastructuurbedrijf dat helpt om zo snel mogelijk maximale omzet en maximale winst te genereren.

De agent-gebaseerde wereld vereist CPU's die gebouwd zijn voor agents, niet voor mensen. CPU's voor agents hebben speciale vereisten, en NVIDIA Vera is revolutionair. Huang sprak zijn blijdschap uit over de opschaling. Bestellingen zijn al binnen. Het zal de snelste en meest succesvolle productlancering in de geschiedenis van het bedrijf worden.

NVIDIA en Microsoft hebben een geheel nieuwe lijn pc's gecreëerd – een nieuw begin. Hetzelfde agent-gebaseerde computing-patroon zal op allerlei apparaten draaien. Pc's vandaag, maar in de toekomst robots, satellieten, basisstations, fabrieken – in de cloud, on-premises, aan de edge. Dit agent-gebaseerde computing-patroon zal wereldwijd in computers worden gerepliceerd.

Hoe we over personal computers denken, zal zeer waarschijnlijk veranderen. Huang bedankte iedereen voor het partnerschap en de vriendschap. NVIDIA kon hier niet zijn zonder alles wat we samen hebben gedaan. Hij sprak zijn trots uit over het succes van partners in het afgelopen jaar en voorspelde dat het komende jaar nog beter zal zijn.

Afsluitend optreden

De keynote werd afgesloten met een muzikaal optreden dat de aankondigingen samenvatte. Het optreden vierde de komst van bruikbare AI, agents die naast mensen werken, Vera Rubin in volle productie, de nieuwe CPU-architectuur gebouwd voor agents in plaats van x86, OpenShell-sandboxing, vijf-laags systeemintegratie, MaxLPS-stroomoptimalisatie, 40 jaar pc-heruitvinding die overal draait waar Windows gaat, synthetische datageneratie door compute, redeneervermogens die de wereld begrijpen zoals mensen dat doen, en de toekomst die voor iedereen zichtbaar is.

Huang sloot af door iedereen welkom te heten op Computex, hen te bedanken voor een geweldig jaar, dankbaarheid te uiten voor vriendschap en steun, en iedereen het beste te wensen.

NVIDIA Deep Dive: Monopolizing het tijdperk van agentic AI door full-stack co-design

Het bedrijfsmodel en de omzetarchitectuur

NVIDIA heeft een van de meest opmerkelijke transities in de bedrijfsgeschiedenis gerealiseerd: de transformatie van een producent van grafische kaarten naar een verticaal geïntegreerde aanbieder van een full-stack platform voor accelerated computing. De motor achter het economische model van NVIDIA is de Data Center-divisie, die inmiddels meer dan 92% van de geconsolideerde omzet voor zijn rekening neemt. In plaats van losse siliciumchips te verkopen, is het bedrijfsmodel gestructureerd rond de verkoop van complete platforms voor accelerated computing. Deze platforms omvatten krachtige Graphics Processing Units (GPU's), op maat gemaakte centrale verwerkingseenheden (CPU's), geavanceerde netwerkchips en eigen software. De afgelopen kwartalen is de basiseenheid van verkoop verschoven van individuele serverboards naar volledig geïntegreerde supercomputing-racks, zoals de Grace Blackwell-systemen en het nieuwe Vera Rubin-platform. Hierdoor kan het bedrijf meerdere hardwarelagen met hoge marges en softwarepremies incasseren die anders verdeeld zouden zijn over verschillende partijen in de toeleveringsketen.

De financiële resultaten van NVIDIA weerspiegelen het cumulatieve rendement van deze strategie voor systeemniveau-monetisering. In het eerste kwartaal van het fiscale jaar 2027, dat eindigde op 26 april 2026, behaalde NVIDIA een recordomzet van $81,6 miljard, een stijging van 85% ten opzichte van het voorgaande jaar en een sequentiële groei van 20%. Deze groei werd gedreven door het Data Center-segment, dat $75,2 miljard bijdroeg, een stijging van 92% op jaarbasis. De financiële productiviteit van dit model wordt ondersteund door een ongeëvenaarde prijszettingsmacht en een productmix met hoge marges, wat leidde tot een GAAP- en non-GAAP-brutomarge van respectievelijk 74,9% en 75,0%. Deze enorme winstgevendheid ondersteunt een agressieve strategie voor kapitaalteruggave. Alleen al in het eerste kwartaal van fiscaal 2027 keerde NVIDIA ongeveer $20,0 miljard uit aan aandeelhouders via dividenden en aandeleninkoop, inclusief het verhogen van het kwartaaldividend naar $0,25 per aandeel en het vaststellen van een extra inkoopprogramma van $80,0 miljard.

Het ecosysteem van klanten, leveranciers en concurrenten

De structurele dynamiek van de waardeketen van NVIDIA kenmerkt zich door een extreme concentratie van klanten, vergaande specialisatie in productie en een felle concurrentiestrijd. Het primaire klantenbestand van NVIDIA bestaat uit wereldwijde cloudserviceproviders en hyperscalers, vaak aangeduid als de 'Big Four', waaronder Microsoft, Amazon, Alphabet en Meta. Deze concentratie vormt een materieel risico voor de omzetstroom; eind fiscaal 2026 waren vier klanten goed voor 61% van de totale omzet, waarbij de grootste afnemer 22% voor zijn rekening nam. De eindklanten zijn ontwikkelaars van bedrijfssoftware, consumentenplatforms en nationale overheden die bouwen aan soevereine AI-infrastructuur. Aan de aanbodzijde is Taiwan Semiconductor Manufacturing Company (TSMC) de onmisbare productiepartner van NVIDIA. NVIDIA heeft zijn kapitaalinvesteringen en inkoopuitgaven in Taiwan opgeschroefd tot ongeveer $150 miljard per jaar, waarmee het de grootste afnemer in het Taiwanese technologie-ecosysteem is en prioritaire toegang heeft veiliggesteld tot geavanceerde nodes en Chip-on-Wafer-on-Substrate (CoWoS) verpakkingscapaciteit. Andere belangrijke leveranciers zijn SK Hynix, Samsung en Micron, die het hoogwaardige High Bandwidth Memory (HBM) leveren dat essentieel is voor moderne accelerators.

In het competitieve landschap is de markt voor commerciële halfgeleiders aan de bovenkant een duopolie. Advanced Micro Devices (AMD) fungeert als de voornaamste uitdager en schaalt zijn Instinct GPU-portfolio op. AMD rapporteerde in het eerste kwartaal van 2026 een groei van 57% op jaarbasis in de omzet uit datacenters tot $5,8 miljard, aangedreven door de Instinct MI300-serie en de aanstaande MI350- en MI400-architecturen. AMD heeft belangrijke samenwerkingsverbanden gesloten, waaronder een infrastructuurproject op gigawattschaal met OpenAI en op maat gemaakte co-design-initiatieven met Meta. De Gaudi-accelerators van Intel blijven een verre derde, aangezien het bedrijf kampt met uitdagingen rondom software-adoptie en platformintegratie. Naast commerciële chips zijn de meest geduchte concurrenten de interne engineeringafdelingen van de hyperscalers zelf, die in toenemende mate eigen application-specific integrated circuits (ASIC's) ontwerpen om de marges van commerciële chipfabrikanten te omzeilen.

Marktaandeeldynamiek en de co-design-moat

NVIDIA behoudt een dominante greep op de markt voor commerciële AI-accelerators, met een geschat marktaandeel van 85% tot 92% medio 2026. Hoewel concurrenten erin zijn geslaagd secundaire posities in de markt te verwerven, heeft de enorme snelheid van de vraag in de sector NVIDIA in staat gesteld zijn leiderschap te behouden zonder concessies te doen aan zijn marges. De basis voor deze dominantie is de Compute Device Unified Architecture, beter bekend als CUDA, een eigen softwareplatform dat in twee decennia is ontwikkeld. CUDA heeft een enorme lock-in voor ontwikkelaars gecreëerd, aangezien het overgrote deel van de AI-trainingsbibliotheken, compilers en framework-optimalisaties specifiek voor de softwarestack van NVIDIA is geschreven. Het draaien van geavanceerde modellen op hardware van concurrenten vereist complexe emulatielagen of uitgebreide herschrijvingen van code, wat uitvoeringsrisico's en latentie met zich meebrengt die de meeste zakelijke kopers niet willen accepteren.

Het concurrentievoordeel van NVIDIA is geëvolueerd van een software-silicium-moat naar een hooggeïntegreerde hegemonie op basis van rack-scale co-design. Naarmate datacenterarchitecturen evolueren, is de prestatiebeperking verschoven van pure rekenkracht naar communicatie op systeemniveau en interconnect-bandbreedte. NVIDIA pakt dit aan via zijn eigen scale-up en scale-out netwerken, met name het NVLink-interconnectprotocol en NVSwitch-chips. In het onlangs aangekondigde Vera Rubin-platform leveren NVLink 6-switches een ongekende totale bandbreedte van 260 terabytes per seconde. Door op te treden als de enige architect van het gehele systeem – inclusief de op ARM gebaseerde Vera CPU, de Rubin GPU, ConnectX-9 SuperNICs en Spectrum-6 Ethernet-switches – optimaliseert NVIDIA de geheugentoegang en stroomvoorziening op rackniveau. Dit engineeringvermogen op systeemniveau maakt het voor concurrenten onmogelijk om op componentniveau te concurreren, aangezien zakelijke klanten steeds vaker vragen om kant-en-klare, volledig geoptimaliseerde, vloeistofgekoelde supercomputers in plaats van losse halfgeleideronderdelen.

Industriële kansen, geopolitieke dreigingen en platformconcentratie

De belangrijkste langetermijnkans voor NVIDIA is de seculiere transitie van generatieve AI-modellen naar agentic AI en reinforcement learning-architecturen. Generatieve AI vertrouwde grotendeels op 'single-pass', feed-forward inferentievragen, terwijl agentic AI-systemen autonome, meerstaps workflows uitvoeren. Een enkele prompt van een gebruiker kan duizenden sequentiële stappen triggeren, waaronder lokale 'sandboxed' code-uitvoering, vector database-retrievals, toolgebruik en redeneerlussen. Deze agentic verschuiving verhoogt de computationele intensiteit per transactie exponentieel, wat zorgt voor een structurele uitbreiding van de totale adresseerbare markt voor datacenterinfrastructuur en de vraag naar geavanceerde hardware ondersteunt, lang nadat de initiële training van fundamentele modellen is voltooid.

Deze structurele kansen worden gecompenseerd door ernstige geopolitieke tegenwind en platformconcentratie. De meest directe financiële impact is het totale verlies van de Chinese datacenter-markt door strikte exportbeperkingen van de Verenigde Staten. In het eerste kwartaal van fiscaal 2026 genereerde NVIDIA $4,6 miljard aan omzet uit Hopper-klasse datacenterchips van Chinese klanten; in het eerste kwartaal van fiscaal 2027 was dit cijfer gedaald naar nul. De huidige vooruitzichten van NVIDIA gaan uit van geen enkele omzet uit datacenterchips uit China, waardoor een enorme markt definitief is gesloten. Bovendien vormt de concentratie van de wereldwijde toeleveringsketen voor halfgeleiders in Taiwan een systemisch staartrisico. Aangezien TSMC ongeveer 90% van de geavanceerde siliciumchips voor AI-accelerators produceert, zou elke geopolitieke verstoring in de regio de hardwareproductie van NVIDIA onmiddellijk stilleggen. Ten slotte stelt de extreme klantconcentratie bij de vier grootste hyperscalers NVIDIA bloot aan investeringscycli (CapEx) als deze grote kopers besluiten hun bestaande capaciteit te optimaliseren.

Technologische roadmaps: Vera, Rubin en de verschuiving naar agentic AI

Om concurrentie voor te blijven en zijn winstgevende inkomstenstromen te behouden, heeft NVIDIA zijn hardware-releasecyclus verkort tot een jaarlijks ritme. Het onlangs aangekondigde Vera Rubin-platform, dat in het derde kwartaal van 2026 in productie is gegaan voor de eerste klantleveringen, is specifiek ontworpen voor dit agentic tijdperk. Het platform is niet slechts één halfgeleiderchip, maar een geïntegreerde suite van zeven op maat ontworpen chips: de Vera CPU, de Rubin GPU, de NVLink 6 Switch, de ConnectX-9 SuperNIC, de BlueField-4 DPU, de Spectrum-6 Ethernet-switch en de Groq 3 LPU. Dit verregaande co-design zorgt ervoor dat het gehele rack-scale systeem fungeert als één enkele, gedistribueerde accelerator, waarbij de prestatie- en communicatiebeperkingen van traditionele modulaire ontwerpen worden omzeild.

Het hart van deze architectuur van de volgende generatie is de Rubin GPU, gebouwd op het geavanceerde 3-nanometer-procedé van TSMC. De Rubin GPU bevat 336 miljard transistors, een toename van 1,6 keer ten opzichte van de Blackwell-architectuur, en integreert 288 gigabyte aan HBM4-geheugen verdeeld over acht stacks. Deze architectuur levert een buitengewone geheugenbandbreedte van 22 terabytes per seconde, wat 2,8 keer hoger is dan de bandbreedte van Blackwell. De Rubin GPU maakt gebruik van een derde generatie Transformer Engine met hardware-versnelde adaptieve compressie om het 4-bit floating point-formaat te ondersteunen, wat tot 50 petaFLOPS aan NVFP4-inferentiecapaciteit mogelijk maakt. Met een thermal design power (TDP) van maximaal 2.300 watt per GPU is het Rubin-platform volledig vloeistofgekoeld, waardoor luchtgekoelde opties volledig uit het high-end datacenterportfolio van NVIDIA zijn verdwenen.

De andere belangrijke groeimotor van het platform is de Vera CPU, de eerste op maat gemaakte, op ARM gebaseerde processor van NVIDIA die specifiek is ontwikkeld voor agentic AI-orkestratie en reinforcement learning. De Vera CPU beschikt over 88 aangepaste Olympus-cores die compatibel zijn met de Armv9.2-architectuur en maakt gebruik van 'spatial multi-threading' om core-resources te verdelen. Benchmarkgegevens wijzen uit dat de Vera CPU een verbetering van 1,8 keer in taakvoltooiingssnelheid levert in vergelijking met traditionele x86-serverprocessors en een prestatiesprong van 1,63 keer behaalt ten opzichte van de vorige generatie Grace CPU. Aan de 'edge' zet NVIDIA zijn RTX Spark-processorarchitectuur in, die de Rubin-microarchitectuur schaalt naar consumentenlaptops en desktops. Dit on-device agentic framework is ontworpen om AI-assistenten te transformeren van cloud-afhankelijke tools naar lokale, autonome agenten met lage latentie, wat een secundair groeikanaal in de markt voor personal computing vestigt.

Disruptieve uitdagers en de dreiging van custom silicium

Hoewel traditionele concurrenten zoals AMD en Intel het middelpunt blijven van marktcommentaren, is de meest geloofwaardige langetermijndreiging voor het marktaandeel van NVIDIA de snelle groei van op maat gemaakte ASIC's, intern ontworpen door cloud-hyperscalers. Custom silicium vertegenwoordigde 20,9% van de markt voor AI-accelerators in 2025 en zal naar verwachting groeien naar 27,8% tegen eind 2026. Hyperscalers zijn sterk gemotiveerd om eigen hardware in te zetten om de enorme commerciële brutomarges van NVIDIA te omzeilen en hun totale eigendomskosten (TCO) te verlagen. De TPU's van Google blijven de ruggengraat van deze custom markt, terwijl de Trainium-serie van Amazon substantiële toezeggingen van miljarden dollars heeft binnengehaald, inclusief implementaties bij Meta.

Broadcom is uitgegroeid tot de belangrijkste enabler en designpartner voor dit ecosysteem van custom ASIC's, met een geschat marktaandeel van 60% in de markt voor custom AI-halfgeleiders via meergeneratie-co-design-partnerschappen met Google, Meta en OpenAI. Het custom siliciumprogramma van Broadcom breidt zich uit naar geavanceerde 2-nanometer-nodes, waarbij gebruik wordt gemaakt van hun diepgaande intellectuele eigendom op fysiek vlak en verpakkingsintegratie om krachtige, kosteneffectieve alternatieven voor algemene GPU's te bouwen. Op vergelijkbare wijze heeft Marvell een geschat aandeel van 20% tot 25% in de markt voor custom ASIC-ontwerpen, waarbij ze voornamelijk Amazon Web Services en Microsoft bedienen. Naarmate de AI-markt volwassener wordt en workloads verschuiven van rekenintensieve fundamentele training naar zeer repetitieve, prijsgevoelige inferentie, vormen deze aangepaste, taakspecifieke ASIC's een structurele tegenwind die het langetermijnmarktaandeel van NVIDIA in grootschalige hyperscale-datacenters geleidelijk zou kunnen uithollen.

Trackrecord van het management en executie onder schaarste

Het senior management van NVIDIA, onder leiding van oprichter en CEO Jensen Huang en CFO Colette Kress, heeft een uitzonderlijk trackrecord getoond op het gebied van operationele wendbaarheid en strategisch vooruitzicht op lange termijn. Het management anticipeerde succesvol op de hardwarevereisten van de revolutie in transformer-modellen en zette agressief kapitaal in om productie- en geavanceerde verpakkingscapaciteit veilig te stellen voordat de golf van generatieve AI volledig was gematerialiseerd. Deze agressieve houding heeft NVIDIA in staat gesteld om zijn hardware-opschaling consistent uit te voeren onder zware wereldwijde beperkingen in verpakking en silicium, waarbij een zeer complexe toeleveringsketen van honderden partners wordt beheerd, waaronder 150 leveranciers in Taiwan alleen al.

Deze operationele executie gaat gepaard met een gedisciplineerd, op aandeelhouders gericht raamwerk voor kapitaalallocatie. Nu het bedrijf enorme vrije kasstromen genereert, heeft het management zijn financiële kracht benut om een substantieel programma voor kapitaalteruggave te initiëren. In het eerste kwartaal van fiscaal 2027 keerde het bedrijf $20,0 miljard uit aan aandeelhouders en stelde het een extra, onbeperkt inkoopprogramma van $80,0 miljard vast, waardoor de totale inkoopcapaciteit op meer dan $118 miljard komt. Hoewel sommige marktdeelnemers deze focus op aandeleninkoop en een 25-voudige dividendverhoging interpreteren als een teken dat een hypergroeiverhaal naar volwassenheid groeit, wijst de gelijktijdige toewijding van het management aan een jaarlijkse hardwarecyclus en zware investeringen in onderzoek en ontwikkeling voor toekomstige architecturen, zoals het aanstaande Feynman-platform, erop dat NVIDIA gefocust blijft op technologisch leiderschap terwijl het een gebalanceerde kapitaalstructuur handhaaft.

De balans

NVIDIA blijft een uitzonderlijk sterke, bijna monopolistische positie innemen in het epicentrum van de wereldwijde uitbouw van AI-infrastructuur, zoals blijkt uit de recordomzet van $81,6 miljard in Q1 fiscaal 2027 en non-GAAP-brutomarges van 75,0%. De concurrentiegracht van het bedrijf is ver voorbij de superioriteit in silicium gegroeid en omvat nu ook full-system en rack-scale co-design, vertegenwoordigd door het nieuwe Vera Rubin-platform. Door de op maat gemaakte 88-core Vera CPU te koppelen aan de Rubin GPU met 336 miljard transistors en deze te integreren via eigen NVLink 6-netwerken, heeft NVIDIA een geoptimaliseerd, hooggeïntegreerd platform gecreëerd dat tot 10 keer de agentic doorvoer levert van de vorige Blackwell-generatie. Deze full-stack integratie, gecombineerd met het diep gewortelde CUDA-software-ecosysteem, maakt het zeer onwaarschijnlijk dat commerciële concurrenten zoals AMD op korte termijn een substantieel marktaandeel zullen winnen in high-end training en complexe agentic inferentie-workloads.

Ondanks deze operationele uitmuntendheid moeten langetermijnbeleggers de dominantie van NVIDIA afwegen tegen toenemende structurele en geopolitieke tegenwind. Het bedrijf wordt geconfronteerd met een ongekende klantconcentratie, waarbij slechts vier hyperscalers meer dan 60% van de totale omzet voor hun rekening nemen, wat het bedrijf blootstelt aan aanzienlijke volatiliteit mochten deze kopers in een fase van verteringsperiode voor kapitaaluitgaven belanden. Tegelijkertijd vormt de snelle opkomst van custom ASIC's, mede ontwikkeld door Broadcom en Marvell voor hyperscalers als Google en Amazon, een geloofwaardige langetermijndreiging naarmate de markt verschuift van training naar zeer prijsgevoelige inferentie. Gecombineerd met het totale verlies van de omzet uit Chinese datacenters door Amerikaanse exportcontroles en een systemische afhankelijkheid van het Taiwanese productie-ecosysteem, laat de premium waardering van NVIDIA weinig ruimte voor executiefouten. Hoewel de technologische roadmap ongeëvenaard blijft, wijst de transitie naar een volwassen, sterk geconcentreerde markt erop dat toekomstige rendementen zullen worden bepaald door de veerkracht van de toeleveringsketen en de economische dynamiek van substitutie door custom silicium.

Disclaimer: Dit artikel is uitsluitend bedoeld voor informatieve doeleinden en vormt geen beleggingsadvies of een aanbeveling om effecten te kopen, verkopen of aan te houden. Onze analisten bieden gedetailleerde verslaggeving van bedrijfsevents maar kunnen fouten maken, doe altijd je eigen onderzoek. De geuite opvattingen en meningen weerspiegelen niet noodzakelijkerwijs die van DruckFin. We hebben niet alle hierin gebruikte informatie onafhankelijk geverifieerd en deze kan fouten of weglatingen bevatten. Raadpleeg een gekwalificeerde financieel adviseur voordat je een beleggingsbeslissing neemt. DruckFin en haar dochterondernemingen wijzen elke aansprakelijkheid af voor eventuele verliezen die voortvloeien uit het vertrouwen op deze inhoud. Zie voor de volledige voorwaarden onze Gebruiksvoorwaarden.