NVIDIA-Transkript: Vera Rubin in Serienproduktion und eine neue, speziell für KI-Agenten entwickelte CPU

NVIDIA GTC Taipei 2026 Keynote mit Jensen Huang — 1. Juni 2026, Taipeh, Taiwan

Begrüßung und Status des Ökosystems

Jensen Huang wurde auf der GTC Taiwan enthusiastisch empfangen. Er eröffnete die Veranstaltung mit einem Hinweis auf die enorme Reichweite des Events: 70 gleichzeitige Launch-Partys in ganz Taiwan verfolgten die Keynote live. Er stellte seine im Publikum anwesenden Eltern vor, bedankte sich bei den Künstlern der Pre-Show und erntete dafür Applaus.

Huang reflektierte über die Breite des NVIDIA-Ökosystems. Wenn Menschen an „Ökosystem“ denken, meinten sie meist den Software-Stack und die Entwickler-Community oberhalb der von NVIDIA gebauten Rechensysteme. Er betonte jedoch, dass das Ökosystem von NVIDIA den gesamten Prozess umfasse: angefangen bei der Lieferkette in Taiwan, wo alles seinen Ursprung habe, bis hin zu den Rechenzentren und schließlich den Endanwendern. Er würdigte das taiwanesische Ökosystem als das weltweit beste Lieferketten-Ökosystem. Er erwähnte, dass ihm am Vorabend berichtet wurde, das jährliche BIP Taiwans werde voraussichtlich um fast 10 Prozent wachsen – eine Zahl, die er als „unglaublich“ bezeichnete.

Agentische KI ist da: Die Revolution der Software-Produktivität

Huang begann seine Keynote mit einem zentralen Thema: Vor zwei Jahren habe er begonnen, über den Übergang von generativer KI zur nächsten Welle zu sprechen – der sogenannten agentischen KI (Agentic AI). Er erklärte nun: Die agentische KI ist angekommen, und damit auch die Ära der produktiven KI.

Zur Veranschaulichung verwies er auf GitHub als eine der ersten Anwendungen für agentische KI in der Softwareentwicklung. Er bezifferte den Markt für professionelle Softwareentwicklung auf etwa 30 bis 40 Millionen Entwickler weltweit. Anschließend präsentierte er Daten zu GitHub-Commits – dem Maßstab für Entwickler, die Code herunterladen, modifizieren und wieder hochladen. Im Jahr 2023 waren es 300 Millionen Commits, 2024 stieg die Zahl auf 400 Millionen und 2025 auf 500 Millionen. In den ersten Monaten des Jahres 2026 habe sich die Zahl nahezu verdreifacht.

Huang ordnete dies ökonomisch ein: 30 Millionen Softwareentwickler repräsentieren ein BIP von rund drei Billionen Dollar an Jahresgehältern, was wiederum Wirtschaftswachstum im restlichen Sektor generiert. Diese drei Billionen Dollar an Gehältern erzeugten nun fast den dreifachen Output – effektiv neun Billionen Dollar an Produktivität bei drei Billionen Dollar an Gehältern. Er nannte dies das Potenzial und das Versprechen der KI.

Er widersprach nachdrücklich der Erzählung, dass KI Arbeitsplätze vernichte; er nannte dies „völligen Unsinn“. Das Gegenteil sei der Fall: Es würden mehr Softwareingenieure eingestellt, gerade weil die Produktivität pro Ingenieur so außergewöhnlich gestiegen sei. Wenn man einen Softwareingenieur einstellen könne, der neun Billionen Dollar an produktiver Arbeit generiere, warum sollte man dann weniger davon einstellen? Dieser Effekt werde sich sehr bald in der Wirtschaft zeigen.

Tokens als neue Umsatzgröße und das Rechenmuster hinter Agenten

Huang verknüpfte diese Produktivitätsrevolution mit der Nachfrage nach Rechenleistung. Er erklärte, dass Tokens derzeit extrem gefragt seien, da man bei einer solchen Produktivität den Output weiter steigern wolle. Tokens seien nun profitable Umsatzträger. Da KI mittlerweile profitabel sei, wollten Unternehmen mehr „KI-Fabriken“ bauen und mehr Tokens generieren. Genau deshalb sei die Nachfrage nach Rechenleistung in Taiwan explodiert und deshalb seien alle Unternehmen im Ökosystem so erfolgreich.

Er beschrieb einen grundlegenden Wandel im Rechenmuster. Das alte Modell bestand aus einer Anwendung, darin laufendem Code und einem Betriebssystem. Das neue Modell ist ein Agent, bestehend aus einem oder mehreren Large Language Models (LLM), die in einem „Harness“ (einem Steuerungsrahmen) eingebettet sind. Dieser Rahmen orchestriert das Modell für produktive Arbeit. Er übernimmt Eingabe, Verständnis, Beobachtung, Schlussfolgerung, Handeln und die Nutzung von Werkzeugen. Zu den Werkzeugen zählen Tabellenkalkulationen, Webbrowser, Datenverarbeitungs-Engines und Datenbank-Engines. Der Agent verwaltet – wie ein Mensch – Kurzzeit- und Langzeitgedächtnis.

Die Nutzung von Werkzeugen bezeichnete er als einen großen Durchbruch. Viele hätten ihm gesagt, agentische KI würde Softwareunternehmen überflüssig machen. Er sagte, das Gegenteil sei wahr: Da es so viele Agenten geben werde und die Welt nicht mehr durch die Anzahl der Menschen begrenzt sei, würden diese Agenten mehr Werkzeuge nutzen als je zuvor. Es sei eine unglaubliche Zeit für Softwareunternehmen, so Huang, allerdings müsse die Software dem Agenten so präsentiert werden, dass er sie auch nutzen könne.

CUDA-X-Bibliotheken: NVIDIAs Schatz für die agentische Ära

Huang bezeichnete NVIDIAs tausend CUDA-X-Bibliotheken als den „Schatz“ des Unternehmens. NVIDIA sei nun in der Lage, diese Bibliotheken Agenten zur Verfügung zu stellen, die sie effektiver nutzen könnten als Menschen. Er verwies auf CUDA, das vor 20 Jahren als einheitliche Architektur für beschleunigtes Rechnen entwickelt wurde. Die Bibliotheken decken ein breites Spektrum ab: cuLitho für computergestützte Lithografie, cuOpt für Entscheidungsoptimierung, cuDSS für direkte Sparse-Solver, AI-Q für tiefgreifende Recherchen in strukturierten und unstrukturierten Dokumenten, Aerial für AI-RAN, PhysicsNeMo für differenzierbare Physik und Parabricks für Genomik.

Er kündigte an, dass alle CUDA-X-Bibliotheken künftig mit „Skills“ ausgestattet werden – quasi einem Handbuch, das die KI liest, um deren Nutzung zu erlernen. Die Fähigkeit der Agenten, diese Bibliotheken zu nutzen, werde unglaublich sein; alle CUDA-X-Bibliotheken würden derzeit darauf vorbereitet, als Werkzeuge für Agenten zu dienen.

Die disaggregierte Architektur des agentischen Rechnens

Huang erläuterte die verteilte Architektur, die der agentischen KI zugrunde liegt. Er beschrieb den Agenten als das ultimative disaggregierte und verteilte Rechenmodell, bei dem viele verschiedene Computer aktiviert werden, um die Arbeit eines einzelnen Agenten zu verarbeiten. Modell, Steuerungsrahmen, Werkzeuge, Skills und Laufzeitumgebung laufen in verschiedenen Teilen eines Rechenzentrums.

Sein Vergleich: Das Modell ist das Gehirn, der Steuerungsrahmen der Körper, die Werkzeuge sind die Gegenstände in einer Werkstatt. Der Arbeiter – der Agent – arbeitet mit Werkzeugen in dieser Werkstatt in extrem großem Maßstab. Jeder Prozessschritt läuft in einem anderen Teil des Computers. Wenn das LLM „denkt“ – Kontext verarbeitet, schließt, plant, handelt –, wird ein ganzes Rack von Grace Blackwell NVLink 72 aktiviert. Wenn der Agent ein Werkzeug nutzt, wird eine CPU verwendet. Der Sicherheitsrahmen läuft auf CPUs und einem Sicherheitsprozessor namens DPU (NVIDIAs BlueField). Die Orchestrierung erfolgt auf einer CPU.

Das Speichersystem bezeichnete er als eine der größten Herausforderungen. Das Arbeitsgedächtnis, das sogenannte „KV Caching“, erfordere Kompression und Abruf von strukturierten und unstrukturierten Daten mit komplexen ontologischen Beziehungen. Das Speichersystem der KI werde das gesamte Speichersystem revolutionieren.

Dieses Problem des disaggregierten, verteilten, heterogenen Rechnens sei genau der Grund, warum NVIDIA die nächste Generation entwickelt habe: Vera Rubin.

Vera Rubin: Der erste Multi-Rack-KI-Supercomputer – jetzt in Serienproduktion

Huang stellte Vera Rubin nicht als einzelnen Chip oder GPU vor, sondern als ein komplettes System – von Ende zu Ende. Es umfasst Vera Rubin NVL72 GPUs, Vera CPUs, ein revolutionäres Speichersystem, ConnectX-9-Netzwerktechnik, den DOCA-Software-Stack und einen Sicherheitsprozessor, der alles im Ruhezustand, bei der Übertragung und während der Nutzung verschlüsselt. Er nannte Vera Rubin das ehrgeizigste Unterfangen in der Geschichte von NVIDIA, an dem alle 40.000 Ingenieure des Unternehmens sowie das breitere Ökosystem arbeiteten.

Die große Ankündigung: Vera Rubin ist jetzt in voller Serienproduktion. Die Lieferkette für Vera Rubin sei doppelt so groß wie die für Grace Blackwell; was früher zwei Stunden für den Zusammenbau eines Grace Blackwell-Racks erforderte, dauere nun nur noch fünf Minuten. Er dankte dem taiwanesischen Ökosystem für diese Leistung.

Ein Video veranschaulichte die Fertigungsdetails: Das System basiert auf einem 3-Nanometer-Prozess von TSMC, CoWoS-Advanced-Packaging und HBM4-Speicher von Micron, SK Hynix und Samsung. Die Vera Rubin GPU verfügt über sechs Billionen Transistoren und über 18.000 Komponenten auf einer Platine. Das Vera Rubin NVL72-System nutzt ein neues modulares Compute-Tray mit neuer PCB-Midplane, ConnectX-9 SuperNICs und BlueField-4 DPUs, alles wartungsfreundlich ohne Kabel. Es gibt 18 Compute-Trays und neun Hot-Swap-fähige NVLink-Switch-Trays. Flüssigkeitsgekühlte Sammelschienen übertragen über 5.000 Ampere – das entspricht 20 Elektroautos bei voller Beschleunigung. Insgesamt 1,3 Millionen Komponenten bilden dieses MGX-Rack der dritten Generation. Das Video gratulierte Microsoft, Dell und CoreWeave zur Inbetriebnahme ihrer Vera Rubin NVL72-Engineering-Racks.

Zudem wurde das Vera CPU-Rack mit 256 flüssigkeitsgekühlten CPUs sowie das Vera LPX-Rack (in Zusammenarbeit mit Foxconn und Quanta) vorgestellt, das 256 Groq LPUs für extrem niedrige Latenz beherbergt. Das komplette System – fünf verbundene Rack-Scale-Systeme – wurde als Supercomputer für KI-Agenten beschrieben, realisiert mit 150 Zulieferern in Taiwan.

Auf der Bühne präsentierte Huang die physischen Racks: Vera Rubin NVL72, das LPX-Rack, das Vera CPU-Rack, das Vera BlueField-Speicher- und Sicherheitssystem sowie den Mellanox-Netzwerk-Switch, den er als weltweit ersten CPO (Co-Packaged Optics) bezeichnete. Er hob das kabellose Design hervor, das durch eine PCB-Midplane ermöglicht wurde, was Montagezeit verkürzt und Zuverlässigkeit erhöht.

NVIDIA DSX: KI-Fabrikinfrastruktur im großen Maßstab

Vor dem Deep Dive zu Vera Rubin präsentierte Huang das NVIDIA DSX-Framework für die Infrastruktur von KI-Fabriken. Er beschrieb den weltweiten Wettlauf zum Bau dieser Fabriken als den größten Infrastrukturausbau der Menschheitsgeschichte. KI-Fabriken im Gigawatt-Bereich, die früher 20 bis 30 Milliarden Dollar kosteten, lägen nun bei 50 bis 60 Milliarden und würden bald 80 bis 100 Milliarden Dollar pro Gigawatt erreichen. Diese Fabriken müssten sofort reibungslos funktionieren, da die Kapitalkosten enorm seien.

Ein Video beschrieb DSX Sim, einen Omniverse-Blueprint, mit dem Partner eine NVIDIA Vera Rubin KI-Fabrik validieren können, bevor ein einziges Rack bestellt wird – inklusive digitalem Zwilling für Layout, Strom und Kühlung. DSX OS übernimmt dann die Bereitstellung, den Betrieb und die Überwachung. DSX MaxLPS ermöglicht es Betreibern, mehr GPUs innerhalb desselben Energiebudgets einzusetzen, da heutige KI-Fabriken bis zu 40 Prozent Überkapazität bei der Stromversorgung vorhalten. Das System bietet eine hocheffiziente Flüssigkeitskühlung bei 45 Grad Celsius. DSX Flex reagiert auf Echtzeit-Netzsignale und passt den Stromverbrauch dynamisch an. Bis Ende des Jahrzehnts sollen 100 Gigawatt an KI-Fabriken online gehen.

Huang erklärte, dass NVIDIA zu einem Unternehmen für KI-Infrastruktur geworden sei, nicht nur für GPUs. Die ökonomische Logik: Rechenleistung ist Umsatz, Performance pro Watt ist Umsatz. NVIDIAs Token-Kosten seien die weltweit niedrigsten – nicht um 10 Prozent, sondern um ein Vielfaches –, dank extremer Co-Design-Prozesse im gesamten System.

NVIDIA Vera CPU: Die erste CPU für Agenten, nicht für Menschen

Huang kündigte einen neuen Wachstumstreiber an: die Vera CPU, entwickelt für das agentische Zeitalter.

Bisherige CPUs seien für Menschen konzipiert worden, die in Sekunden denken und CPU-Kerne in der Cloud stundenweise mieten. Agenten seien fundamental anders: Sie seien ungeduldig und lebten in einer Welt, die in Nanosekunden gemessen wird. Wenn ein Agent ein Werkzeug nutzt, muss die Antwort sofort kommen. Da CPUs neben extrem teurer GPU-Infrastruktur sitzen, die Token-Umsätze generiert, müssen sie sowohl hochperformant als auch energieeffizient sein.

Er nannte vier definierende Eigenschaften von Vera: Erstens „Instructions per Clock“ – die weltweit höchste Rate mit 10 Befehlen pro Taktzyklus für erstklassige Single-Thread-Performance. Zweitens: Bandbreite pro Kern. Drittens: Bandbreite im gesamten Chip. Vera nutzt eine skalierbare Kohärenz-Fabric, die alle 88 Olympus-Kerne auf einem monolithischen Mesh mit 3,6 Terabyte pro Sekunde verbindet, ohne Boundary-Crossings. Es ist die erste CPU mit PCIe Gen 6 und LPDDR5X-Speicher mit 1,2 Terabyte pro Sekunde – zwei- bis dreimal mehr Bandbreite als marktführende CPUs. Viertens: Energieeffizienz, um das Rechenzentrum maximal mit CPU-Leistung zu bestücken, ohne die Token-Generierung zu beeinträchtigen.

Ein Video erläuterte die Architektur: Der NVIDIA Olympus-Kern ist für moderne Rechenzentrums-Workloads wie Python-Runtimes, Tool-Aufrufe und Sandbox-Code-Ausführung optimiert. Vera erreicht eine um 40 Prozent geringere Spitzen-Speicherlatenz gegenüber x86 und liefert die 1,8-fache Performance in agentischen Sandbox-Umgebungen.

Huang präsentierte Benchmarks: SQL laufe auf Vera dreimal schneller. Bei der Echtzeit-Stream-Verarbeitung für die New York Stock Exchange sei die Vera CPU sechsmal schneller. Er kündigte an, dass fast alle großen OEMs und ODMs in Taiwan Vera unterstützen. Dies sei ein neuer Markt – CPUs für Agenten –, der größer sein werde als alles zuvor.

NVIDIA Agent Toolkit für Enterprise AI

Das wichtigste Fazit der Keynote: das NVIDIA Agent Toolkit für Enterprise AI. Jedes Unternehmen werde Agenten nutzen und sich fragen, wie man diese sicher betreibt und für eigene Workloads baut.

Das Toolkit besteht aus vier Komponenten: 1. Modelle (LLMs), 2. ein Steuerungsrahmen (Harness), 3. Werkzeuge mit Skills (inklusive CUDA-X) und 4. eine Laufzeitumgebung namens OpenShell. OpenShell ist ein sicherer, Open-Source-Rahmen für Unternehmen, der Datenschutz, Identität und Sicherheitsrichtlinien verwaltet. Er wird bereits von Red Hat, Canonical und Microsoft unterstützt.

Als Demonstration zeigte Huang eine Partnerschaft mit Cadence für einen „Chip-Design-Superagenten“. Dieser verkürzte Design-Verifizierungszyklen um das 40-Fache. Huang kündigte zudem Nemotron 3 Ultra an, das weltweit erste Modell auf Basis einer Hybrid-Architektur (State Space Models kombiniert mit Mixture of Experts). Es sei fünfmal schneller und 30 Prozent günstiger im Betrieb als bisherige Spitzenmodelle. NVIDIA veröffentlicht nicht nur das Modell, sondern auch die Trainingsdaten und -skripte.

Zu den Partnern zählen Cadence, CrowdStrike, ServiceNow, Palantir und SAP. Agenten würden diese Unternehmen nicht stören, sondern die größte Chance aller Zeiten für Enterprise-Software-Partner darstellen.

Neuerfindung des PC: RTX Spark, Windows-Maschinen und DGX Station

Huang wandte sich dem Personal Computing zu. Gemeinsam mit Microsoft habe NVIDIA den PC für die Ära der Agenten neu erfunden.

Er präsentierte RTX Spark, das alles Wissen aus 33 Jahren in einem Chip vereint: eine Blackwell RTX GPU mit 6.144 Tensor Cores, ein Petaflop KI-Leistung, eine in Partnerschaft mit MediaTek entwickelte 20-Kern-Grace-CPU, 128 GB Unified Memory und 70 Milliarden Transistoren. 100 Prozent der NVIDIA-Software sowie alle Windows-Anwendungen laufen darauf.

Ein Video zeigte einen lokal auf RTX Spark laufenden Agenten, der bei der Hausplanung half – von der Geländegestaltung bis zum Rendering mit Flux 2. Adobe habe zudem Photoshop und Premiere für RTX Spark re-engineert, wodurch diese doppelt so schnell seien und direkt mit Agenten interagieren könnten.

Huang kündigte eine neue PC-Linie an: drei Windows-Systeme (Desktop, Laptop, Workstation), alle 100 Prozent CUDA-kompatibel. Die Desktop-Version könne einen Agenten 24/7 betreiben, der mit dem gesamten Zuhause vernetzt ist und mit der Zeit dazulernt. Zudem wurde die DGX Station vorgestellt – ein KI-Supercomputer für den Schreibtisch mit 768 GB Speicher und 20 Petaflops Leistung.

Er verglich diesen Wandel mit der Entwicklung vom Telefon zum Smartphone. In zehn Jahren werde ein PC nicht mehr wie ein traditioneller PC aussehen, sondern eher wie ein R2-D2 oder C-3PO, der alle persönlichen Agenten rund um die Uhr steuert.

Physical AI: Cosmos 3, autonomes Fahren und humanoide Robotik

Huang betonte, dass agentische KI im Grunde ein „digitaler Roboter“ sei. Die Herausforderung: Während Sprachmodelle von Menschen geschriebene Daten nutzen, benötigen Roboter Daten aus der „Ich-Perspektive“.

Er kündigte Cosmos 3 an, ein „Foundation Model“ für jede Arbeit in der physischen Welt – von Fabrikrobotern bis hin zu Robotern in beliebigen Umgebungen. Es basiert auf einer neuen „Mixture of Transformers“-Architektur. Ebenfalls neu: Alpamayo 2 Super, das weltweit erste Modell für autonomes Fahren mit „Reasoning“-Fähigkeiten. 80 Prozent der weltweiten Autohersteller nutzen bereits NVIDIA DRIVE Hyperion.

Für die humanoide Robotik präsentierte er die NVIDIA Isaac GR00T-Plattform und einen Referenz-Roboter mit 31 Freiheitsgraden, der auf der Jetson Thor-Plattform läuft. Diese Plattform ist primär für Universitäten und Forscher gedacht, um den Aufbau komplexer Roboter zu vereinfachen.

Fazit

Huang fasste zusammen: Vera Rubin ist in Produktion – ein disaggregiertes, verteiltes System für Agenten. NVIDIA ist nun ein KI-Infrastrukturunternehmen. Die Vera CPU ist eine revolutionäre Architektur für Agenten. Microsoft und NVIDIA haben eine neue PC-Klasse geschaffen. Das agentische Rechenmuster werde sich über Clouds, Unternehmen, PCs, Roboter und Fabriken hinweg replizieren. Er bedankte sich beim taiwanesischen Ökosystem und lud alle zur Computex 2026 ein.

NVIDIA Deep Dive

Die Architektur der Rechenleistung

NVIDIA hat seine Metamorphose vom Anbieter diskreter Grafikprozessoren zum Full-Stack-Architekten des KI-Zeitalters vollzogen. Das Geschäftsmodell des Unternehmens basiert grundlegend auf der Entwicklung und Monetarisierung beschleunigter Computing-Plattformen, die Künstliche Intelligenz, High-Performance Computing und fortschrittliche Datenvisualisierung antreiben. Anstatt lediglich Standard-Chips zu verkaufen, bietet NVIDIA vollständig integrierte Infrastrukturen an. Das Ökosystem umfasst die zugrunde liegende Hardware, einschließlich Grafik- und Zentralprozessoren, sowie kritische Netzwerkkomponenten für Rechenzentren wie InfiniBand- und Ethernet-Switches. Diese Hardware-Ebene wird durch einen umfassenden, proprietären Software-Stack massiv abgesichert, was es dem Unternehmen ermöglicht, entlang der gesamten Architektur von Rechenzentren Wertschöpfung zu generieren.

Die finanzielle Übersetzung dieser Full-Stack-Strategie ist beeindruckend. Im ersten Quartal des Geschäftsjahres 2027 verzeichnete das Unternehmen einen Gesamtumsatz von $81,6 Milliarden, was einem Zuwachs von 85 % gegenüber dem Vorjahr entspricht. Das Segment Data Center stellt das ursprüngliche Gaming-Geschäft mit einem Umsatz von $75,2 Milliarden im selben Quartal mittlerweile völlig in den Schatten. Entscheidend ist, dass es NVIDIA gelungen ist, die Netzwerksparte von einem ergänzenden Zusatzangebot zu einer eigenständigen strukturellen Säule auszubauen. Allein der Umsatz mit Netzwerktechnik für Rechenzentren erreichte $14,8 Milliarden, maßgeblich getrieben durch die Einführung von Spectrum-X Ethernet und NVLink-Interconnects. Darüber hinaus baut das Unternehmen seine wiederkehrenden Software-Erlöse durch NVIDIA AI Enterprise systematisch aus. Mit einer Monetarisierung von etwa $4.500 pro GPU jährlich wird das Hardware-Installationsbasis-Modell um margenstarke Abonnement-Erlöse ergänzt. Dieser operative Hebel spiegelt sich deutlich im Profitabilitätsprofil des Unternehmens wider: Die Bruttomarge liegt bei 74,9 %, und der Free Cashflow belief sich in einem einzigen Quartal auf $48,6 Milliarden.

Das Ökosystem: Kunden, Zulieferer und Wettbewerber

Der Kundenstamm von NVIDIA spiegelt die beiden Motoren des globalen KI-Ausbaus wider. Aktuell ist die Umsatzverteilung innerhalb des Segments Data Center exakt ausgeglichen: Etwa 50 % der Nachfrage stammen von Hyperscale-Cloud-Anbietern wie Microsoft, Alphabet, Amazon und Meta, während die restlichen 50 % auf staatliche KI-Initiativen, Unternehmens-Rechenzentren und industrielle Anwendungen entfallen. Diese Diversifizierung ist ein entscheidender Faktor zur Risikominderung und belegt, dass die Nachfrage nach beschleunigter Rechenleistung erfolgreich über eine konzentrierte Handvoll von Cloud-Infrastruktur-Giganten hinausgewachsen ist.

Auf der Angebotsseite bleiben die primäre Verwundbarkeit und die Engpässe von NVIDIA strukturell an die Taiwan Semiconductor Manufacturing Company gebunden. Die physische Komplexität der Multi-Chip-Systeme macht das Unternehmen in hohem Maße von der CoWoS-Advanced-Packaging-Kapazität der Foundry abhängig. Bis Ende 2026 wird eine monatliche Gesamtkapazität von 120.000 bis 130.000 Wafern erwartet, wovon NVIDIA einen massiven Anteil von 60 % beansprucht. Zudem ist das Unternehmen in hohem Maße von Speicherherstellern wie SK Hynix und Micron für kritische High Bandwidth Memory-Module abhängig. Dies schafft eine hochkomplexe, mehrstufige Lieferkette, in der jeder einzelne Engpass unmittelbar den ausgewiesenen Umsatz drosseln kann.

Das Wettbewerbsumfeld intensiviert sich auf zwei Ebenen: durch Rivalen bei Standard-Chips und durch interne Eigenentwicklungen der Hyperscaler. Advanced Micro Devices bleibt der prominenteste Wettbewerber mit der Einführung seiner Architekturen der Serien MI350 und der kommenden MI400. Die weitaus existenziellere Bedrohung geht jedoch von NVIDIAs größten Kunden aus. Alphabets Einsatz des proprietären TPU v6e Trillium und TPU v7 Ironwood sowie Amazons Trainium 2 stellen glaubwürdige, hochfinanzierte Bemühungen dar, die Margen von NVIDIA zu umgehen. Da Cloud-Anbieter darauf abzielen, die Gesamtbetriebskosten zu optimieren und die absolute Abhängigkeit von einem einzigen Anbieter zu reduzieren, erhalten interne Chip-Programme nahezu unbegrenzte Kapitalzusagen.

Marktanteil und die Festung CUDA

Trotz zunehmender Wettbewerbsgeräusche zeigt unsere Analyse des Marktes für Rechenzentrums-Beschleuniger für das Jahr 2026, dass NVIDIA weiterhin etwa 80 % des weltweiten Marktanteils nach Umsatz hält. Das Instinct-Portfolio von Advanced Micro Devices hat sich mit einem Anteil von etwa 5 % bis 7 % ein dauerhaftes, wenn auch kleines Standbein erarbeitet. Diese anhaltende Marktdominanz ist nicht allein eine Frage der Rechenleistung; sie wird maßgeblich durch die Softwareplattform Compute Unified Device Architecture (CUDA) geschützt. Über fast zwei Jahrzehnte hinweg hat sich dieses Ökosystem zur maßgeblichen Lingua Franca für paralleles Computing und die Entwicklung Künstlicher Intelligenz etabliert.

Wettbewerber können NVIDIA bei den reinen Hardwarespezifikationen, wie Speicherbandbreite oder Teraflops pro Sekunde, oft erreichen oder theoretisch übertreffen. NVIDIA zu verdrängen erfordert jedoch, Unternehmensentwickler davon zu überzeugen, ein hochreifes, umfassend dokumentiertes Software-Ökosystem zugunsten aufstrebender Alternativen aufzugeben. Zudem wird der Marktanteil zunehmend durch die Dominanz in der Netzwerktechnik geschützt. Da KI-Modelle auf Billionen von Parametern skalieren, erfordert ihr Training die perfekte Synchronisation von zehntausenden Prozessoren. NVIDIAs Fähigkeit, die gesamte Rack-Scale-Architektur zu verkaufen – durch die nahtlose Integration von Prozessoren, Switches und Data Processing Units – schafft einen integrierten Leistungsstandard, den fragmentierte Wettbewerber nur schwer replizieren können. Diese tiefe strukturelle Verankerung sorgt dafür, dass die Eintrittsbarrieren prohibitiv hoch bleiben.

Generationen-Horizonte: Blackwell und Rubin

Der Hardware-Produktzyklus ist der zentrale Katalysator für künftige Umsatzsteigerungen. Während die Hopper-Architektur das Fundament des Booms im Bereich generatives Computing legte, treibt der laufende Hochlauf der Blackwell-Generation derzeit die Infrastruktur-Implementierungen im Frühjahr 2026 voran. NVIDIA hat jedoch mit der Vorstellung seiner Vera-Rubin-Plattform, die für die großflächige Cloud-Verfügbarkeit in der zweiten Jahreshälfte 2026 geplant ist, bereits den nächsten Obsoleszenz-Zyklus eingeleitet. Die Rubin-Produktfamilie stellt einen tiefgreifenden architektonischen Sprung dar.

Die zentrale R100-Einheit der Rubin-Plattform nutzt ein 3nm-Verfahren und integriert 336 Milliarden Transistoren – eine massive Erweiterung gegenüber der Vorgängergeneration. Sie führt die Industrie zum HBM4-Speicher der nächsten Generation, der 288 GB Speicherkapazität und 50 PFLOPS an FP4-Rechenleistung pro Chip bietet. Ebenso kritisch ist, dass die Rubin-Generation NVIDIAs proprietären Vera-Zentralprozessor aggressiv in das Rechenzentrum drängt. Durch die Kopplung des zentralen Beschleunigers mit einem ARM-basierten Prozessor greift NVIDIA explizit den Markt für Allzweckserver an und erschließt einen völlig neuen adressierbaren Gesamtmarkt von $200 Milliarden. Das Management gibt an, dass die Rubin-Plattform eine bis zu zehnfache Senkung der Kosten pro Inferenz-Token bei Skalierung ermöglicht, was die Wirtschaftlichkeit des Einsatzes grundlegend verändert und die Industrie in einen unfreiwilligen Upgrade-Zyklus zwingt.

Industriedynamik und disruptive Marktteilnehmer

Der Markt für Rechenzentrumsinfrastruktur hat sich strukturell von Investitionen, die auf allgemeiner Rechenleistung basieren, hin zu spezialisierten „Intelligenzfabriken“ verschoben. Die primäre Chance liegt in der Verbreitung von agentenbasierten Frameworks und lokalem Edge Computing. Da der Inferenzbedarf exponentiell steigt – getrieben durch Anwendungen, die Echtzeit-Sprachverarbeitung, Video und autonomes Schlussfolgern beherrschen –, erweitert der Bedarf an lokalisierten Recheninstanzen den adressierbaren Gesamtmarkt über traditionelle Hyperscale-Einrichtungen hinaus. Zudem sorgt die Entstehung souveräner Künstlicher Intelligenz, bei der Nationalstaaten aktiv Milliarden investieren, um lokalisierte Infrastrukturen aufzubauen, für eine äußerst dauerhafte, unkorrelierte Nachfrageschicht.

Umgekehrt steht die Branche vor gravierenden physischen und thermodynamischen Beschränkungen. Die größte Bedrohung für den weiteren Ausbau ist nicht die Verfügbarkeit von Kapital, sondern die Stromversorgung und die thermische Dichte. Der Wettbewerbsmaßstab verschiebt sich rasant von absoluter Leistung hin zu Tokens pro Megawatt. Genau diese Dynamik schafft ein Zeitfenster für disruptive neue Marktteilnehmer, die gezielt auf energieeffiziente Inferenz-Workloads mit hohem Durchsatz setzen. Unternehmen wie Cerebras und Groq haben die spekulative Venture-Phase hinter sich gelassen und sichern sich aktiv bedeutende kommerzielle Verträge. Dabei nutzen sie einzigartige Wafer-Scale-Integration und lokalisierte SRAM-Architekturen, um die Engpässe bei High-Bandwidth-Speichern vollständig zu umgehen. Während diese Akteure NVIDIAs festen Griff auf das Training großer Modelle nicht gefährden, stellen sie eine glaubwürdige, hochspezifische Bedrohung für den künftigen Inferenz-Umsatzpool dar.

Erfolgsbilanz des Managements

Unter der Führung von Jensen Huang hat das Management eine unübertroffene Erfolgsbilanz bei der technologischen Antizipation und der Umsetzung in der Lieferkette bewiesen. In den vergangenen drei Jahren erkannte das Management den architektonischen Wandel hin zum beschleunigten Computing korrekt und sicherte sich aggressiv Wafer-Kapazitäten, lange bevor der breitere Markt das Ausmaß der bevorstehenden Nachfrage verstand. Diese Bereitschaft, Milliarden in nicht stornierbare Kaufverpflichtungen zu investieren, ermöglichte es NVIDIA, die frühen Phasen des Infrastruktur-Booms im Wesentlichen zu monopolisieren.

Der Rahmen für die Kapitalallokation des Managements ist parallel zum operativen Cashflow gereift. Während NVIDIA historisch als volatiles Wachstumsunternehmen wahrgenommen wurde, hat es sich rasch zu einem strukturellen Vehikel für Kapitalrückführungen gewandelt. Allein im ersten Quartal des Geschäftsjahres 2027 führte das Unternehmen etwa $20,0 Milliarden an die Aktionäre zurück, kündigte eine 25-fache Erhöhung der Quartalsdividende an und autorisierte ein zusätzliches Aktienrückkaufprogramm im Volumen von $80,0 Milliarden. Die operative Präzision, die erforderlich ist, um den Übergang von der Hopper-Architektur zu Blackwell und unmittelbar weiter zu Rubin zu steuern, ohne die Umsätze des laufenden Quartals zu kannibalisieren oder katastrophale Lagerwertberichtigungen zu erleiden, unterstreicht ein Führungsteam, das auf dem absoluten Höhepunkt industrieller Kompetenz agiert.

Das Fazit

NVIDIA ist der prägende Infrastrukturanbieter des modernen Computing-Zeitalters und kombiniert beispiellose Hardware-Entwicklung mit einem tief verankerten Software-Burggraben. Das schiere Ausmaß der finanziellen Leistung, belegt durch ein Quartal mit $81,6 Milliarden Umsatz und makellosen Bruttomargen von 74,9 %, demonstriert ein Geschäftsmodell, das sich vollständig von der Zyklizität klassischer Halbleiter gelöst hat. Die strategische Expansion in komplette Rack-Scale-Systeme, proprietäre Netzwerktechnik und Zentralprozessoren mittels der kommenden Vera-Rubin-Plattform stellt praktisch sicher, dass das Unternehmen mittelfristig einen wachsenden Anteil der weltweiten Investitionsausgaben für Rechenzentren für sich beansprucht.

Der Übergang vom absoluten Monopolisten zum marktbeherrschenden Marktführer ist in vollem Gange. Die rasche Reifung kundenspezifischer Chips der Hyperscaler, gepaart mit anhaltenden Hardware-Iterationen direkter Wettbewerber und neuen Marktteilnehmern, die auf spezialisierte Inferenz-Architekturen abzielen, wird den historischen Spielraum des Unternehmens zwangsläufig einengen. Während physische Packaging-Beschränkungen und ein branchenweiter Energie-Engpass den kurzfristigen Volumenausbau begrenzen, bleiben die Preismacht und die Bindungskraft des Ökosystems absolut. Unterstützt durch eine gleichmäßig verteilte Umsatzaufteilung zwischen Cloud und Unternehmen sowie die proaktive Transformation in ein softwaredefiniertes Ökosystem, bewahrt das Kerngeschäftsmodell eine tiefgreifende strukturelle Beständigkeit.

Als Nächstes lesen

ERock im Fokus: Rekord-Auftragseingang trifft auf hohen Kapitalbedarf und etablierte Industriegiganten

2026-06-08

Forbright im Porträt: Neuausrichtung des Geschäftsbanken-Modells durch Asset-Light-Gebühren und digitale Einlagen-Aggregation

2026-06-08

Parabilis Medicines im Fokus: Herausragende Wirksamkeit bei β-Catenin trifft auf Hürden bei der intravenösen Verabreichung und geopolitische Konzentrationsrisiken

2026-06-08

Liftoff Mobile im Porträt: Entkopplung und Dominanz in der unabhängigen App-Ökonomie

2026-06-08

NVIDIA-Transkript: Vera Rubin KI-Plattform in Serienproduktion – Agenten verändern die Ökonomie des Computings

2026-06-06

Bloomberg Live: Broadcom-Chef Hock Tan erklärt M&A für beendet – OpenAI-Chips sollen bis Jahresende in Produktion gehen

2026-06-05

Haftungsausschluss: Dieser Artikel dient nur zu Informationszwecken und stellt keine Anlageberatung oder eine Empfehlung zum Kauf, Verkauf oder Halten von Wertpapieren dar. Unsere Analysten bieten eine detaillierte Abdeckung von Unternehmensereignissen, können jedoch Fehler machen; führen Sie immer Ihre eigene Due-Diligence-Prüfung durch. Die geäußerten Ansichten und Meinungen spiegeln nicht unbedingt die von DruckFin wider. Wir haben nicht alle hier verwendeten Informationen unabhängig verifiziert, und sie können Fehler oder Auslassungen enthalten. Konsultieren Sie einen qualifizierten Finanzberater, bevor Sie eine Anlageentscheidung treffen. DruckFin und seine verbundenen Unternehmen lehnen jede Haftung für Verluste ab, die durch das Vertrauen auf diese Inhalte entstehen. Die vollständigen Bedingungen finden Sie in unseren Nutzungsbedingungen.