NVIDIA-Transkript: Vera Rubin KI-Plattform in Serienproduktion – Agenten verändern die Ökonomie des Computings
GTC Taipei 2026 Keynote – 1. Juni 2026
Jensen Huang kündigte auf der GTC in Taipeh an, dass NVIDIAs ehrgeizige Vera Rubin-Plattform nun in die Serienproduktion gegangen ist. Er bezeichnete dies als den bedeutendsten Wandel in der Computertechnik seit der PC-Revolution. Die Keynote, die zeitgleich in 70 Veranstaltungen in ganz Taiwan übertragen wurde, unterstrich, dass die Ära der produktiven KI begonnen hat und sich die ökonomischen Grundlagen der Computertechnik grundlegend gewandelt haben.
Die Ökonomie der KI: Tokens als Umsatztreiber
Huang eröffnete die Veranstaltung mit dem Nachweis, dass agentenbasierte KI den Sprung vom Versprechen zur Produktivität geschafft hat. Anhand von GitHub-Commit-Daten verdeutlichte er, dass 30 Millionen Softwareentwickler im Jahr 2023 insgesamt 300 Millionen Commits erzeugten, bis 2025 waren es bereits 500 Millionen. In den ersten Monaten des Jahres 2026 hat sich diese Zahl auf etwa 900 Millionen nahezu verdreifacht.
Die wirtschaftlichen Auswirkungen sind tiefgreifend. Huang erklärte, dass drei Billionen Dollar an Entwicklergehältern nun eine Produktivität erzeugen, für die früher neun Billionen Dollar an menschlicher Arbeitskraft erforderlich gewesen wären. Dies sei der erste greifbare Beweis dafür, dass KI messbares BIP-Wachstum generiert. Entgegen der Befürchtungen eines Arbeitsplatzabbaus würden Unternehmen sogar mehr Softwareingenieure einstellen, da der Output pro Ingenieur massiv an Wert gewonnen habe.
Dieser Produktivitätsschub hat eine beispiellose Nachfrage nach Recheninfrastruktur ausgelöst. Huang stellte fest, dass Tokens nun profitable Umsatzträger sind. Da KI-Unternehmen diese in deutlich größeren Mengen generieren wollen, treibt dies das explosive Wachstum des taiwanesischen Halbleiter-Ökosystems an. Er verwies auf das prognostizierte taiwanesische BIP-Wachstum von fast 10 Prozent als direkten Beleg für diesen Rechenbedarf.
Das Modell des Agentic Computing verstehen
Huang erläuterte ausführlich, wie sich Agenten grundlegend von traditionellen Anwendungen unterscheiden. Ein Agent besteht aus einem Large Language Model (LLM), das in ein Framework (Harness) eingebettet ist, welches Beobachtung, Schlussfolgerung, Planung und Aktion koordiniert. Der Agent nutzt Werkzeuge – Tabellenkalkulationen, Webbrowser, Datenbanken oder spezialisierte Rechen-Engines –, die alle vom Framework verwaltet werden, ähnlich wie ein Betriebssystem Anwendungen steuert.
Die Demonstration umfasste die Erstellung einer GIF-Animation des Taipei 101-Gebäudes durch einfache Textbefehle, die Generierung von CAD-Dateien für den 3D-Druck aus verbalen Beschreibungen sowie die Ausführung komplexer Aufgaben mittels natürlicher Sprache. Huang betonte, dass sich das Paradigma verschoben habe: Weg vom Starten von Anwendungen und Klicken auf Schaltflächen, hin zur Vermittlung von Absichten an die KI, die dann Code generiert oder Werkzeuge einsetzt, um Ergebnisse zu liefern.
Eine zentrale Erkenntnis betraf die Nutzung von Werkzeugen. Huang widersprach der Auffassung, dass agentenbasierte KI Softwareunternehmen überflüssig machen würde. Im Gegenteil: Da die Welt nicht mehr durch die Anzahl menschlicher Arbeitskräfte begrenzt sei, würden Agenten exponentiell mehr Werkzeuge nutzen, als Menschen es jemals könnten. Dies biete eine beispiellose Chance für Softwareanbieter, sofern ihre Werkzeuge für Agenten zugänglich gestaltet seien.
Die Herausforderung des disaggregierten Computings
Das Modell des Agentic Computing stellt die ultimative disaggregierte und verteilte Computerarchitektur dar. Verschiedene Komponenten laufen in unterschiedlichen Bereichen eines Rechenzentrums. Der Denkprozess des LLM aktiviert ganze Racks von Grace Blackwell NVLink 72-Systemen. Die Nutzung von Werkzeugen aktiviert CPUs, die Compiler, Python, JavaScript oder beschleunigte Bibliotheken ausführen. Sicherheits-Frameworks laufen auf CPUs und DPUs wie NVIDIAs BlueField. Die Orchestrierung erfolgt auf CPUs, die den gesamten Workflow steuern.
Das Speichermanagement erwies sich als eine der komplexesten Herausforderungen. Der Arbeitsspeicher, das sogenannte KV-Caching, muss die Komprimierung und den Abruf sowohl strukturierter als auch unstrukturierter Daten bewältigen. Die Ontologie und die Beziehungen zwischen Datenstrukturen erfordern extrem komplizierte Verarbeitungsprozesse. Huang prognostizierte, dass KI-Speichersysteme die Speicherinfrastruktur vollständig revolutionieren werden.
Genau für diese heterogene, disaggregierte Architektur hat NVIDIA Vera Rubin entwickelt. Huang betonte, dass Vera Rubin kein einzelner Chip sei, sondern ein vollständiges End-to-End-System, bestehend aus GPUs, CPUs, Speichersystemen, ConnectX-9-Netzwerken, Sicherheitsprozessoren und Software-Stacks. Alles implementiert Confidential Computing, da KI-Modelle von hohem Wert sind. Jede dieser Komponenten wäre für sich genommen eine Revolution; zusammen repräsentieren sie NVIDIAs ehrgeizigstes Projekt.
NVIDIA als Infrastrukturunternehmen
Huang erklärte, dass sich NVIDIA von einem GPU-Unternehmen zu einem System- und nun zu einem Infrastrukturunternehmen gewandelt habe. Das Ökosystem umfasst mittlerweile Stromerzeuger, Kühlsysteme und Netzbetreiber. NVIDIAs Ziel ist der Aufbau kompletter Infrastruktur-Stacks, damit Kunden sogenannte „KI-Fabriken“ errichten können.
Er stellte DSX vor – den Infrastruktur-Bauplan, der auf RTX für GPUs und DGX für Systeme folgt. DSX beinhaltet DSX Sim, einen auf Omniverse basierenden Simulator, in dem Partner ganze KI-Fabriken entwerfen und validieren, bevor ein einziges Rack bestellt wird. Layouts werden geplant, Strom und Kühlung simuliert, Netzwerke entworfen und jede Änderung in einem digitalen Zwilling getestet.
DSX OS stellt die Infrastruktur bereit, betreibt, überwacht und repariert sie, wodurch installierte Systeme in vertrauenswürdige, mandantenfähige und resiliente KI-Kapazitäten verwandelt werden. Zu den bahnbrechenden Innovationen gehört DSX MaxLPS, das es Betreibern ermöglicht, mehr GPUs innerhalb desselben Strombudgets einzusetzen, indem die Überprovisionierung von 40 Prozent auf nahezu null reduziert wird – was jährlich Milliarden an zusätzlichem Umsatz generiert. Die Flüssigkeitskühlung bei 45 Grad Celsius verbraucht weniger Wasser und Energie. Dynamische Stromverteilung leitet Energie zwischen Racks um und gewinnt so „gestrandete“ Watt zurück. KI-Agententeams koordinieren kontinuierlich die Balance zwischen Kühlung und Strom, um Arbeitslastanforderungen zu erfüllen.
Huang zeigte, wie DSX-KI-Fabriken als flexible Energieanlagen fungieren, die kooperativ mit dem Stromnetz zusammenarbeiten. DSX Flex liest Echtzeit-Netzsignale und passt den Stromverbrauch dynamisch an, wenn das Netz Entlastung benötigt. Da bis Ende des Jahrzehnts 100 Gigawatt an KI-Fabriken online gehen sollen, führen diese Effizienzsteigerungen zu massiven wirtschaftlichen Vorteilen.
Die vier Faktoren des Wettbewerbsvorteils
Huang präsentierte den aus seiner Sicht definitiven Rahmen zur Bewertung von Investitionen in KI-Infrastruktur. Er zeigte eine Kurve, die darstellt, wie schnell Infrastruktur online geht, wie hoch ihr Durchsatz, ihre Zuverlässigkeit und ihre Nutzungsdauer sind. Da diese Systeme Investitionen von 50 bis 100 Milliarden Dollar darstellen, wirkt sich jeder Faktor dramatisch auf den Return on Investment aus.
Die Zeit bis zum ersten Token ist entscheidend. NVIDIAs voll integrierter Ansatz – bei dem jede Komponente gemeinsam entwickelt und das gesamte System simuliert wird – ermöglicht eine wesentlich schnellere Bereitstellung als bei der Konkurrenz. Das Unternehmen hat selbst Infrastruktur im Wert von Milliarden Dollar aufgebaut, um die korrekte Funktion sicherzustellen.
Durchsatz pro Watt ist gleich Umsatz. Wenn ein Rechenzentrum eine Stromkapazität von einem Gigawatt hat, ist das die feste Obergrenze. Da jeder Token profitabel ist, korreliert der Durchsatz pro Watt direkt mit dem Umsatz. Huang betonte, dass die Wahl günstigerer Chips ohne Berücksichtigung der Leistung pro Watt ökonomisch irrational sei. Er stellte nachdrücklich fest: „Je mehr Sie kaufen, desto mehr verdienen Sie.“
Zuverlässigkeit – gemessen als mittlere Zeit zwischen Unterbrechungen – ist bei großem Maßstab extrem wertvoll. Rechenzentren enthalten Millionen von Kabeln und Komponenten. NVIDIAs langjährige Erfahrung im Betrieb in sehr großem Maßstab verschafft einen signifikanten Vorteil bei einem harmonischen, zuverlässigen Betrieb.
Die Systemlebensdauer sorgt für die dramatischsten Unterschiede. In den vier Jahren seit der Einführung von Hopper hat sich die KI grundlegend gewandelt. Vor sechs Jahren, zu Zeiten von Ampere, sah die KI völlig anders aus. Die Industrie entwickelte sich von CNNs über Transformer zu Mixture-of-Experts-Modellen hin zu agentenbasierten Systemen. Wenn die Architektur nicht flexibel und das Ökosystem nicht reichhaltig ist, ist die Nutzungsdauer kurz. Da NVIDIA-Systeme weltweit im Einsatz sind und Softwareentwickler mit CUDA starten, garantiert das Ökosystem eine lange Nutzungsdauer und niedrige Gesamtbetriebskosten (TCO).
Vera Rubin: Ankündigung der Serienproduktion
Huang gab bekannt, dass Vera Rubin nun in die Serienproduktion gegangen ist – eine Aussage, die von anhaltendem Applaus begleitet wurde. Die Lieferkette, die NVIDIA für Vera Rubin aufgebaut hat, ist doppelt so groß wie bei Grace Blackwell. Der Fertigungsdurchsatz hat sich dramatisch verbessert: Die Montage, die pro Grace Blackwell-Rack zwei Stunden dauerte, benötigt nun fünf Minuten. Millionen Quadratfuß an Fertigungskapazität wurden für Grace Blackwell in Betrieb genommen und werden nun für Vera Rubin hochgefahren.
Die Videopräsentation detaillierte das Fertigungswunder in der gesamten Lieferkette. Die sieben neuen Chips, aus denen Vera Rubin besteht, durchlaufen Hunderte von Verarbeitungsschritten bei TSMC unter Verwendung der 3-Nanometer-Prozesstechnologie, CoWoS-Advanced-Packaging und HBM4-Speicher von Micron, SK Hynix und Samsung. Die Vera Rubin-GPU enthält sechs Billionen Transistoren mit über 18.000 Komponenten auf einer einzigen Platine.
Vera Rubin NVL72 übernimmt das Denken – Prompt-Verarbeitung, Kontextverständnis, Schlussfolgerung und Planung. Ein neues modulares Compute-Tray verfügt über eine optimierte PCB-Midplane. ConnectX-9, SuperNICs und BlueField-4 DPUs sind wartungsfreundlich und ohne Kabel für Resilienz und Skalierbarkeit ausgelegt. Achtzehn Compute-Trays und neun Hot-Swap-fähige NVLink-Switch-Trays sind über neue, hocheffiziente flüssigkeitsgekühlte Sammelschienen verbunden, die über 5.000 Ampere führen – das entspricht 20 Elektroautos bei voller Beschleunigung. Insgesamt bilden 1,3 Millionen Komponenten das MGX-Rack der dritten Generation.
Huang gratulierte Microsoft, Dell und CoreWeave zur Inbetriebnahme betriebsbereiter Vera Rubin NVL72-Engineering-Racks. Das Vera CPU-Rack enthält 256 CPUs in einem einzigen flüssigkeitsgekühlten Rack, die Modelle orchestrieren, Speicher verwalten und Werkzeuge starten. Foxconn und Quanta fertigten das Vera LPX-Rack mit 256 Groq-LPUs über 16 Trays, die 40 Petabytes pro Sekunde an SRAM-Bandbreite für extrem niedrige Latenz liefern. Während NVL72 Tokens mit höchstem Durchsatz generiert, erzeugt LPX sie mit geringster Latenz.
Vera BlueField-4 STX dient als KI-Speicher – die Speicherverarbeitung wird durch BlueField-4 beschleunigt, das Speicher, Storage und In-Silicon-Sicherheit verbindet. NVIDIA Spectrum-X Ethernet Photonics ist der weltweit erste Ethernet-Switch mit 200-Gigabit Co-Packaged Optics, der den TSMC CoWoS-Prozess, Chip-Scale-Packaging und ultra-leistungsstarke Laser-Dies auf Indiumphosphid-Basis nutzt.
Das Gesamtsystem umfasst fünf verbundene Rack-Scale-Systeme. Es waren 150 Lieferkettenpartner in ganz Taiwan und Millionen Quadratfuß an Fabrikfläche an Hunderten von Standorten beteiligt. Huang betonte, dass Vera Rubin nicht nur für den Betrieb von KI, sondern spezifisch für den Betrieb von Agenten gebaut wurde. Die Komplexität der Agentenarchitektur stellt den letzten großen Durchbruch in der Informatik dar und erfordert das fortschrittlichste Computersystem der Welt.
Vera Rubin Hardware-Demonstration
Physische Rack-Systeme wurden zur Begutachtung auf die Bühne gebracht. Huang zeigte das Vera Rubin NVL72, das LPX-Rack, das Vera CPU-Rack mit 256 flüssigkeitsgekühlten CPUs, das Vera BlueField-Speicherverarbeitungs- und Sicherheitssystem sowie die Mellanox-Netzwerktechnik mit den weltweit ersten Co-Packaged Optics.
Das Design verzichtet auf Kabel, Schläuche und Lüfter. Eine PCB-Midplane verbindet beide Seiten, was früher umfangreiche Verkabelungen erforderte. Die Verbesserungen bei Zuverlässigkeit und Resilienz sind substanziell. Huang präsentierte das Vera CPU-Tray und das Storage-Tray, die zwei Vera CPUs, vier ConnectX-9-Einheiten und enorme Speicherkapazitäten enthalten. Das Groq LPX-Rack bietet Inferenz mit sehr niedriger Latenz und erweitert die Durchsatzfähigkeiten von Vera Rubin. Das NVLink-Switch-Tray repräsentiert eine revolutionäre Technologie, die es NVIDIA ermöglicht, zum größten Netzwerkunternehmen der Welt zu werden.
NVIDIA Vera CPU: Computing für Agenten
Huang stellte die Vera CPU als grundlegend anders als alle bisherigen Prozessoren vor. Traditionelle CPUs wurden für Menschen geschaffen, die in einer Welt leben, die in Sekunden zählt, wobei die Cloud-Ökonomie darauf basierte, CPU-Kerne pro Stunde zu mieten. Agenten leben in einer Welt, die in Nanosekunden zählt. Sie sind ungeduldig. Wenn Agenten Werkzeuge nutzen oder auf Datenbanken zugreifen, verhindert jeder Moment des Wartens, dass sie zum nächsten Schritt übergehen können. CPUs so latenzarm und interaktiv wie möglich zu gestalten, ist daher von entscheidender Bedeutung.
Innerhalb von Vera Rubin-Systemen erfüllen CPUs drei Funktionen. Zwei CPUs in jedem Vera Rubin-Rack orchestrieren und verwalten GPUs, steuern den KV-Cache und verwalten die Rack-Software. Grace BlueField-CPUs sorgen für Sicherheit und Isolierung. Vera Compute-CPUs handhaben das Framework, die Orchestrierung von KI-Modellen, die Werkzeugnutzung und den Datenbankzugriff. Vera BlueField-CPUs treiben die schnellsten jemals gebauten Speicherserver an.
Diese Systeme befinden sich im kritischen Pfad des teuersten Teils des Rechenzentrums. Die Ökonomie konzentriert sich auf die Token-Generierung, und die CPU-Infrastruktur darf diese primäre Funktion nicht behindern. Dies erforderte von NVIDIA den Aufbau einer völlig neuen Architektur von Grund auf – eine CPU, wie die Welt sie noch nie gesehen hat, gebaut für Agenten statt für Menschen.
Huang skizzierte vier definierende Merkmale. Erstens muss die Anzahl der Instruktionen pro Takt (IPC) unglaublich hoch sein, da die Latenz kurz sein muss. Nicht der Durchsatz, sondern die Single-Threaded-Performance muss Weltklasse sein. Vera erreicht die weltweit höchste IPC, indem sie 10 Instruktionen pro Takt abruft, dekodiert und ausführt.
Zweitens muss die Bandbreite pro Kern außergewöhnlich hoch sein, um Daten schnell in die CPU hinein und wieder heraus zu bewegen. Drittens muss die Gesamtbandbreite im System Weltklasse sein. Da agentenbasierte Systeme fundamental disaggregiert und verteilt sind, wird die Vernetzung zur zentralen Herausforderung. Daten müssen so schnell wie möglich zwischen CPU-Kernen, zwischen CPU und Speicher sowie zwischen CPU und GPU bewegt werden. Die Bandbreite um und innerhalb des Systems muss alle bisherigen Standards übertreffen.
Vera ist die erste CPU, die an radikalen Grenzen gebaut wurde, mit einem Fabric, das alle CPU-Kerne mit Lichtgeschwindigkeit verbindet – 3,6 Terabytes pro Sekunde ohne „Trip Boundary Crossings“. Alle CPU-Kerne kommunizieren mit extrem hoher Bandbreite und arbeiten zusammen, anstatt individuell gemietet zu werden. Die Querschnittsbandbreite ist beispiellos. Vera ist die erste CPU, die PCIe Gen 6 und LPDDR5 mit 1,2 Terabytes pro Sekunde nutzt – das Zwei- bis Dreifache der Bandbreite der leistungsstärksten CPUs auf dem Markt.
Viertens ist Energieeffizienz kritisch. Die Anzahl der CPUs wird sehr hoch sein, da es Milliarden von Agenten geben wird, verglichen mit nur einer Milliarde Menschen, die traditionelle CPUs nutzen. Agenten nutzen CPUs mit wenig Geduld, weil die Kosten der angrenzenden GPUs zu hoch und zu wertvoll sind. CPUs müssen sowohl leistungsfähig als auch extrem energieeffizient sein, um den CPU-Einsatz zu maximieren, ohne Strom von der Token-Generierung abzuziehen.
Im Vergleich zu den leistungsstärksten x86-Prozessoren sind die realen Verbesserungen der Single-Threaded-Performance von Vera außergewöhnlich. Huang merkte an, dass eine Verbesserung von fünf Prozent bei CPUs unglaublich, zehn Prozent bemerkenswert seien, aber Veras Geschwindigkeitszuwächse seien schlichtweg beispiellos.
Vera CPU Leistungsbenchmarks
Die Videopräsentation detaillierte den NVIDIA Olympus-Kern im Herzen von Vera, der speziell für moderne Workloads in Rechenzentren entwickelt wurde, einschließlich zweiglastiger Python-Runtimes, Werkzeugaufrufen und Sandbox-Code-Ausführung. Jeder Kern ist auf Durchsatz optimiert, mit einem neuronalen Branch-Predictor, der zwei genommene Verzweigungen pro Zyklus bewertet, einer 10-breiten Decode-Engine, einer großen Out-of-Order-Engine und fortschrittlichen Prefetchern mit einer neuartigen Graph-Engine, die den nächsten Datenabruf antizipiert.
Vera ist die erste CPU, die LPDDR5X-Speicher verwendet und gleichzeitig mehrere Fehler korrigiert, ohne die Bandbreite zu beeinträchtigen. Sie erreicht eine um 40 Prozent geringere Spitzen-Speicherlatenz gegenüber x86, was die Kerne bei Abruf, Analytik und Sandbox-Ausführung auf Trab hält. NVIDIAs skalierbares Kohärenz-Fabric der zweiten Generation vereint alle 88 Olympus-Kerne auf einem monolithischen Mesh. Speicher und Kerne sind nicht über Chiplets aufgeteilt, was eine 50 Prozent schnellere Kommunikation zwischen den Kernen ermöglicht als bei traditionellen CPUs. Speicher-kohärentes NVLink (Chip-to-Chip) verbindet GPUs direkt mit der CPU und kann Vera für massive Inter-CPU-Bandbreite auf mehrere Sockel skalieren.
Huang präsentierte Benchmark-Ergebnisse, die das Publikum in Erstaunen versetzten. SQL – die berühmteste domänenspezifische Sprache – läuft auf Vera dreimal so schnell, nicht 10 oder 25 Prozent schneller. Bei der Echtzeit-Stream-Verarbeitung, besonders wichtig für Fabriken und Börsen, liefert Vera eine sechsfache Geschwindigkeitssteigerung. Er hob die Partnerschaft mit Lynn Martin, Präsidentin der New York Stock Exchange, hervor und merkte an, dass dieses System weltweit in Echtzeit läuft.
Diese „X-Faktor“-Verbesserungen bei realen Workloads sind für CPUs selten. Huang drückte seinen Stolz auf die Leistung des Teams aus und gab einen Ausblick auf eine außergewöhnliche Roadmap. Partnerschaften mit Early Adoptern erstrecken sich über die gesamte Industrie; Taiwans ODMs und Computerhersteller bringen die Systeme auf den Markt. Die Early Adopter sind agentenbasierte Unternehmen, was den Beginn eines neuen Marktes markiert, der so nie existierte – CPUs für Agenten statt für Menschen. Dieser Markt wird sicherlich größer sein als frühere CPU-Märkte, da es viel mehr Agenten als Menschen geben wird und Agenten sehr ungeduldig sind.
Das NVIDIA Agent Toolkit für Enterprise AI
Huang betonte, dass das von ihm beschriebene Anwendungsmuster – Agenten mit Frameworks, die LLMs orchestrieren – das nächste Jahrzehnt des Computings definieren wird. Jedes Unternehmen wird zu einem Agenten-Unternehmen werden, in dem Agenten intern arbeiten. Jedes Unternehmen wird Betriebssysteme für Agenten benötigen und sich fragen, wie man Agenten sicher betreibt und für die eigenen Workloads baut.
Das NVIDIA Agent Toolkit für Enterprise AI adressiert diese Bedürfnisse. Huang merkte an, dass NVIDIA alles „im offenen Licht“ baut – ein Blick auf frühere GTCs zeige, dass die heutigen Ankündigungen bereits vor Jahren angedeutet wurden. Er hat über dieses Toolkit seit mehreren Jahren gesprochen und auf diesen Moment hingearbeitet.
Unternehmen benötigen vier Dinge, um Agenten als Dienstleistung zu bauen oder intern zu betreiben. Erstens Modelle – Large Language Models, die intelligent, kostengünstig und schnell sind. Zweitens ein Framework zur Orchestrierung. Drittens Werkzeuge, die die Modelle nutzen wollen, zusammen mit Fähigkeiten. Die CUDA-X-Bibliotheken werden zu erstaunlichen Werkzeugen für zukünftige Agenten. Viertens eine Runtime – das Betriebssystem, das alles zusammenhält.
Das Toolkit enthält Modelle, die Benutzer modifizieren können, sowie verschiedene erstklassige offene Modelle, weitere werden folgen. Es führt Agenten jedes Anbieters – Claude Code, Codex oder andere – innerhalb von NVIDIA OpenShell aus, einem hochsicheren Framework für den Unternehmenseinsatz. OpenShell schützt Agenten, hält sie in Sicherheitsrichtlinien verankert, schützt die Privatsphäre, gewährt angemessene Rechte und Privilegien und schützt die Identität. Dieses Open-Source-Framework wird weltweit von Red Hat, Canonical, Microsoft und vielen anderen übernommen.
Die Runtime ist vollständig für die NVIDIA AI-Plattform optimiert, die überall verfügbar ist. OpenShell läuft in jeder Cloud, On-Premises und sogar auf Endgeräten. Benutzer haben Werkzeuge und Bibliotheken, die Agenten nutzen können, Modelle zum Modifizieren oder zur direkten Nutzung sowie Agenten-Frameworks wie OpenClaw und Hermes. Diese können On-Premises oder überall sonst ausgeführt werden. Dies repräsentiert das Betriebssystem des modernen Unternehmens.
Cadence Chip Design Super Agent
Einer von Huangs bevorzugten Anwendungsfällen betrifft Chipdesigner, was er als die wichtigste Tätigkeit von NVIDIA bezeichnete. Das Unternehmen ging eine Partnerschaft mit Cadence ein, um einen Chip-Design-Super-Agenten zu bauen, der von Codex oder Claude Code orchestriert wird. Er verarbeitet RTL, Architekturdiagramme, Schaltpläne oder Spezifikationen als Eingabe, zusammen mit allem, was korrigiert werden muss. Gemeinsam schufen sie Super-Agenten, die für die NVIDIA-Plattform mit Nemotron optimiert sind.
Die Demonstration zeigte, wie Hunderttausende von NVIDIA-Chips zusammenkommen, um KI-Fabriken zu bilden, die die weltweit führenden KI-Modelle antreiben. Das Design dieser Chips und ihrer Systeme stellt eine der schwierigsten technischen Herausforderungen dar – Billionen von Transistoren in dreidimensionalen Schaltkreisen im mikroskopischen Maßstab, jedes Gatter und jeder Draht synchronisiert auf Pikosekunden, arbeitend in perfekter Harmonie ohne Fehlertoleranz.
Physische Prototypen sind zu langsam und kostspielig, daher arbeiten Ingenieure digital. Jeder Chip beginnt als Architekturspezifikation, die in RTL übersetzt wird – die Sprache des Chipdesigns. RTL muss in der Simulation verifiziert werden. Ein einziger Fehler kann einen Chip um Monate verzögern. Bei NVIDIA verbringen Tausende von Ingenieuren jährlich Milliarden von Rechenstunden damit, Millionen von Tests in einem Zyklus zu schreiben, auszuführen und zu debuggen, der Teams Wochen kostet.
Um diesen Zyklus zu komprimieren, bauten Cadence und NVIDIA einen Design-Verifizierungs-Agenten. Codex orchestriert den Prozess. Cadence Chip Stack startet die RTL-Verifizierungsschleife, angetrieben von Nemotron und gesichert durch OpenShell, wobei Experten-Sub-Agenten für RTL-Generierung, Testbench-Erstellung, Regressionstests und Debugging aufgerufen werden. Das System steuert sich selbst und führt Hunderte von Simulationen mit Cadence Xcelium und formaler Verifizierung mit JasperGold durch. Designfehler werden aufgedeckt und Code-Fehler behoben. Was früher Wochen dauerte, dauert nun Stunden – Verifizierungszyklen sind über 40-mal schneller.
Huang betonte die Auswirkungen: von Wochen auf Stunden. NVIDIA hat Tausende von Chipdesignern und wird Hunderttausende von Cadence-Super-Agenten einstellen, um das Unternehmen zu beschleunigen, was größere Ambitionen, erstaunlichere Kreationen und schnellere Ausführung ermöglicht.
Nemotron 3 Ultra: Das Foundation Model
Das Agent-Toolkit beginnt mit exzellenten Modellen, die Partner wie Cadence für ihre Expertise modifizieren und tunen können, um proprietäre Super-Agenten mit proprietärem Wissen zu erstellen. Huang stellte Nemotron 3 Ultra vor, NVIDIAs nächstes offenes Modell, das darauf ausgelegt ist, offene Modelle für die Welt zu bauen, damit jeder seine eigenen Agenten erstellen kann.
Nemotron-Modelle bieten nicht nur das Modell selbst, sondern alle Trainingsdaten und Trainingsskripte. Durch eine Koalition unglaublicher Partner, die Daten beisteuern, trainiert Nemotron auf einer der weltweit größten Suiten von lang laufenden Schlussfolgerungsmodellen und Datensätzen zur Aufgabenlösung und Werkzeugnutzung. Alles – Modell, Trainingsskripte und Daten – wird vollständig zur Verfügung gestellt. Dies ist „Open Models“ in Bestform, das beste offene Modellsystem der Welt, mit dem simplen Ziel, Benutzern zu ermöglichen, alles zu nehmen, zu ergänzen, zu verbessern und sich zu eigen zu machen.
Nemotron 3 Ultra ist fünfmal schneller als frühere Modelle – das weltweit erste Modell, das auf einer hybriden Architektur aus State Space Models mit Mixture of Experts basiert. Die Architektur ist unglaublich schnell, sodass Benutzer schnell denken können. Wenn man schnell denkt, kann man bei gleichen Kosten länger denken. Es ist zudem 30 Prozent günstiger und erfordert 30 Prozent geringere Kosten bei den gesamten FLOPs und der gesamten Inferenzzeit als selbst die kosteneffizientesten Modelle der Welt. Es ist „Frontier Smart“, fünfmal schneller, 30 Prozent günstiger und vollständig offen. NVIDIA ist dieser Richtung voll und ganz verpflichtet. Nemotron 3 ist aktuell, Nemotron 4 ist in Entwicklung.
Enterprise Software Partner-Ökosystem
Huang adressierte die Fehlannahme, dass Agenten bestehende Unternehmenssoftwaremärkte stören würden. Er stellte nachdrücklich fest: „Ganz im Gegenteil.“ Das Toolkit ermöglicht Unternehmen wie Cadence, CrowdStrike, ServiceNow, Palantir und SAP, die größte Chance aller Zeiten zu schaffen. Agenten werden eine beispiellose Nachfrage nach Unternehmenssoftware-Funktionen erzeugen, sofern diese als Werkzeuge bereitgestellt werden, die Agenten nutzen können.
Die drei wichtigsten Ankündigungen bis zu diesem Punkt: Vera Rubin in Serienproduktion, Vera CPU gebaut für eine neue Generation des Computings mit Agenten und das NVIDIA Enterprise AI Toolkit, das jedem Unternehmen und jedem Softwareanbieter ermöglicht, Agenten zu bauen.
Den Personal Computer neu erfinden
Huangs Beziehung zu Taiwan und vielen Partnern begann vor 40 Jahren mit der PC-Revolution. Die moderne Computerindustrie begann in Taiwan mit Windows 1, Windows 2, Apple 1 und Apple 2. Als NVIDIA vor 33 Jahren auf den Markt kam, definierte Windows 3.1 den PC. Windows 95 machte den PC persönlich und verwandelte ihn von einem Unternehmenswerkzeug in ein Unterhaltungselektronikgerät, das jeder haben sollte.
Diese Computerplattform war durch intelligentes Design erfolgreich. Windows war nicht nur disaggregiert, sondern korrekt abstrahiert mit der richtigen Architektur – System-BIOS, offene Chipsätze, das Betriebssystem mit zur Laufzeit installierbaren Treibern und eine Abstraktionsschicht mit Multimedia-APIs, die den PC für das öffnete, was wir heute kennen. Jedes Element war für die Popularität des PCs essenziell.
Vierzig Jahre später erfinden Microsoft und NVIDIA den PC neu. Huang gab einen Ausblick auf ein Gespräch mit Satya Nadella, das für den nächsten Abend geplant war, um ihre Zusammenarbeit im Detail zu erläutern. Es dauerte drei Jahre, um die Funktionsweise des PCs vollständig neu zu erfinden, damit er für diesen Moment bereit ist.
Das Agent-Computing-Muster wird in KI-Clouds, innerhalb von Unternehmen und auf PCs laufen. Wenn ein PC einen autonomen Agenten hat, der den Benutzer versteht, mit ihm sprechen kann, ihn ansehen kann und gebeten werden kann, Dinge neu zu ordnen, Recherchen durchzuführen und viele andere Aufgaben zu erledigen – was passiert dann mit diesem PC? Das neue Betriebssystem ist das alte Betriebssystem plus Large Language Models. LLMs sind die moderne Version von DirectX – eine Intelligenzerweiterung des PCs mit Ein- und Ausgabe, Verständnis von Prompts und Computer Vision, Generierung von Video und Ton. Die Anwendungsschicht wird durch eine agentenbasierte Runtime ersetzt. Der Agent ist die moderne Anwendung.
Einführung von NVIDIA RTX Spark
Die Videopräsentation stellte RTX Spark als den Höhepunkt der 33-jährigen Lernerfahrung von NVIDIA vor, destilliert in einen einzigen Chip – eine Neugestaltung des PCs für das Zeitalter der KI. Agenten, die nativ laufen und mit lokalen oder Cloud-Modellen verbunden sind, werden zu persönlichen KIs, die für Sicherheit in einer Sandbox laufen, kontinuierlich arbeiten und Aufgaben erledigen. Die Chips und das Betriebssystem müssen sich gemeinsam weiterentwickeln.
RTX Spark enthält eine Blackwell RTX-GPU mit 6.144 Tensor Cores, die eine Petaflop KI-Leistung liefert. Eine maßgeschneiderte 20-Kern-Grace-CPU wurde in Partnerschaft mit MediaTek gebaut, durch NVLink mit 128 Gigabytes an Unified Memory verschmolzen. Unter Verwendung des 3-Nanometer-Prozesses von TSMC enthält er 70 Milliarden Transistoren. In enger Zusammenarbeit mit Microsoft wurde eine Windows-Plattform für Agenten geschaffen. Dies ist der Beginn einer neuen Personal-Computing-Revolution, die mit RTX Spark beginnt.
Huang betonte, dies sei der schönste jemals gebaute Chip, geschaffen in Partnerschaft mit MediaTek. Er bemerkte, dass er Rick Tsai im Publikum sehe. Der Chip sei außergewöhnlich, weil er 33 Jahre Bauzeit benötigte – in dem Sinne, dass 100 Prozent der NVIDIA-Software darauf laufen. Digitale Biologie, seismische Verarbeitung, Astrophysik, alle CUDA-bezogene Physik, Biologie, Genomik, KI und Computergrafik funktionieren ohne Probleme. Jede einzelne Anwendung, die NVIDIA jemals geschaffen hat, und jede Anwendung, die Windows jemals ausgeführt hat, läuft auf diesem System. Microsoft und NVIDIA haben alles akribisch optimiert, sodass dieser Computer buchstäblich alles ausführt, was die Welt jemals geschaffen hat, plus Agenten.
Das System kann ein lokales Nemotron 3 Ultra-Modell, Nemotron 3, Claude Code, Codex oder andere Modelle in der Cloud oder im Netzwerk ausführen. Eine Demonstration zeigte einen architektonischen Design-Workflow, bei dem ein lokal auf RTX Spark laufender Agent beim Entwurf eines Hauses mit Laptop-Werkzeugen hilft. Mit einer OpenShell-Sandbox, die das Hermes-Framework ausführt und mit Claude Sonnet in der Cloud verbunden ist, wählt der Benutzer einen Standort, teilt Konzeptskizzen und Moodboards und liefert eine Textbeschreibung der Anforderungen und Designabsichten.
Der Agent öffnet Rhino und modelliert den Standort, formt das Gelände, Abstände und die Gebäudehülle. Er schlägt Gebäudeformen vor, die für Kosten, Komfort und Qualität optimiert sind. Sobald die Form definiert ist, generiert er das Innenlayout mit Wänden, Zirkulation und Räumen. Der Benutzer kann jederzeit eingreifen, um Anpassungen oder Änderungen vorzunehmen. Türen, Fenster und strukturelle Elemente werden automatisch platziert. Der Agent erkennt seine eigenen Fehler und behebt sie. Nach der Genehmigung exportiert er das Modell aus Rhino in Blender, wobei Materialien und Objekteigenschaften mit intaktem Designkontext übertragen werden. Der Benutzer verfeinert Materialien und wählt Einstellungen. Blender rendert das Haus. Der Agent nutzt generative KI mit dem Flux 2-Modell, um Renderings fotorealistisch mit mehreren Blickwinkeln und Lichtverhältnissen zu gestalten. Was einst ein komplexer Workflow war, wird nun von einem Agenten auf RTX Spark geleitet und vereinfacht – entworfen mit der Geschwindigkeit der Vorstellungskraft.
Adobe-Partnerschaft und Branchenunterstützung
Entwickler sind begeistert von den Fähigkeiten von RTX Spark – Beschleunigung, Software-Fähigkeiten und Partnerschaften machen es für jeden unglaublich. Adobe hat die Architektur und den Kern von Photoshop und Premiere für RTX Spark neu entwickelt und liefert die doppelte Geschwindigkeit. Die Anwendungen sind bereits schnell und werden nun doppelt so schnell sein. Sie sind zudem so konzipiert, dass sie agentenfreundlich sind, mit MCP-Servern, die mit Agenten auf dem Laptop interagieren können.
Die Anzahl der Partner, die RTX Spark auf den Markt bringen, ist außergewöhnlich. Huang nannte dies die erste große PC-Neuerfindung seit 40 Jahren. Er drückte seine Freude darüber aus, dass sich das globale Ökosystem dieser Anstrengung angeschlossen hat. Im Grunde wird jeder große PC-Hersteller RTX Spark unterstützen und unglaublich intelligente, leistungsstarke und schöne Laptops bauen.
Komplette Neuerfindung der PC-Linie
RTX Spark repräsentiert die Neuerfindung des Laptops, aber Microsoft und NVIDIA erfinden den gesamten PC neu. Huang kündigte eine völlig neue Linie an – drei revolutionäre Windows-Maschinen für Desktop, Laptop und Workstation – alle 100 Prozent Windows-kompatibel, 100 Prozent CUDA, 100 Prozent NVIDIA AI Tensor Core. Alles, was auf NVIDIA-Plattformen weltweit läuft, läuft auf diesen Systemen. Dies ist die erste komplett neu entwickelte, neu erfundene PC-Linie seit 40 Jahren.
Das Desktop-System von MSI kann Agenten rund um die Uhr ohne „Meter-Angst“ ausführen. Benutzer können Agenten herunterladen, die kontinuierlich ohne Sorge vor Kosten laufen. Das System verbindet sich im ganzen Haus – mit Laptops, Displays, Kameras, Haushaltsgeräten, Warmwasserbereitern, Sicherheitssystemen. Es wird zu einem persönlichen KI-Agenten, der mit der Zeit intelligenter wird, während sich Nemotron durch die Versionen 3, 4, 5, 6 und darüber hinaus weiterentwickelt. Der Agent sitzt zu Hause und hilft bei Aufgaben wie der Reisebuchung.
Die DGX Station repräsentiert die Workstation-Lösung – kompatibel mit Windows, führt alles in Windows aus, mit 768 Gigabytes an Speicher, was die Ausführung von Modellen mit Billionen von Parametern ermöglicht. Dies ist eine beispiellose Fähigkeit. Mit 20 Petaflops und acht Terabytes pro Sekunde Speicherbandbreite steht dieses System am Schreibtisch des Entwicklers. Für Entwickler von Large Language Models und Agenten bietet diese Rechenleistung am Schreibtisch alles, was für die Entwicklung benötigt wird, wobei die Cloud-Bereitstellung folgt.
Die Zukunft des Personal Computing
Huang zog eine Analogie zu Telefonen vor 15 bis 20 Jahren. Das heutige Telefon wird für so ziemlich alles verwendet, außer zum Telefonieren – es bedeutet etwas ganz anderes als in der Vergangenheit. Er ist sich sicher, dass der PC eine ähnliche Transformation durchlaufen wird. In 10 Jahren wird der PC völlig anders sein als das heutige Werkzeug, bei dem man Anwendungen startet, klickt und tippt.
Huang theoretisierte, dass es eines Tages, so wie heute jedes Haus Heimkinos, große Fernseher, Rasenmäher und Geschirrspüler hat, KI-Supercomputer in Häusern geben wird, die alle Agenten und Assistenten ausführen und kontinuierlich alle möglichen Dinge tun. Die Menschen werden KI-Agenten-Computer haben wollen, die in ihren Häusern laufen. Im Laufe der Zeit werden diese eher wie R2-D2 oder C-3PO – eher wie Begleiter als wie PCs.
Es steht außer Frage, dass diese Neuerfindung des Computers genauso bedeutend ist wie die Neuerfindung des Telefons zum Smartphone. Dies ist der Beginn dieser Reise, der Beginn einer neuen Produktlinie. NVIDIA hat eine Roadmap für diese brandneue Produktfamilie. Jede einzelne Generation der Architektur wird einen Desktop, einen Laptop und eine Workstation umfassen.
Huang drückte seine große Freude und Ehre darüber aus, dass sich 100 Prozent der weltweiten PC-Industrie NVIDIA angeschlossen haben, um den PC neu zu erfinden – eine neue Linie, ein neuer Anfang.
Physische KI und das Cosmos 3 Foundation Model
Agentenbasierte KI ist im Wesentlichen ein digitaler Roboter, der versteht, schlussfolgert, plant, handelt und Werkzeuge nutzt. Agentenbasierte KI wird auf allen Computern laufen – humanoide Robotik-Computer, Robotik-Computer aller Art, selbstfahrende Autocomputer, Satelliten, GeForce-Systeme, die neue PC-Linie, Landwirtschaftsausrüstung, Fertigungsausrüstung, Schwerindustrieausrüstung. Sogar Basisstationen – die Funkstationen der Zukunft – werden agentenbasiert sein, den Verkehr verstehen und sich mit anderen Stationen koordinieren, um den Energieverbrauch zu minimieren und gleichzeitig die spektrale Effizienz zu erhöhen.
Alles wird Agenten ausführen. Heute ist NVIDIA weitgehend im Rechenzentrum präsent, aber Huang ist sich sicher, dass es weltweit Dutzende von Milliarden, schließlich Hunderte von Milliarden agentenbasierter Systeme und Computer geben wird.
Das größte Problem sind Daten. Für Sprachmodelle wurde die gesamte englische Sprache und die Sprache im Internet, die für das Training verwendet wurde, aus menschlicher Perspektive geschrieben – wir haben sie geschrieben und gelesen. Das Erstellen von Daten für KI-Robotik erfordert jedoch die Perspektive des Roboters. Die meisten Videodaten der Welt sind aus der dritten Person, nicht aus der ersten. Für agentenbasierte Systeme, Robotiksysteme und physische KI sind Daten das schwierigste Problem.
NVIDIA hat eine Fortschrittsleiter erklommen, die mit Teleoperation beginnt – menschliche Demonstration, ähnlich dem Durchbruch des Reinforcement Learning from Human Feedback (RLHF). Simulation unter Verwendung von Omniverse ermöglicht Reinforcement Learning mit verifizierbaren Belohnungen. Diese Systeme „bootstrappen“ KI-Modelle – physische KI-Modelle. Schließlich können Lernprozesse aus Daten dritter Personen in die erste Person reprojiziert werden. Durch Bootstrapping entsteht ein World Foundation Model, das die physische Welt aus jeder Perspektive versteht – dritte Person, erste Person, von innen und außen. Dies stellt einen großen Durchbruch dar.
Huang kündigte Cosmos 3 als die Grenze der physischen KI an. Während viele Leute an Sprachmodellen arbeiten, ist NVIDIA absolut die Nummer eins der Welt in der physischen KI. Dies ist das Foundation Model für alle Robotikarbeiten. Jeder, der einen Roboter bauen möchte – Fabrikroboter, Roboter, die in Fabriken arbeiten, jede Art von Roboter, der mit der physischen Welt zu tun hat – hat jetzt mit Cosmos 3 einen Begleiter, der verstehen und schlussfolgern kann. Es kann generieren, simulieren und in der Schleife sogar die Richtlinie selbst sein. Es führt weltweit Bestenlisten an.
Das Video detaillierte, wie die reale Welt unendlich und unvorhersehbar ist. Physische KI benötigt Daten, aber Daten aus der realen Welt sind unmöglich zu skalieren. Für physische KI ist Rechenleistung gleich Daten. Cosmos ist ein offenes Frontier-Omni-Modell für physische KI, das auf einer neuen Mixture-of-Transformers-Architektur basiert. Pixel, Aktion, Ton und Sprache fließen in den autoregressiven Transformer, der schlussfolgert, plant und den Diffusion-Transformer anweist, der generiert, was als Nächstes kommt.
Entwickler trainieren Cosmos über verschiedene Ausprägungen und Anwendungsfälle hinweg nach. Als VLM (Vision Language Model) beobachtet Cosmos die physische Welt, versteht, was passiert, beschreibt Szenen und markiert, was wichtig ist. Als Weltmodell generiert Cosmos physikalisch korrekte synthetische Videos aus einem Bild, Text oder Video. Als Simulator schließt Cosmos die Schleife für das Policy-Training und die Evaluierung. Als Grundlage von NVIDIA OmniDreams – einem aktionskonditionierten Weltmodell – sagt Cosmos die Zukunft Bild für Bild voraus.
Das Nachtraining von Cosmos verwandelt es in ein „World Action Model“ – Wahrnehmung, Schlussfolgerung, Planung, Generierung von Aktionen für Roboter jeder Art, für alles, was sich bewegt. Dies repräsentiert eine neue Art von Daten, eine neue Art von Lehrer, der durch Rechenleistung generiert wird. Cosmos bietet die Grundlage für Entwickler im Zeitalter der physischen KI.
Genau wie Textdaten plus Rechenleistung KI ergeben, bedeutet Rechenleistung jetzt Daten, da wir KI haben. Nutzen Sie Cosmos 3, um Modelle zu trainieren. Cosmos ist ein offenes Modellsystem, genau wie Nemotron – offenes Modell, offene Daten, offene Trainingsmethodik, damit Benutzer es verbessern und Cosmos in ihr proprietäres Modell verwandeln können. NVIDIA hat unglaubliche Partner, die in vielen verschiedenen Branchen arbeiten.
Alpamayo 2 Super für autonome Fahrzeuge
Huang kündigte Alpamayo 2 Super an, ein offenes Modell für selbstfahrende Autos. NVIDIA arbeitet mit Autounternehmen auf der ganzen Welt zusammen. Marken, die sich für NVIDIA DRIVE Hyperion angemeldet haben – und DRIVE Hyperion-Autos bauen –, repräsentieren etwa 80 Prozent der weltweiten Autohersteller. Es wird eine enorme Anzahl von DRIVE Hyperion-Systemen geben, die Alpamayo 2 Super oder jeden anderen NVIDIA-Stack ausführen können. NVIDIA verbindet sich auch mit etwa 97 Prozent der weltweiten Mobilitätsdienste. Wenn Alpamayo 2 Super auf der DRIVE Hyperion-Runtime mit dem Halos-Betriebssystem eingesetzt wird, wird es sich weltweit mit all diesen Diensten verbinden.
Die Demonstration zeigte ein autonomes Fahrzeug von Mercedes, das komplexe Szenarien navigiert. Das Auto erklärt verbal seine Schlussfolgerungen: Herausfahren, wenn die Spur frei ist, leichtes Ausweichen nach links aufgrund stationärer Fahrzeuge, die Spuren blockieren, Stoppen an Stoppschildern und Kreuzungen, Vorrang für Fußgänger, Abstandhalten zu einscherenden Fahrzeugen, Umgang mit Spurströmen, Abstandhalten zu Lastwagen, Navigieren um Hindernisse. Die Zielankündigung beendet die Demonstration. Während eine kontinuierliche verbale Ausgabe für Passagiere nervig wäre, repräsentiert der kontinuierliche interne Dialog das Denken – Alpamayo 2 Super ist ein „denkendes“ Auto.
Isaac GR00T-Plattform und Referenzroboter
Die für autonome Fahrzeuge geschaffene Technologie gilt auch für Humanoide, obwohl viele neue Durchbrüche erzielt werden müssen. NVIDIA Isaac GR00T ist der humanoide Robotik-Stack – Modell, Datengenerierung, Simulation und Runtime, einschließlich Betriebssystem. Dies repräsentiert die komplette GR00T-Plattform.
Jedes NVIDIA-System folgt exakt derselben Architektur, egal ob für agentenbasierte Systeme in der Cloud, agentenbasierte Systeme für PCs, Robotiksysteme für selbstfahrende Autos oder Robotiksysteme für humanoide Roboter. In jedem Fall baut NVIDIA alles vollständig mit vertikaler Integration, vollständiger Integration, Co-Design und extremem Co-Design. Wenn es für jeden zur Nutzung geöffnet wird – welche Teile auch immer gewünscht sind, was auch immer Benutzer wollen –, hilft NVIDIA sogar bei Modifikationen.
Was bisher fehlte, war eine Referenzplattform für Robotiksysteme. Diese Systeme sind extrem kompliziert mit vielen Motoren und Sensoren, aber sehr zerbrechlich. NVIDIA benötigt eine Möglichkeit, Referenzplattformen bereitzustellen, genau wie bei PCs, DGXs, Clouds und selbstfahrenden Autos. Jetzt tut NVIDIA dies für Roboter.
Huang kündigte den NVIDIA Isaac GR00T Referenz-Humanoid-Roboter an – vollständig integriert. Jede Hand hat 25 Freiheitsgrade, hergestellt von Sharpa. Der Roboter hat 31 Freiheitsgrade, ist 1,80 Meter groß und wiegt 68 Kilogramm. Huang scherzte, dass er das erste Merkmal (näher an 1,80 Meter) und das zweite (näher an 68 Kilogramm) teilt, obwohl die spezifischen Zahlen variieren. Diese Plattform führt den neuen Jetson Thor und NVIDIAs gesamten Software-Stack aus – Datengenerierungs-Stack, Datensimulations-Stack und Runtime –, alles integriert in einen Roboter, der für jeden zur Nutzung gedacht ist. Er wurde für die Hochschulbildung und Universitätsforscher gebaut, weil der unabhängige Bau solcher Systeme wahnsinnig schwer ist.
Das Video erklärte, dass der nächste Sprung in der KI Allzweckroboter sind – Humanoide. Aber einen zu bauen ist schwer. Jedes Team fängt bei Null an und setzt Simulatoren, Teleoperationssysteme, Datenpipelines und Trainingsinfrastruktur zusammen. Monate der Einrichtung gehen der Forschung voraus.
Isaac GR00T ist eine offene Entwicklungsplattform für humanoide Roboter – offene Modelle, Simulations- und Trainingsbibliotheken und Datengeneratoren, plus der Robotercomputer, der vollständig vorkonfiguriert ist und in Stunden einsatzbereit ist. Erstens: Einrichten der Simulationsumgebung in Isaac Lab. Zweitens: Erfassen von Demonstrationen mit Isaac Teleoperation auf echten oder simulierten Robotern. Drittens: Generieren synthetischer Daten mit Omniverse und Cosmos, wobei eine Demonstration in Tausende skaliert wird. Viertens: Trainieren von Policies und Evaluierung in Isaac Lab Arena. Fünftens: Bereitstellung durch Isaac ROS, das auf Jetson Thor läuft.
Jedes Element ist modular und offen – nutzen Sie NVIDIAs Komponenten oder tauschen Sie Alternativen aus. GR00T treibt die Robotikforschung über jede Disziplin für jeden Bereich an, von Forschungslaboren bis zu Fabrikhallen. Eine offene Plattform mit einer neuen Edition: Isaac GR00T Referenzdesign-Roboter, gebaut auf NVIDIAs offener Plattform, bereit für Frontier-Forschung für jedes Labor überall. Das Zeitalter der Robotik beginnt hier mit NVIDIA Isaac GR00T.
Das Computing-Muster für das nächste Jahrzehnt
Huang fasste die umfassenden Veränderungen in der Computerindustrie in den letzten sechs Monaten zusammen. Alles hat sich geändert, weil Agenten realisiert wurden und mit den neuesten Frontier-Modellen konvergierten, was es der KI ermöglicht, nun nützliche Arbeit zu leisten.
Das Computing-Muster wird sich über alle Domänen hinweg wiederholen. Dieses Computing-Muster – ein Agent mit einem Modell, ein Framework, das Werkzeuge mit Fähigkeiten nutzt, laufend in einer Runtime – gilt, egal ob in einer Cloud, On-Premises, auf einem PC oder in einem Roboter. Die Runtime variiert, aber das Computing-Muster bleibt identisch. Verschiedene Frameworks und Modelle werden je nach Präferenz verwendet. Benutzer werden sie für den proprietären Gebrauch verbessern und Super-Agenten schaffen, um sie anderen für ihre Arbeit anzubieten.
Diese agentenbasierte Plattform, dieses agentenbasierte Muster – NVIDIA hat ein Enterprise AI Toolkit. Dies ist eine wunderbare Möglichkeit für jeden, sich mit KI zu beschäftigen, und für NVIDIA stellt es eine wunderbare Wachstumschance dar.
Vera Rubin ist in Serienproduktion. Während Grace Blackwell geschaffen wurde, um KI zu verarbeiten, insbesondere Inferenz, wurde Vera Rubin geschaffen, um Agenten auszuführen. Es ist in Serienproduktion. Es ist viel mehr als eine GPU – ein ganzes disaggregiertes, verteiltes Agenten-Verarbeitungssystem.
NVIDIA ist zu einem Infrastrukturunternehmen geworden, nicht nur zu einem GPU- oder Systemunternehmen, sondern zu einem Infrastrukturunternehmen, das hilft, so schnell wie möglich maximalen Umsatz und maximalen Gewinn zu erzielen.
Die agentenbasierte Welt erfordert CPUs, die für Agenten gebaut sind, nicht für Menschen. CPUs für Agenten haben spezielle Anforderungen, und NVIDIA Vera ist revolutionär. Huang drückte seine Freude über den Hochlauf aus. Bestellungen sind bereits eingegangen. Es wird der schnellste und erfolgreichste Produktstart in der Geschichte des Unternehmens sein.
NVIDIA und Microsoft haben eine völlig neue Linie von PCs geschaffen – ein neuer Anfang. Dasselbe agentenbasierte Computing-Muster wird auf allen Arten von Geräten laufen. PCs heute, aber in Zukunft Roboter, Satelliten, Basisstationen, Fabriken – in der Cloud, On-Premises, an der Edge. Dieses agentenbasierte Computing-Muster wird in Computern weltweit repliziert werden.
Wie wir über Personal Computer denken, wird sich sehr wahrscheinlich ändern. Huang dankte allen für die Partnerschaft und Freundschaft. NVIDIA könnte ohne alles, was gemeinsam getan wurde, nicht hier sein. Er drückte seinen Stolz auf den Erfolg der Partner im letzten Jahr aus und prognostizierte, dass das nächste Jahr noch besser wird.
Abschlussdarbietung
Die Keynote endete mit einer musikalischen Darbietung, die die Ankündigungen zusammenfasste. Die Performance feierte die Ankunft nützlicher KI, Agenten, die neben Menschen arbeiten, Vera Rubin in Serienproduktion, die neue CPU-Architektur für Agenten statt x86, OpenShell-Sandboxing, Fünf-Schichten-Systemintegration, MaxLPS-Stromoptimierung, 40-jährige PC-Neuerfindung, die überall läuft, wo Windows läuft, synthetische Datengenerierung durch Rechenleistung, Schlussfolgerungsfähigkeiten, die die Welt wie Menschen verstehen, und die Zukunft, die für jeden sichtbar angekommen ist.
Huang schloss, indem er alle zur Computex willkommen hieß, ihnen für ein erstaunliches Jahr dankte, Dankbarkeit für Freundschaft und Unterstützung ausdrückte und allen das Beste wünschte.
NVIDIA Deep Dive: Monopolisierung des Agentic-Zeitalters durch Full-Stack-Co-Design
Das Geschäftsmodell und die Umsatzarchitektur
NVIDIA hat einen der bemerkenswertesten Transformationsprozesse der Unternehmensgeschichte vollzogen und sich vom Grafikkartenhersteller zum vertikal integrierten Anbieter einer Full-Stack-Plattform für beschleunigtes Rechnen entwickelt. Das Herzstück des NVIDIA-Wirtschaftsmodells ist das Data-Center-Geschäft, das mittlerweile mehr als 92 % des konsolidierten Umsatzes ausmacht. Anstatt diskrete Silizium-Chips zu verkaufen, basiert das Geschäftsmodell auf dem Vertrieb kompletter Plattformen für beschleunigtes Rechnen. Diese Plattformen umfassen leistungsstarke Graphics Processing Units (GPUs), maßgeschneiderte Central Processing Units (CPUs), fortschrittliche Netzwerk-Chips und proprietäre Software. In den vergangenen Quartalen hat sich die grundlegende Verkaufseinheit von einzelnen Server-Boards hin zu vollständig integrierten Supercomputing-Gehäusen auf Rack-Ebene verlagert, wie etwa den Grace Blackwell-Systemen und der neu anlaufenden Vera Rubin-Plattform. Dies ermöglicht es dem Unternehmen, mehrere Hardware-Ebenen mit hohen Margen sowie Software-Aufschläge zu vereinnahmen, die andernfalls auf verschiedene Akteure der Lieferkette verteilt wären.
Die Finanzergebnisse von NVIDIA spiegeln die Zinseszinseffekte dieser Monetarisierungsstrategie auf Systemebene wider. Im ersten Quartal des Geschäftsjahres 2027, das am 26. April 2026 endete, erzielte NVIDIA einen Rekordumsatz von $81,6 Milliarden, was einem Anstieg von 85 % gegenüber dem Vorjahr und einem sequenziellen Zuwachs von 20 % entspricht. Dieses Wachstum wurde maßgeblich vom Data-Center-Segment getragen, das $75,2 Milliarden einbrachte – ein Plus von 92 % gegenüber dem Vorjahr. Die finanzielle Produktivität dieses Modells wird durch eine beispiellose Preissetzungsmacht und margenstarke System-Mixe untermauert, was zu GAAP- und Non-GAAP-Bruttomargen von 74,9 % beziehungsweise 75,0 % führt. Diese enorme Profitabilität stützt eine aggressive Strategie zur Kapitalrückführung. Allein im ersten Quartal des Geschäftsjahres 2027 schüttete NVIDIA rund $20,0 Milliarden durch Dividenden und Aktienrückkäufe an die Aktionäre aus, einschließlich einer Anhebung der vierteljährlichen Bardividende auf $0,25 pro Aktie und der Genehmigung eines zusätzlichen Aktienrückkaufprogramms in Höhe von $80,0 Milliarden.
Das Ökosystem aus Kunden, Lieferanten und Wettbewerbern
Die strukturelle Dynamik der Wertschöpfungskette von NVIDIA ist durch eine extreme Kundenkonzentration, hohe Fertigungsspezialisierung und intensive Wettbewerbspositionierung gekennzeichnet. Der primäre Kundenstamm von NVIDIA besteht aus den globalen Cloud-Dienstleistern und Hyperscalern, den sogenannten „Big Four“, zu denen Microsoft, Amazon, Alphabet und Meta gehören. Diese Konzentration birgt ein erhebliches Risiko für die Umsatzpipeline, da allein vier Kunden Ende des Geschäftsjahres 2026 für 61 % des Gesamtumsatzes verantwortlich waren, wobei der größte Einzelabnehmer 22 % der Verkäufe ausmachte. Die Endkunden sind Softwareentwickler für Unternehmen, Internet-Plattformen für Verbraucher sowie nationale Regierungen, die eine souveräne KI-Infrastruktur aufbauen. Auf der Lieferantenseite ist die Taiwan Semiconductor Manufacturing Company (TSMC) der unverzichtbare Fertigungspartner. NVIDIA hat seine Kapitalzusagen und Beschaffungsausgaben in Taiwan auf jährlich etwa $150 Milliarden erhöht, womit das Unternehmen zum größten Abnehmer im taiwanesischen Technologie-Ökosystem aufgestiegen ist und sich einen priorisierten Zugang zu fortschrittlichen Fertigungsknoten sowie Chip-on-Wafer-on-Substrate-Packaging-Kapazitäten gesichert hat. Weitere wichtige Lieferanten sind SK Hynix, Samsung und Micron, die den für moderne Beschleuniger essenziellen High Bandwidth Memory (HBM) liefern.
Im Wettbewerbsumfeld ist der Markt für kommerzielle Halbleiter im High-End-Segment ein Duopol. Advanced Micro Devices (AMD) fungiert als primärer Herausforderer und baut sein Instinct-GPU-Portfolio weiter aus. AMD meldete für das erste Quartal 2026 einen Umsatzanstieg im Data-Center-Bereich um 57 % auf $5,8 Milliarden, angetrieben durch die Instinct MI300-Serie sowie die kommenden MI350- und MI400-Architekturen. AMD hat sich bedeutende Partnerschaften gesichert, darunter den Aufbau einer Infrastruktur im Gigawatt-Maßstab mit OpenAI sowie maßgeschneiderte Co-Design-Initiativen mit Meta. Die Gaudi-Beschleuniger von Intel bleiben ein abgeschlagener Dritter, da das Unternehmen mit der Akzeptanz seines Software-Ökosystems und der Plattformintegration kämpft. Über die kommerziellen Chips hinaus sind die internen Entwicklungsabteilungen der Hyperscaler selbst die gefährlichsten Wettbewerber; sie entwerfen zunehmend eigene anwendungsspezifische integrierte Schaltkreise (ASICs), um die Margen der Halbleiterhersteller zu umgehen.
Marktanteilsdynamik und der Co-Design-Burggraben
NVIDIA hält eine dominante Stellung auf dem Markt für kommerzielle KI-Beschleuniger und kontrollierte Mitte 2026 schätzungsweise 85 % bis 92 % des Marktes. Während Wettbewerber erfolgreich sekundäre Marktpositionen besetzt haben, erlaubte die schiere Geschwindigkeit der Industrienachfrage es NVIDIA, seine Führungsposition ohne Beeinträchtigung der Margen zu behaupten. Das Fundament dieser Marktbeherrschung ist die Compute Device Unified Architecture, bekannt als CUDA, eine proprietäre Software-Computing-Plattform, die über zwei Jahrzehnte entwickelt wurde. CUDA hat einen enormen Lock-in-Effekt für Entwickler geschaffen, da der Großteil der KI-Trainingsbibliotheken, Compiler und Framework-Optimierungen speziell für den Software-Stack von NVIDIA geschrieben ist. Der Versuch, modernste Modelle auf Hardware der Konkurrenz auszuführen, erfordert komplexe Emulationsschichten oder umfangreiche Code-Umschreibungen, was Ausführungsrisiken und Latenzen mit sich bringt, die die meisten Unternehmenskunden nicht akzeptieren wollen.
Der Wettbewerbsvorteil von NVIDIA hat sich von einem Software-Silizium-Burggraben zu einer hochintegrierten Co-Design-Hegemonie auf Rack-Ebene ausgeweitet. Da sich die Architektur von Rechenzentren weiterentwickelt, hat sich der Leistungsengpass von der reinen Rechenkapazität hin zur Kommunikation auf Systemebene und der Interconnect-Bandbreite verschoben. NVIDIA begegnet dem durch seine proprietären Scale-up- und Scale-out-Netzwerke, insbesondere das NVLink-Interconnect-Protokoll und NVSwitch-Chips. In der neu angekündigten Vera Rubin-Plattform liefern NVLink 6-Switches eine beispiellose aggregierte Bandbreite von 260 Terabyte pro Sekunde. Indem NVIDIA als alleiniger Architekt des gesamten Systems fungiert – einschließlich der maßgeschneiderten ARM-basierten Vera CPU, der Rubin GPU, ConnectX-9 SuperNICs und Spectrum-6 Ethernet-Switches –, optimiert das Unternehmen Speicherzugriff und Stromversorgung auf Rack-Ebene. Diese System-Engineering-Fähigkeit verhindert, dass Wettbewerber auf Komponentenebene konkurrieren können, da Unternehmenskunden zunehmend schlüsselfertige, vollständig optimierte und flüssigkeitsgekühlte Supercomputer statt disparater Halbleiterelemente verlangen.
Industrie-Chancen, geopolitische Bedrohungen und Plattformkonzentration
Die primäre langfristige Chance für NVIDIA liegt im säkularen Übergang von generativen KI-Modellen hin zu agentischen KI-Systemen und Reinforcement-Learning-Architekturen. Generative KI stützte sich stark auf einfache Feed-Forward-Inferenzabfragen, während agentische KI-Systeme autonome, mehrstufige Arbeitsabläufe ausführen. Eine einzige Benutzeranfrage kann Tausende von sequenziellen Schritten auslösen, die lokale Sandbox-Code-Ausführung, Vektordatenbank-Abfragen, Werkzeugnutzung und Reasoning-Schleifen beinhalten. Diese agentische Verschiebung erhöht die Rechenintensität pro Transaktion exponentiell, treibt eine strukturelle Erweiterung des gesamten adressierbaren Marktes für Data-Center-Infrastruktur voran und sorgt für eine nachhaltige Nachfrage nach fortschrittlicher Hardware, lange nachdem das ursprüngliche Training grundlegender Modelle abgeschlossen ist.
Diesen strukturellen Chancen stehen schwere geopolitische Gegenwinde und eine Plattformkonzentration gegenüber. Die unmittelbarste finanzielle Auswirkung ist der Totalverlust des chinesischen Data-Center-Marktes aufgrund strenger Exportbeschränkungen der Vereinigten Staaten. Im ersten Quartal des Geschäftsjahres 2026 generierte NVIDIA noch $4,6 Milliarden Umsatz mit Hopper-Klasse-Data-Center-Produkten bei chinesischen Kunden; im ersten Quartal des Geschäftsjahres 2027 sank dieser Wert auf null. Die aktuelle Prognose von NVIDIA geht von keinen Data-Center-Umsätzen aus China aus, was einen riesigen adressierbaren Markt dauerhaft schließt. Zudem stellt die Konzentration der globalen Halbleiter-Lieferkette in Taiwan ein systemisches Tail-Risk dar. Da TSMC etwa 90 % der in KI-Beschleunigern verwendeten fortschrittlichen Chips fertigt, würde jede geopolitische Störung in der Region die Hardware-Produktion von NVIDIA sofort zum Stillstand bringen. Schließlich setzt die extreme Kundenkonzentration bei den vier größten Hyperscalern NVIDIA dem Risiko von Investitionszyklen aus, falls diese Großabnehmer beschließen, ihre bestehenden Kapazitäten zu optimieren.
Technologische Roadmaps: Vera, Rubin und der Wechsel zur agentischen KI
Um Wettbewerbern zuvorzukommen und seine margenstarken Einnahmequellen zu sichern, hat NVIDIA seinen Hardware-Release-Zyklus auf ein Jahr verkürzt. Die neu angekündigte Vera Rubin-Plattform, die für die ersten Kundenauslieferungen im dritten Quartal 2026 in die Serienproduktion übergegangen ist, wurde speziell für dieses agentische Zeitalter entwickelt. Die Plattform ist nicht nur ein einzelner Halbleiter-Die, sondern eine integrierte Suite aus sieben maßgeschneiderten Chips: der Vera CPU, der Rubin GPU, dem NVLink 6 Switch, der ConnectX-9 SuperNIC, der BlueField-4 DPU, dem Spectrum-6 Ethernet-Switch und dem Groq 3 LPU. Dieses extreme Co-Design ermöglicht es dem gesamten Rack-System, als ein einziger, verteilter Beschleuniger zu fungieren und die Leistungs- und Kommunikationsbeschränkungen traditioneller modularer Designs zu umgehen.
Im Zentrum dieser Architektur der nächsten Generation steht die Rubin GPU, die auf dem fortschrittlichen 3-Nanometer-Prozess von TSMC basiert. Die Rubin GPU verfügt über 336 Milliarden Transistoren – eine 1,6-fache Steigerung gegenüber der Blackwell-Architektur – und integriert 288 Gigabyte HBM4-Speicher über acht Stacks. Diese Architektur liefert eine außergewöhnliche Speicherbandbreite von 22 Terabyte pro Sekunde, was das 2,8-Fache der Blackwell-Bandbreite bedeutet. Die Rubin GPU nutzt eine Transformer-Engine der dritten Generation mit hardwarebeschleunigter adaptiver Kompression, um das 4-Bit-Gleitkommaformat zu unterstützen, was bis zu 50 PetaFLOPS an NVFP4-Inferenzleistung ermöglicht. Mit einer thermischen Designleistung (TDP) von bis zu 2.300 Watt pro GPU wird die Rubin-Plattform vollständig flüssigkeitsgekühlt, wodurch luftgekühlte Optionen aus NVIDIAs High-End-Data-Center-Portfolio vollständig eliminiert werden.
Der andere wichtige Wachstumstreiber der Plattform ist die Vera CPU, NVIDIAs erster maßgeschneiderter, ARM-basierter Prozessor, der speziell für die Orchestrierung agentischer KI und Reinforcement Learning entwickelt wurde. Die Vera CPU verfügt über 88 maßgeschneiderte Olympus-Kerne, die mit der Armv9.2-Architektur kompatibel sind, und nutzt räumliches Multi-Threading zur Partitionierung von Kernressourcen. Benchmark-Daten zeigen, dass die Vera CPU die Aufgabenerledigungsgeschwindigkeit im Vergleich zu herkömmlichen x86-Serverprozessoren um das 1,8-Fache steigert und einen Leistungssprung von 1,63 gegenüber der Grace-CPU der vorherigen Generation erzielt. Am Edge setzt NVIDIA seine RTX Spark-Prozessorarchitektur ein, die die Rubin-Mikroarchitektur auf Laptops und Desktops skaliert. Dieser On-Device-Framework-Ansatz für agentische KI soll KI-Assistenten von cloudabhängigen Werkzeugen in lokale, latenzarme, autonome Agenten verwandeln und so einen sekundären Wachstumskanal im Markt für Personal Computing etablieren.
Disruptive Herausforderer und die Bedrohung durch Custom Silicon
Während traditionelle Wettbewerber wie AMD und Intel weiterhin im Fokus der Marktbeobachter stehen, ist die glaubwürdigste langfristige Bedrohung für NVIDIAs Marktanteile das rasante Wachstum von anwendungsspezifischen integrierten Schaltkreisen (ASICs), die intern von Cloud-Hyperscalern entwickelt werden. Custom Silicon machte 2025 bereits 20,9 % des Marktes für KI-Beschleuniger aus und wird bis Ende 2026 voraussichtlich auf 27,8 % anwachsen. Hyperscaler sind hochmotiviert, proprietäre Hardware einzusetzen, um die massiven Handelsmargen von NVIDIA zu umgehen und ihre Gesamtbetriebskosten (TCO) zu senken. Die TPUs von Google dienen weiterhin als Volumen-Rückgrat dieses Custom-Marktes, während die Trainium-Serie von Amazon erhebliche Verpflichtungen in Milliardenhöhe gesichert hat, einschließlich Implementierungen bei Meta.
Broadcom hat sich als führender Wegbereiter und Designpartner für dieses Custom-ASIC-Ökosystem etabliert und erobert schätzungsweise 60 % des Marktes für kundenspezifische KI-Halbleiter durch mehrjährige Co-Design-Partnerschaften mit Google, Meta und OpenAI. Das Custom-Silicon-Programm von Broadcom expandiert in fortschrittliche 2-Nanometer-Knoten und nutzt sein tiefgreifendes geistiges Eigentum im Bereich Hardware sowie Packaging-Integrationsfähigkeiten, um leistungsstarke, kosteneffiziente Alternativen zu Allzweck-GPUs zu bauen. Ähnlich hält Marvell schätzungsweise 20 % bis 25 % des Marktes für Custom-ASIC-Design und bedient dabei primär Amazon Web Services und Microsoft. Da der KI-Markt reift und sich die Arbeitslasten vom rechenintensiven Training hin zu hochgradig repetitiven, kostensensiblen Inferenzaufgaben verlagern, stellen diese maßgeschneiderten, arbeitslastspezifischen ASICs einen strukturellen Gegenwind dar, der NVIDIAs langfristigen Marktanteil in volumenstarken Hyperscale-Rechenzentren allmählich erodieren könnte.
Management-Bilanz und Ausführung unter Knappheit
Die Unternehmensführung von NVIDIA unter Gründer und CEO Jensen Huang sowie CFO Colette Kress hat eine außergewöhnliche Erfolgsbilanz in Bezug auf operative Agilität und langfristige strategische Weitsicht bewiesen. Das Management antizipierte erfolgreich die Hardware-Anforderungen der Transformer-Modell-Revolution und investierte aggressiv Kapital, um Fertigungs- und fortschrittliche Packaging-Kapazitäten zu sichern, bevor die Welle der generativen KI vollständig materialisierte. Diese aggressive Haltung ermöglichte es NVIDIA, seine Hardware-Hochläufe trotz schwerer globaler Engpässe bei Packaging und Silizium konsequent umzusetzen und eine hochkomplexe Lieferkette von Hunderten von Partnern, darunter allein 150 Lieferanten in Taiwan, zu steuern.
Diese operative Umsetzung wird durch ein diszipliniertes, aktionärsorientiertes Kapitalallokationsmodell ergänzt. Da das Unternehmen massive freie Cashflows generiert, hat das Management seine Finanzkraft genutzt, um ein substanzielles Kapitalrückführungsprogramm zu initiieren. Im ersten Quartal des Geschäftsjahres 2027 schüttete das Unternehmen $20,0 Milliarden an die Aktionäre aus und etablierte eine zusätzliche, unbefristete Aktienrückkaufgenehmigung in Höhe von $80,0 Milliarden, wodurch die gesamte Rückkaufkapazität auf über $118 Milliarden anstieg. Während einige Marktteilnehmer diesen Fokus auf Aktienrückkäufe und eine 25-fache Dividendenerhöhung als Zeichen für den Übergang einer Hyper-Growth-Story zur Reife interpretieren, deutet das gleichzeitige Engagement des Managements für einen jährlichen Hardware-Rhythmus und hohe F&E-Investitionen in zukünftige Architekturen, wie die kommende Feynman-Plattform, darauf hin, dass NVIDIA weiterhin auf technologische Führung setzt und gleichzeitig eine ausgewogene Kapitalstruktur beibehält.
Das Fazit
NVIDIA nimmt weiterhin eine außergewöhnlich starke, nahezu monopolistische Position im Epizentrum des globalen Aufbaus von KI-Infrastruktur ein, was durch den Rekordumsatz von $81,6 Milliarden im ersten Quartal des Geschäftsjahres 2027 und Non-GAAP-Bruttomargen von 75,0 % belegt wird. Der Wettbewerbsburggraben des Unternehmens hat sich weit über die reine Silizium-Überlegenheit hinaus auf das Full-System- und Rack-Scale-Co-Design ausgeweitet, repräsentiert durch die neu anlaufende Vera Rubin-Plattform. Durch die Kombination der maßgeschneiderten 88-Kern-Vera-CPU mit der 336-Milliarden-Transistor-Rubin-GPU und deren Integration über proprietäre NVLink 6-Netzwerke hat NVIDIA eine optimierte, hochintegrierte Plattform geschaffen, die den bis zu 10-fachen agentischen Durchsatz der vorherigen Blackwell-Generation liefert. Diese Full-Stack-Integration, kombiniert mit dem tief verwurzelten CUDA-Software-Ökosystem, macht es höchst unwahrscheinlich, dass kommerzielle Wettbewerber wie AMD kurzfristig nennenswerte Marktanteile bei High-End-Training und komplexen agentischen Inferenz-Workloads gewinnen werden.
Trotz dieser operativen Exzellenz müssen langfristige Investoren die Dominanz von NVIDIA gegen zunehmende strukturelle und geopolitische Gegenwinde abwägen. Das Unternehmen ist mit einer beispiellosen Kundenkonzentration konfrontiert, bei der allein vier Hyperscaler für über 60 % des Gesamtumsatzes verantwortlich sind, was das Geschäft erheblicher Volatilität aussetzt, sollten diese Käufer in eine Phase der Investitionsverdauung eintreten. Gleichzeitig stellt der rasante Aufstieg von Custom-ASICs, die von Broadcom und Marvell für Hyperscaler wie Google und Amazon mitentwickelt werden, eine glaubwürdige langfristige Bedrohung dar, da sich der Markt vom Training hin zu hochgradig kostensensitiver Inferenz verschiebt. In Verbindung mit dem Totalverlust der Data-Center-Umsätze aus China aufgrund von US-Exportkontrollen und der systemischen Abhängigkeit vom taiwanesischen Fertigungsökosystem lässt die Premium-Bewertung von NVIDIA wenig Raum für operative Fehler. Während die technologische Roadmap konkurrenzlos bleibt, deutet der Übergang in einen reifen, hochkonzentrierten Markt darauf hin, dass zukünftige Renditen von der Resilienz der Lieferkette und der Ökonomie der Custom-Silicon-Substitution bestimmt werden.