TD Cowen: NVIDIAs Netzwerkgeschäft ist kein Nebenschauplatz mehr — es ist die Architektur der KI-Fabrik
TD Cowen 54th Annual TMT Conference, 28. Mai 2026 — Gilad Shainer, VP of Networking bei NVIDIA, erläutert, warum das 14,9-Milliarden-Dollar-Netzwerksegment des Unternehmens strukturell anders ist als alles andere auf dem Markt.
Ein 14,9-Milliarden-Dollar-Netzwerkgeschäft mit 199 % Wachstum — und jede Ebene trägt dazu bei
Der Netzwerkumsatz von NVIDIA erreichte im zuletzt gemeldeten Quartal 14,9 Milliarden US-Dollar, ein Anstieg von 199 % gegenüber dem Vorjahr. Gilad Shainer, der das Netzwerkgeschäft bei NVIDIA leitet, stellte auf der 54. jährlichen TMT-Konferenz von TD Cowen am 28. Mai klar, dass dies keine Geschichte eines einzelnen Produkts ist. Das Wachstum speist sich gleichzeitig aus NVLink für das Scale-up, InfiniBand und Spectrum-X Ethernet für das Scale-out sowie BlueField als Speicherprozessor und Datenverarbeitungseinheit, die den sicheren Zugriff auf KI-Fabriken ermöglicht. Die Breite dieses Beitrags ist entscheidend, da sie bedeutet, dass der Netzwerkumsatz nicht von der Lösung eines einzelnen Engpasses oder der Konzentration auf einen einzelnen Kunden abhängt. Jede Ebene dessen, was NVIDIA als KI-Fabrik bezeichnet, expandiert.
Die Übernahme von Mellanox zielte darauf ab, ein Computing-Unternehmen zu werden, kein Komponentenanbieter
Shainer lieferte die bisher klarste Erklärung dafür, warum Jensen Huang die Übernahme von Mellanox vorantrieb, die TD Cowen als „vielleicht die wichtigste und erfolgreichste Technologie-M&A-Transaktion, die es je gab“, bezeichnete. In Shainers Darstellung war die Logik architektonisch: „Jensen erkannte, dass NVIDIA ein Computing-Unternehmen werden muss – kein Gerätehersteller, kein ASIC-Anbieter, sondern ein Computing-Unternehmen. Und die Art und Weise, wie man Computing-ASICs verbindet, bestimmt, was diese ASICs leisten können. Verbindet man sie auf die eine Weise, erhält man nur eine Serverfarm. Verbindet man sie anders, baut man tatsächlich einen Supercomputer.“ Diese Einordnung – dass die Vernetzung bestimmt, was die Rechenleistung tatsächlich bewirken kann – untermauert die gesamte integrierte Rack-Strategie von NVIDIA und erklärt, warum das Mellanox-Team nicht als separate Geschäftseinheit eingegliedert, sondern vom ersten Tag an als eine einzige Engineering-Organisation integriert wurde.
NVLink Fusion ist kein defensiver Schritt — es ist NVIDIAs Weg, seine beste Technologie für das Ökosystem zu öffnen
Es gab anhaltende Marktbedenken, dass NVIDIAs Umstellung auf vollständig integrierte NVL-Racks die Kunden in ein geschlossenes System zwinge und Ökosystempartner entfremde. Shainer widersprach dieser Darstellung direkt. Die Architektur ist vertikal konzipiert – jede Komponente ist so mitentwickelt, dass sie als eine Einheit fungiert –, wird aber horizontal verkauft. Das bedeutet, dass Kunden einzelne Teile entnehmen und mit eigenen Designs kombinieren können. NVLink Fusion, das es CPUs und sogar GPUs von Drittanbietern ermöglicht, sich über NVLink zu verbinden, ist der konkrete Ausdruck dessen. „NVLink Fusion ermöglicht es unseren Kunden, NVLink auch als separates Element zu nutzen, wenn sie dies wünschen“, sagte Shainer. Sein Argument ist, dass NVIDIA so sehr von der Qualität jeder Komponente überzeugt ist, dass das Unternehmen möchte, dass Partner sie individuell einsetzen. Ob das Ökosystem dies als wirklich offen oder nur strategisch offen wahrnimmt, ist eine andere Frage, aber die bereits angekündigten kommerziellen Partnerschaften rund um Fusion deuten auf eine echte Dynamik hin.
Warum Spectrum-X Ethernet architektonisch einzigartig ist — und warum dieser Unterschied keine Marketing-Floskel ist
Der technisch substanziellste Teil des Gesprächs war Shainers Erklärung, warum Spectrum-X nicht mit Standard-Ethernet-Switches vergleichbar ist und warum dieser Unterschied fundamental und nicht nur inkrementell ist. Das Kernproblem bei verteilten KI-Workloads ist Jitter – die zeitliche Schwankung, mit der Daten bei verschiedenen GPUs ankommen. In einem Trainings- oder Inferenz-Cluster, in dem Hunderttausende von GPUs im Gleichschritt arbeiten müssen, führt selbst eine einzige GPU, die Daten leicht verzögert erhält, dazu, dass alle anderen warten müssen. Herkömmliche Ethernet-Architekturen, einschließlich derer für große Cloud-Workloads, wurden nie entwickelt, um dieses Problem zu lösen, da Jitter in Single-Server- oder Long-Haul-Umgebungen irrelevant ist.
Das tieferliegende Problem ist struktureller Natur. Um Jitter zu eliminieren, ist ein „unconditional packet spraying“ erforderlich – das Routing jedes einzelnen Pakets über den am wenigsten ausgelasteten verfügbaren Pfad, unabhängig von der Reihenfolge des Datenstroms. Dies führt jedoch auf Switch-Ebene zwangsläufig zu einer ungeordneten Datenzustellung. Der einzige Weg, dies zu lösen, ist ein intelligenter Endpunkt, der ungeordnete Pakete empfangen und sie in Echtzeit im GPU-Speicher korrekt wieder zusammensetzen kann. Dieser Endpunkt ist die ConnectX SuperNIC. „Deshalb braucht man beim Aufbau einer Infrastruktur für verteilte Computing-Workloads ein Switch-Element, das die Verteilung bedingungslos durchführt, und dann eine SuperNIC, die die Daten wieder in die richtige Reihenfolge bringt“, sagte Shainer. „Deshalb ist es eine Infrastruktur und kein einzelnes Gerät.“ Dies ist der architektonische Burggraben. Ein Wettbewerber, der nur einen Switch oder nur eine NIC anbietet, kann das, was Spectrum-X als System liefert, nicht replizieren.
Spectrum-X unterstützt mehrere Routing-Protokolle — einschließlich MRC und kundenspezifischer Lösungen
Shainer ging auch auf den aufkommenden Standard für Multi-path RDMA Congestion Control (MRC) und dessen Beziehung zu Spectrum-X ein. Anstatt MRC als wettbewerbsbedrohend für NVIDIAs adaptiven Routing-Ansatz darzustellen, beschrieb er Spectrum-X als eine Plattform, die mehrere Routing-Protokolle gleichzeitig unterstützt – adaptives RDMA, MRC und verschiedene proprietäre Protokolle, die von großen Hyperscalern für ihre eigene Workload-Optimierung entwickelt wurden. „Es gibt eine Vielzahl von Routing-Protokollen, die auf Spectrum-X laufen können“, sagte Shainer und zog einen Vergleich zu BGP als einer weiteren Protokollebene. Vieles von dem, was das Ultra Ethernet Consortium derzeit zu standardisieren versucht – er nannte das Konsortium nicht direkt –, spiegele Designentscheidungen wider, die NVIDIA bei Spectrum-X bereits getroffen habe. Wenn diese Einschätzung zutrifft, deutet dies darauf hin, dass NVIDIA einen deutlichen Vorsprung bei produktionsreifen Implementierungen hat.
Inferenz schafft neuen Infrastrukturbedarf, den das Training nicht hatte — BlueField und das Problem des KV-Cache-Speichers
Shainer führte eine Dimension des Netzwerkwachstums von NVIDIA ein, die bisher relativ wenig Aufmerksamkeit bei Investoren erhalten hat: die Speicherinfrastruktur für Inferenz. Da sich KI-Bereitstellungen in Richtung agentischer Architekturen bewegen – bei denen KI-Modelle mit anderen KI-Modellen interagieren, längere Kontextfenster halten und größere KV-Caches pflegen –, bricht die Annahme zusammen, dass alle relevanten Daten im lokalen GPU-Speicher liegen können. Netzwerkspeicher wird notwendig, aber herkömmliche Netzwerkspeicher-Architekturen sind für den Inferenz-Anwendungsfall überdimensioniert, da sie die Datenredundanz durch Replikation priorisieren. Bei der Inferenz, so Shainer, können verlorene Daten einfach neu berechnet werden, was Replikation verschwenderisch macht. NVIDIAs Antwort ist eine zweckgebundene Speicherschicht unter Verwendung von BlueField, STX und CMX, die für den Abruf von KV-Caches optimiert ist, ohne den Overhead traditioneller Speicherredundanz. Dies ist ein neuer, zusätzlicher adressierbarer Markt für das Netzwerksegment, keine bloße Neuverpackung bestehender Produkte.
Co-Packaged Optics ist in erster Linie eine Energiefrage, in zweiter Linie eine Technologietrage
Bei der Debatte zwischen Kupfer und Optik war Shainer auf eine Weise pragmatisch, die viel Lärm am Markt ausblendet. Kupfer gewinnt bei kurzen Distanzen in Bezug auf Kosten und Energie – es verbraucht im Wesentlichen keine zusätzliche Energie. Optik ist notwendig, wenn die Distanz es erfordert, aber die optische Konnektivität in der Scale-out-Infrastruktur kann heute fast 10 % der gesamten Energiekapazität einer KI-Fabrik verbrauchen, was die entscheidende Einschränkung für die Skalierbarkeit der Rechenleistung darstellt. Co-packaged Optics (CPO) reduziert diese optische Energielast. Deshalb investiert NVIDIA für Konfigurationen wie die Feynman-Plattform, bei der die Verbindung von 1.152 GPUs das Überschreiten von Rack-Grenzen erfordert, in diese Technologie. Die Einordnung hier ist für Investoren wichtig: Die Einführung von CPO ist keine Frage der technologischen Reife, sondern der Energieökonomie – und Energie ist heute der wichtigste limitierende Faktor beim Ausbau von KI-Fabriken.