Nebius: Die Neocloud für Inference, Agents und Margen

Nebius: Die Neocloud für Inference, Agents und Margen – mehr als nur Megawatt

Bank of America 2026 Global Technology Conference, 3. Juni 2026

Roman Chernin, Chief Business Officer der Nebius Group, erläuterte im Gespräch mit dem Analysten Tal Liani von der Bank of America auf der Global Technology Conference 2026, warum sich Nebius nach eigener Einschätzung strukturell besser positioniert sieht als Hyperscaler und andere Neocloud-Anbieter. Während sich der Markt für KI-Infrastruktur von reiner Rechenleistung hin zu Inference- und Agenten-Workloads entwickelt, sieht sich das Unternehmen im Vorteil. Das Gespräch lieferte zwei für Investoren relevante Erkenntnisse: eine klare Darlegung, wie der Software-Stack von Nebius die adressierbare Kundenbasis erweitert und die Margen steigert, sowie die strategische Begründung für die jüngsten Übernahmen von Eigen und Clarifai. Zusammen bilden sie nach Ansicht des Managements eines der leistungsfähigsten Engineering-Teams für Inference-Skalierung am Markt.

Nicht Wasser in der Wüste verkaufen – sondern das Leitungssystem

Liani eröffnete das Gespräch mit einer direkten Einschätzung des aktuellen KI-Infrastruktur-Booms: „Rechenzentrumskapazitäten zu verkaufen ist derzeit wie Wasser an einem heißen Tag in der Wüste zu verkaufen.“ Chernins Erwiderung war ebenso direkt und strategisch bedeutsam: „Wir verkaufen keine Rechenzentrumskapazität. Wir verkaufen Produkte, die darauf aufbauen.“ Diese Unterscheidung sei keine Marketingfloskel, sondern spiegele eine bewusst gewählte, mehrschichtige Go-to-Market-Architektur wider, die Nebius für verschiedene Kundentypen entwickelt hat, die KI-Infrastruktur auf unterschiedlichen Abstraktionsebenen nutzen.

An der Basis stehen die Hyperscaler und großen Frontier-Labs, die Bare-Metal-Rechenleistung in großem Maßstab ohne Zusatzdienste nachfragen. Darüber rangieren laut Chernin „AI-Native Labs“ oder „Neolabs“ – Hunderte, potenziell Tausende forschungsorientierte Organisationen, die verwaltete Infrastruktur benötigen, um sich auf Trainingsaufgaben zu konzentrieren, ohne ihren eigenen Software-Stack betreiben zu müssen. Nebius bedient diese Gruppe über seine Multi-Tenant-Cloud. Die nächste Ebene bilden Entwickler vertikaler KI-Produkte – Unternehmen wie Cursor (Programmierung), Harvey oder Legora (Recht), Gamma (Content) und Clay (CRM) –, die nicht in GPU-Stunden denken. Sie beziehen Modelle als Service, wofür Nebius eine verwaltete Inference-Plattform namens Nebius Token Factory entwickelt hat. Darüber hinaus entsteht die Ebene der KI-Agenten, auf der Entwickler keine Modelle mehr auswählen oder Token-Preise vergleichen, sondern schlicht Ergebnisse von Agenten-Ausführungen einkaufen werden.

„Unsere Produktstrategie ist es, sie dort abzuholen“, sagte Chernin und beschrieb die Philosophie, jeder neuen Welle der KI-Nutzung zu folgen, anstatt sich auf eine einzige Abstraktionsebene zu versteifen. Die ökonomische Logik ist simpel: Jede Stufe weiter oben im Stack erweitert das adressierbare Universum von Nebius von einer Handvoll Hyperscalern auf Tausende oder gar Zehntausende von Entwicklern und Anbietern.

Inference sorgt bereits für Wachstum – und verbessert die CapEx-Ökonomie

Chernin bestätigte, dass Inference bereits das am schnellsten wachsende Segment im Umsatzmix von Nebius sei und schon heute einen „signifikanten, positiven Einfluss auf das Geschäft“ habe. Dies ist für Investoren bei der Modellierung der kurzfristigen Entwicklung des Unternehmens entscheidend. Trainingsverträge sind weitgehend einmalige, infrastrukturgetriebene Verkäufe, bei denen Kunden genau wissen, welche GPU-Cluster sie für welchen Zeitraum benötigen. Inference ist strukturell anders: Es handelt sich um wiederkehrende Umsätze, die mit dem Wachstum der Kunden korrelieren und es Nebius ermöglichen, durch Softwareoptimierung Wert zu schöpfen, statt nur Hardware bereitzustellen.

Chernin betonte einen wichtigen Punkt zum CapEx-Lebenszyklus. Wenn neuere Chips auf den Markt kommen und große Kunden ihre Frontier-Trainings-Workloads auf die neueste Hardware migrieren, werden ältere Cluster nicht zu „gestrandeten Vermögenswerten“, sondern für Inference-Workloads umgewidmet. Er verwies auf das Beispiel der Zusammenarbeit zwischen Anthropic und SpaceX, bei der SpaceX das Training auf einen neueren Cluster verlagerte, während die ursprüngliche Hardware weiterhin produktiv für Inference genutzt wurde. Für ein kapitalintensives Unternehmen wie Nebius bedeutet die Verlängerung der umsatzgenerierenden Lebensdauer eines GPU-Clusters eine direkte Verbesserung der Kapitalrendite (ROIC).

Die Übernahmen von Eigen und Clarifai: Aufbau der Inference-Engine

Die beiden jüngsten Übernahmen von Nebius – Eigen (San Francisco) und Clarifai (Ostküste) – zielen spezifisch darauf ab, die Inference-Plattform Token Factory zu stärken. Die Begründung ist technisch präzise: Eigen ist ein forschungsorientiertes Team, das von MIT-Doktoranden gegründet wurde und sich auf die Optimierung der Inference auf Modellebene konzentriert, um mehr Token-Durchsatz aus einer einzelnen GPU zu gewinnen. Clarifai verfügt über Kernkompetenzen bei der Inference als Gesamtsystem – also der effizienten Orchestrierung von Tausenden GPUs für Millionen Nutzer, einschließlich Caching-Strategien, Node-Skalierung bei Lastspitzen und schnellem Herunterskalieren bei nachlassendem Datenverkehr. „Durch die Kombination dieser Fähigkeiten mit unserem internen Engineering glauben wir, dass wir nun eines der stärksten Teams haben, um Inference als großes System zu bauen“, so Chernin. Ökonomisch übersetzt bedeutet dies: Eine bessere Performance des Inference-Systems führt zu einer besseren Token-Ökonomie für den Kunden, einer höheren Auslastung für Nebius und einer stärkeren Wettbewerbsposition bei Preis und Leistung.

Warum Software der Margentreiber ist, auch ohne direkte Monetarisierung

Auf die Frage von Liani, ob sich der Fokus auf Software und Full-Stack in der Praxis tatsächlich in höheren Margen niederschlage, antwortete Chernin direkt. Das Kernargument ist die nachfrageseitige Optionalität: Eine Plattform, die 10.000 Kunden bedienen kann, habe immer mehr Preismacht als eine, die nur zehn bedienen kann. „Je mehr Optionen man hat, desto mehr Preispunkte gibt es“, so Chernin, der auf seine Erfahrung im Bereich Digital Advertising verwies. Die Fähigkeit, Hardware vom Kunden zu abstrahieren – was bedeutet, dass Nebius und nicht der Käufer entscheidet, welcher GPU-Cluster einen bestimmten Inference-Workload bearbeitet –, schafft Optimierungshebel, die sich direkt in wirtschaftliche Vorteile für beide Seiten übersetzen.

Er stellte zudem klar, dass Software nicht notwendigerweise als eigenständiges Produkt monetarisiert werde. „Man monetarisiert Software nicht zwingend direkt, aber man baut sie, um neue Anwendungsfälle zu erschließen und mehr Optimierungshebel für den Kunden – und damit für sich selbst – zu schaffen.“ Dies ist eine wichtige Nuance für Investoren, die nach einer separaten Software-Umsatzlinie suchen, die es so nicht gibt. Der Margenvorteil liegt in der Auslastungsquote, der Preismacht und der Fähigkeit, vielfältigere und höherwertige Workloads auf derselben Infrastruktur-Basis zu bedienen.

Hyperscaler-Verträge finanzieren das Kerngeschäft

Zum Kundenmix äußerte sich Chernin offen über die Rolle großer Hyperscaler-Verträge bei der Finanzierung der breiteren Ambitionen von Nebius. Die Zusammenarbeit mit Kunden wie Microsoft oder Meta sei nicht das langfristige strategische Ziel – Nebius strebe ein diversifiziertes Portfolio aus KI-nativen Unternehmen, wachstumsstarken Startups und etablierten Firmen an. Doch große Volumenverträge lieferten das Kapital, um Kapazitäten schneller auszubauen und das restliche Geschäft aggressiver zu finanzieren. Berichten zufolge konkurrieren bei Nebius drei bis vier Kunden um jede GPU, was Chernin als direkten Indikator für nachfrageseitige Preismacht bezeichnete.

Die Diversifizierung erstreckt sich über Kundentypen hinaus auch auf die Vertragsstruktur: Nebius hält eine Mischung aus langfristigen Verträgen, kurzfristigen Vereinbarungen und Spot-Kapazitäten, die für sofortige Verfügbarkeit einen Aufpreis erzielen können. Dieser Portfolio-Ansatz verleiht dem Unternehmen eine kommerzielle Flexibilität, die reinen Bare-Metal-Anbietern fehlt.

Lieferkette: Eigene Rechenzentren sind der Schlüssel für 2H26 und darüber hinaus

Der limitierende Faktor für Nebius bleibt – wie für jeden Neocloud-Anbieter – die Fähigkeit, mit Strom versorgte und angebundene Rechenzentrumsflächen schnell genug bereitzustellen, um der Nachfrage gerecht zu werden. Chernin merkte an, dass ein sehr bedeutender Teil der neuen Kapazitäten ab Ende 2026 in Rechenzentren entstehen wird, die Nebius selbst auf der „grünen Wiese“ baut, anstatt Kapazitäten von Drittanbietern zu mieten. Selbstgebaute Rechenzentren verbessern die Kostenstruktur, bieten eine bessere Kontrolle über Zeitpläne und verringern die Abhängigkeit von externen Vermietern. Der parallele Betrieb von etwa einem Dutzend Rechenzentrumsprojekten in verschiedenen Regionen wirkt zudem als Absicherung – Verzögerungen bei einem einzelnen Projekt führen nicht zu einer Lieferkrise, da das Portfolio bewusst überbucht ist. Der verteilte Charakter von Inference-Workloads verstärkt diesen Effekt: Anders als große Trainingscluster, die konzentrierte Rechenleistung an einem Ort erfordern, kann Inference von geografisch verteilten Standorten aus bedient werden, was die Planung zusätzlich flexibilisiert.

Bezüglich der Risiken bei Rohstoff- und Chip-Preisen zeigte sich Chernin abwägend, aber zuversichtlich: Die größten Verträge haben die Versorgung gesichert, und im aktuellen Marktumfeld sei der Nachfragedruck auf die Preise eine weitaus stärkere Kraft als die Inflation bei den Komponentenpreisen.

Als Nächstes lesen

Motorola Solutions: D-Fend-Übernahme erschließt 1-Milliarden-Dollar-Markt für Anti-Drohnen-Technik, während SVX-Bodycam Axons Vormachtstellung angreift

2026-06-04

Zscaler-CEO: „Agentic AI ist das größte ungelöste Problem der IT-Sicherheit – und wir bringen nächste Woche die Lösung auf den Markt“

2026-06-04

William Blair: Manhattan Associates verzeichnet trotz Marktturbulenzen zwei Rekordquartale in Folge bei den Buchungen — KI-Agenten steigern Versandeffizienz um 6–30 %

2026-06-04

Figure Technology Solutions: Der einzige Blockchain-Kreditgeber mit AAA-Rating und 1,4 Milliarden Dollar monatlichem Volumen baut die „Fannie Mae“ für tokenisierte Kredite

2026-06-04

Lumentum: Aktuell lieferbeschränkt, ab 2028 droht ein „Tsunami“ bei der Skalierung

2026-06-04

ON Semiconductor: Von 5.000 auf 115.000 Dollar pro Rack – Die 800-Volt-Chance, die die Wall Street unterschätzt

2026-06-04

Haftungsausschluss: Dieser Artikel dient nur zu Informationszwecken und stellt keine Anlageberatung oder eine Empfehlung zum Kauf, Verkauf oder Halten von Wertpapieren dar. Unsere Analysten bieten eine detaillierte Abdeckung von Unternehmensereignissen, können jedoch Fehler machen; führen Sie immer Ihre eigene Due-Diligence-Prüfung durch. Die geäußerten Ansichten und Meinungen spiegeln nicht unbedingt die von DruckFin wider. Wir haben nicht alle hier verwendeten Informationen unabhängig verifiziert, und sie können Fehler oder Auslassungen enthalten. Konsultieren Sie einen qualifizierten Finanzberater, bevor Sie eine Anlageentscheidung treffen. DruckFin und seine verbundenen Unternehmen lehnen jede Haftung für Verluste ab, die durch das Vertrauen auf diese Inhalte entstehen. Die vollständigen Bedingungen finden Sie in unseren Nutzungsbedingungen.