DruckFin

Das Ende der „Memory Semantic Wall“: Warum CXL-Flash einen strukturellen Wandel in der Rechenzentrumswirtschaft markiert

Das Milliarden-Problem des brachliegenden Speichers

Der moderne Markt für Cloud-Infrastruktur leidet derzeit unter einem strukturellen Defekt der Serverarchitektur: der Speicherökonomie. Laut der „Azure Pond“-Studie von Microsoft macht DRAM mittlerweile bis zu 50 Prozent der Gesamtkosten eines Cloud-Servers und rund 40 Prozent der gesamten Rack-Kosten aus. Trotz dieser massiven Investitionsausgaben bleibt ein erheblicher Teil dieses Speichers völlig ungenutzt. Die Microsoft-Studie zeigt, dass der Anteil des brachliegenden Speichers (Memory Stranding) auf über 10 Prozent steigt, sobald die CPU-Auslastung 85 Prozent erreicht; bei hoher Auslastung klettert dieser Wert im 95. Perzentil auf 25 Prozent, in Extremfällen sogar auf fast 30 Prozent. Branchenanalysten schätzen, dass jährlich weltweit Server-Speicher im Wert von bis zu 8,0 Milliarden Dollar verbaut werden, die über weite Teile ihres Lebenszyklus ungenutzt bleiben.

Cloud-Anbieter können dieses Problem nicht einfach durch das Hinzufügen weiterer DDR5-Kanäle auf ihren Mainboards lösen. Ein Überschreiten der aktuellen physikalischen Grenzen führt zu einer massiven Verschlechterung der Signalintegrität und treibt Server über ihre thermischen und energetischen Belastungsgrenzen hinaus. Zudem sprengt die Kosten-pro-Gigabyte-Kurve von Hochleistungs-DRAM die TCO-Modelle (Total Cost of Ownership) von Unternehmen. Die Branche hat die physikalischen und ökonomischen Grenzen der klassischen, direkt angebundenen Speicherskalierung erreicht, was eine dringende Notwendigkeit für die Disaggregation und das Pooling von Arbeitsspeicher schafft.

Der technologische Paradigmenwechsel: Umgehung des Storage-Driver-Stacks

Die Lösung, die institutionell zunehmend an Bedeutung gewinnt, ist der über Compute Express Link (CXL) angebundene Flash-Speicher, allgemein als CXL-SSD oder CXL-Attached Memory bezeichnet. Historisch erforderte der Zugriff auf ein NVMe-Speichergerät das Überwinden einer tiefen, latenzintensiven Software-Schicht. Operationen erforderten einen Interrupt des Betriebssystem-Kernels, das Durchlaufen des Storage-Driver-Stacks und die Ausführung von Direct-Memory-Access-Operationen (DMA), um 4-Kilobyte-Datenblöcke in einen lokalen DRAM-Puffer zu laden. Dieser klassische I/O-Pfad verursacht Latenzen im Bereich von Dutzenden Mikrosekunden – typischerweise 40 bis 100 Mikrosekunden bei Standard-3D-NAND –, was CPU-Pipelines bei KI-Workloads mit hohem Durchsatz, wie Vektor- und Graph-Verarbeitungen, massiv ausbremst.

CXL verändert diese Architektur grundlegend. Durch die Platzierung eines CXL-Controllers vor dem physischen Flash-Speicher und die direkte Abwicklung der Operationen über das PCIe Gen5- oder Gen6-Transportprotokoll fungiert das Flash-Medium nicht mehr als peripheres Speichergerät. Unter Nutzung des CXL.mem-Subprotokolls wird das Medium direkt in den kohärenten Speicherraum der CPU als „Host-managed Device Memory“ eingebunden. Die CPU kann diesen Flash-Speicher nun mittels nativer Load- und Store-Befehle mit einer Granularität von 64-Byte-Cache-Lines adressieren. Im Grunde gibt das System keine Block-I/O-Anfragen mehr aus; es dereferenziert lediglich einen Speicherzeiger.

Die technologische Innovation, die dies ermöglicht, ist die Integration von SRAM- und DRAM-Puffern innerhalb des CXL-SSD-Controllers, um die Diskrepanz zwischen den vom Prozessor angeforderten 64-Byte-Zugriffen und den für Flash-Medien typischen größeren Page-Grenzen auszugleichen. Bei einem Puffer-Treffer erreicht das System Latenzen nahe am DRAM-Niveau. Bei einem Fehlzugriff greift es auf die native Latenz des Flash-Mediums zurück. Dies schafft eine neue Speicher-Tier im Mikrosekundenbereich, die speziell als ultra-dichte Erweiterungsschicht für „warme“ Daten konzipiert ist, etwa für Multi-Terabyte-Embedding-Tabellen von Large Language Models.

Software-Reife: Der Katalysator für die Unternehmensakzeptanz

Hardware-Innovationen scheitern historisch oft an der fehlenden Software-Unterstützung, doch das Software-Ökosystem für CXL ist bereits auf Enterprise-Niveau gereift. Der wichtigste Katalysator ist die „Transparent Page Placement“-Technologie von Meta, die das Unternehmen als Open Source zur Verfügung gestellt und in den primären Linux-Kernel integriert hat. Transparent Page Placement bietet einen automatisierten Mechanismus auf Betriebssystemebene zur Verwaltung von Tiered Memory, ohne dass Entwickler ihre Anwendungen umschreiben müssen.

Der Linux-Kernel analysiert nun kontinuierlich im Hintergrund die Speicherzugriffsmuster. Er verschiebt automatisch häufig genutzte „Hot Pages“ – wie direkte Cache-Zuweisungen oder Gewichte für Matrixmultiplikationen, die eine hohe Speicherbandbreite erfordern – in die schnellen, CPU-nahen DDR5- oder HBM-Ebenen. Umgekehrt werden weniger häufig genutzte „Cold“ oder „Warm Pages“ proaktiv in die kapazitätsstarke CXL-Flash-Ebene ausgelagert. Da diese Platzierung für die Workload völlig transparent ist und ohne aufwendige Kontextwechsel erfolgt, zeigten die Produktionstests von Meta eine Leistungsbeeinträchtigung von weniger als 1 Prozent bei gleichzeitig massiven Einsparungen beim Speicherbedarf. Diese Integration in den Haupt-Kernel entkräftet die Risiken bei der Einführung von CXL für Hyperscaler und Rechenzentren von Unternehmen vollständig.

Die Hauptprofiteure: Silizium-Controller und Innovatoren für latenzarmen NAND

Der Übergang zu CXL-Flash schafft hochlukrative Chancen für eine spezifische Gruppe von Halbleiterdesignern und Speicherherstellern. Die direktesten Profiteure sind Unternehmen, die sich auf Konnektivität und CXL-Controller spezialisiert haben. Astera Labs hat sich in dieser Kategorie als der erste klare Gewinner etabliert. Das Unternehmen setzt derzeit die dritte Generation seines CXL-Speichercontrollers mit dem Codenamen „Leo“ ein, während etablierte, diversifizierte Wettbewerber wie Marvell Technology, Microchip und Montage Technology größtenteils noch ihre Äquivalente der ersten Generation vermarkten. Der signifikante Vorsprung von Astera Labs und die tiefe Software-Integration ermöglichten einen Gesamtumsatz von 852,5 Millionen Dollar im Geschäftsjahr 2025. Da der Markt für CXL-Speichererweiterungen von 1,3 Milliarden Dollar im Jahr 2025 auf voraussichtlich 11,8 Milliarden Dollar bis 2034 wachsen soll, ist Astera Labs als primärer „Silizium-Mautstellenbetreiber“ für die Speicher-Disaggregation hervorragend positioniert, um überproportionale Margen zu erzielen.

Auf der Seite der Speicherhersteller sind Anbieter, die bei latenzarmem Storage Class Memory (SCM) Pionierarbeit leisten, perfekt für diese Architektur aufgestellt. Kioxia führt diesen Bereich mit seiner XL-Flash-Technologie (Single-Level Cell) an. Der proprietäre XL-Flash von Kioxia erreicht Leselatenzen von nur 3 bis 5 Mikrosekunden, bei Multi-Level-Cell-Varianten liegen sie unter 10 Mikrosekunden. Durch die Kombination dieses extrem latenzarmen Flashs mit optimierten Controllern bringt Kioxia KI-SSDs auf den Markt, die beispiellose 10 Millionen zufällige IOPS erreichen. Samsung und SK Hynix, die als führende Margen-Akteure der Branche gelten, verlagern ihre Ressourcen ebenfalls schnell auf CXL-native Module, um ihre Präsenz in Rechenzentren zu verteidigen und die Premium-Preise für Storage Class Memory zu vereinnahmen.

Bedrohungen für Etablierte: Der Druck auf Commodity-DRAM und klassische NVMe

Während der Ausbau der KI-Infrastruktur einen säkularen Rückenwind für alle Speicherformate bietet, stellt der flächendeckende Einsatz von CXL-Flash eine definitive strukturelle Bedrohung für das Volumenwachstum von konventionellem Commodity-DRAM dar. Wenn Hyperscaler durch CXL-Pooling und Flash-Erweiterung ihre DRAM-Kernkosten um 7 Prozent senken können – wie im Microsoft-Modell „Azure Pond“ berechnet – und dabei die Leistung innerhalb von 1 bis 5 Prozent des nativen Speichers halten, werden sie teure, hochdichte DDR5-Module bei allen Warm-Data-Tiers aggressiv durch günstigere CXL-Flash-Kapazität ersetzen. Dieser Substitutionseffekt wird das obere Limit für das Stückzahlenwachstum und die Preismacht bei traditionellem Server-DRAM wahrscheinlich bis Ende 2027 deckeln.

Darüber hinaus sehen sich Hersteller von Standard-Enterprise-NVMe-SSDs mit erheblichen Marktanteilsrisiken konfrontiert. Laufwerkhersteller, die es versäumen, CXL.mem-Protokolle zu integrieren und weiterhin ausschließlich auf klassische PCIe-Block-Storage-Schnittstellen setzen, werden bei der Entwicklung von KI-Server-Racks der nächsten Generation nicht mehr berücksichtigt. Das Rechenzentrum bewegt sich aktiv weg vom klassischen Block-I/O-Speicher für kapazitätskritische Workloads; Anbieter ohne Flash-Lösungen im Mikrosekundenbereich und nativer CXL-Kompatibilität werden in die margenschwache Ebene für kalte Speicherung abgedrängt.

Haftungsausschluss: Dieser Artikel dient nur zu Informationszwecken und stellt keine Anlageberatung oder eine Empfehlung zum Kauf, Verkauf oder Halten von Wertpapieren dar. Unsere Analysten bieten eine detaillierte Abdeckung von Unternehmensereignissen, können jedoch Fehler machen; führen Sie immer Ihre eigene Due-Diligence-Prüfung durch. Die geäußerten Ansichten und Meinungen spiegeln nicht unbedingt die von DruckFin wider. Wir haben nicht alle hier verwendeten Informationen unabhängig verifiziert, und sie können Fehler oder Auslassungen enthalten. Konsultieren Sie einen qualifizierten Finanzberater, bevor Sie eine Anlageentscheidung treffen. DruckFin und seine verbundenen Unternehmen lehnen jede Haftung für Verluste ab, die durch das Vertrauen auf diese Inhalte entstehen. Die vollständigen Bedingungen finden Sie in unseren Nutzungsbedingungen.