DruckFin

All In Podcast: Chinas Open-Source-KI-Modelle fordern US-Frontier-Labs heraus, während Speicherengpässe die Inflation im Sektor treiben

Folge 278 mit Gavin Baker und Travis Kalanick, aufgezeichnet im Juni 2026

Chinesische KI-Labore schließen rapide zu den führenden US-Modellen auf. Durch Open-Source-Veröffentlichungen, die in ihrer Leistung nun mit OpenAI GPT-5.5 und Anthropic Claude Opus 4.8 gleichziehen oder diese sogar übertreffen, stellen sie die grundlegende Frage, ob die selbst auferlegten Sicherheitsbeschränkungen der USA noch einen strategischen Zweck erfüllen. Die Veröffentlichung von GLM 5.2 durch das chinesische Unternehmen Z.AI markiert einen Wendepunkt: Das Modell erzielt bei wichtigen Benchmarks die höchsten Werte aller Open-Weight-Modelle und kostet dabei 85 % weniger als vergleichbare geschlossene Modelle US-amerikanischer Firmen.

Chinas Open-Source-Durchbruch macht US-Sicherheitstheater obsolet

GLM 5.2 erreichte 51 Punkte im „Artificial Analysis Intelligence Index“ – der höchste Wert, der je für ein Open-Weight-Modell gemessen wurde. Zudem übertraf es GPT-5.5 im „Frontier SWE“-Coding-Benchmark und lag nur knapp ein Prozentpunkt hinter Claude Opus 4.8. Das Modell verfügt über 744 Milliarden Parameter sowie ein Kontextfenster von 1 Million Tokens und wurde unter der MIT-Lizenz ohne regionale Einschränkungen veröffentlicht. Der Gründer von Z.AI erklärte gegenüber Elon Musk, dass Open-Weight-Modelle mit Fable-Niveau noch vor dem ersten Quartal 2027 verfügbar sein werden.

David Sacks, der in seiner Funktion für die Regierung sprach, warnte, dass der aktuelle Zulassungsprozess für US-Frontier-Modelle China einen Wettbewerbsvorteil verschaffe. „Wir haben in diesem Rennen keine Monate zu verschenken“, sagte Sacks. „Die Chinesen lagen bisher etwa neun Monate hinter unseren Modellen, plus/minus drei Monate je nach Fähigkeit. Doch sobald sie von einem Durchbruch in einem Bereich wie Cybersicherheit erfahren, können sie mehr Ressourcen auf dieses spezifische Problem konzentrieren und schneller aufholen.“

Sacks machte Anthropic-CEO Dario Amodei für das regulatorische Umfeld verantwortlich, das zum Rückzug von Fable führte. „Ich sage von Anfang an, dass wir uns in einer sehr kompetitiven Situation mit China befinden. Wir können es uns nicht leisten, Dinge zu tun, die unsere Unternehmen unnötig ausbremsen.“ Er beschrieb die Lage als eine potenziell sich selbst erfüllende Prophezeiung und merkte an, dass „Dario hier in seine eigene Falle getappt ist“, indem er sich für staatliche Genehmigungsverfahren einsetzte, die nun sein eigenes Unternehmen einschränken.

Gavin Baker räumte ein, dass die Qualität von GLM 5.2 „einige meiner Überzeugungen herausgefordert hat“, betonte jedoch, dass die Destillation von Frontier-Modellen eine wesentliche Rolle gespielt habe. „Es gab ein immenses Ausmaß an Destillation, keine Frage“, erklärte Baker. „Stellen Sie sich zehntausende Telefone, iPads und Computer vor, die über maskierte Konten sehr spezifische Fragen an die Cloud-API stellen; diese Reasoning-Traces werden gesammelt. Diese Spuren werden dann während des Reinforcement-Learning-Prozesses und wahrscheinlich auch während des Pre-Trainings wieder in das Modell eingespeist.“

Baker merkte jedoch an, dass GLM 5.2 nun „so gut ist, dass es sein eigenes RL durchführen kann – der Geist ist also aus der Flasche.“ Die entscheidende Frage sei nun, ob kommende Modelle von OpenAI, Mythose und SpaceX den Vorsprung wieder vergrößern können.

DRAM-Engpass sorgt für branchenweite Inflation und strategische Schwachstellen

Die starken Quartalszahlen von Micron verdeutlichten, in welchem Maße High-Bandwidth-Memory (HBM) zum entscheidenden Engpass der KI-Infrastruktur geworden ist. Der Umsatz stieg im Jahresvergleich um das Vierfache auf 42 Milliarden Dollar, und die gesamte Produktion für 2026 ist bereits ausverkauft. Baker bezeichnete DRAM als den „wichtigsten Flaschenhals“ im KI-Stack und betonte: „Speicherkapazität und Bandbreite sind das Fundament für die Leistung jedes KI-Modells.“

Der Versorgungsengpass treibt die Preise für Unterhaltungselektronik drastisch in die Höhe. Apple erhöhte die Preise für sein MacBook Neo um 14 % auf 799 Dollar und für den Mac Studio um 25 %, womit das Unternehmen Kosten weitergibt, die es zuvor selbst getragen hatte. „Die Inflation hat den Desktop erreicht“, so die Gastgeber. Microsoft hat die Xbox-Preise angehoben; bei Nintendo Switch und PlayStation wird mit ähnlichen Schritten gerechnet.

Baker erklärte, dass weltweit nur drei Unternehmen den spezialisierten HBM-DRAM herstellen können, der für KI-Server benötigt wird: Micron, SK Hynix und Samsung. „Das ist so nah an Magie, wie Wissenschaft nur sein kann“, sagte er und verwies auf die Schwierigkeit, 8, 12 oder 16 DRAM-Dies mit der notwendigen Verpackung zu stapeln. Ein vierter Akteur, das chinesische Unternehmen CXMT, geht an die Börse und werde „den Markt mit billigem Consumer-DRAM fluten“, verfüge jedoch nicht über die Kapazitäten für die kundenspezifischen Chips, die für die KI-Infrastruktur erforderlich sind.

Der DRAM-Mangel hat eine eigenartige Dynamik geschaffen: Er macht mittlerweile 30 % bis 40 % der gesamten Investitionsausgaben (Capex) der Hyperscaler aus. Baker deutete an, dass dies der Gesellschaft sogar nützen könnte, indem es das KI-Wettrüsten verlangsamt. „Das könnte uns als Gesellschaft Zeit geben, uns anzupassen“, sagte er in Anlehnung an das, was Brad Gerstner den „Gesellschaftsvertrag“ nennt. Die hohen Kosten für den Bau von Gigawatt-Rechenzentren – derzeit 35 Milliarden Dollar für Halbleiter plus 25 Milliarden Dollar für Energie und Kühlung – bedeuteten, dass „selbst für die Hyperscaler die Wirtschaftlichkeit eine Rolle spielt.“

Chamath Palihapitiya merkte an, dass Energieengpässe den Speicherflaschenhals noch verschärfen. „Seit 2021 sind etwa 40 % aller Rechenzentren von Kapazitätsstreitigkeiten betroffen“, sagte er. „Ich denke, diese Zahl wird steigen. Der prognostizierte Energieverbrauch für KI ist völlig unausgewogen. Es gibt ein sehr knappes Angebot und eine faktisch unendliche Nachfrage.“

Verteiltes Rechnen und orbitale Infrastruktur als Lösungsansätze

Die irdischen Engpässe beschleunigen das Interesse an verteiltem Rechnen und orbitalen Rechenzentren. Baker skizzierte die wirtschaftlichen Rahmenbedingungen, die weltraumgestützte Rechenleistung zunehmend attraktiv machen. Der Bau eines Gigawatt-Rechenzentrums auf der Erde kostet insgesamt 60 Milliarden Dollar – 35 Milliarden für Nvidia-Halbleiter und 25 Milliarden für Energie und Kühlung. Sobald Starship schnell wiederverwendbar ist, würden die Startkosten, um eine äquivalente Rechenleistung in den Orbit zu bringen, auf nur 5 Milliarden Dollar sinken, was die Gesamtkosten auf 40 Milliarden Dollar drücken würde.

„Die 25 Milliarden Dollar für Energie und Kühlung sind eindeutig inflationär“, erklärte Baker. „Es könnte sein, dass wir in drei oder vier Jahren bei 70 Milliarden Dollar terrestrisch gegenüber 40 Milliarden Dollar im Weltraum liegen. Und diese 5 Milliarden Dollar für Starship sind, sobald es schnell wiederverwendbar ist, wahrscheinlich deflationär.“ Der orbitale Ansatz eliminiert den Bedarf an massiver Kühlinfrastruktur, da Racks im All nicht über herkömmliche Rechenzentrumsarchitektur, sondern über Laser verbunden werden.

Die Gastgeber diskutierten Teslas neu geschütztes „Megapod“-System, das sie als modulare Rechenzentrumshardware beschrieben, die an Supercharger-Stationen eingesetzt werden könnte, wo die Energieinfrastruktur bereits vorhanden ist. Palihapitiya hob den Vorteil vorgefertigter Rechenmodule hervor, die in Lagerhallen produziert und innerhalb von 90 Tagen einsatzbereit gemacht werden können – im Vergleich zu den üblichen zwei bis drei Jahren für herkömmliche Anlagen.

Travis Kalanick betonte, dass sein Unternehmen Adams verteilte Inferenznetzwerke erforsche, bei denen überschüssige Rechenleistung aus verschiedenen Quellen gebündelt werden kann. „Wenn Sie ein Unternehmen sind, haben Sie einen Router, und jede Aufgabe, die erledigt werden muss, leitet dieser Router an Ihre Version von DeepSeek oder ein anderes Open-Source-Modell weiter“, erklärte Baker. „An einem bestimmten Punkt im Workflow könnte dann ein Frontier-Modell hinzukommen, um das Ergebnis zu prüfen.“

Die Aufteilung der Inferenz in „Prefill“- und „Decode“-Operationen ermöglicht diesen verteilten Ansatz. Baker erläuterte, dass „Prefill“ – das Verständnis von Frage und Kontext – durch die Speicherkapazität begrenzt ist, während „Decode“ – die Generierung des nächsten Tokens – durch die Speicherbandbreite limitiert wird. Unternehmen wie Groq (das von Nvidia übernommen wurde) und Cerebras ermöglichen es, ältere H100- oder A100-GPUs mit spezialisierten Decode-Chips zu kombinieren, wodurch die Nutzungsdauer bestehender Hardware auf sieben oder sogar zwölf Jahre verlängert wird.

Sozialistische Insurgency der DSA erobert Infrastruktur der Demokratischen Partei

Der Bürgermeister von New York City, Zohran Mamdani, und die Democratic Socialists of America (DSA) gewannen alle drei Kongressvorwahlen, bei denen er Kandidaten unterstützte. Sie setzten sich gegen etablierte Demokraten durch – eine Entwicklung, die Sacks als die linke Version von Trumps populistischer Übernahme beschrieb. „Die Wahl für die Zukunft wird zwischen Kommunismus oder Sozialismus in der Demokratischen Partei oder Nationalismus in der Republikanischen Partei liegen“, sagte Sacks. „Das sind die beiden populistischen Richtungen.“

Die siegreichen DSA-Kandidaten unterstützen die Abschaffung des Senats, die Auflösung von Polizeikräften und Gefängnissen, die Auflösung der ICE mit Amnestie für alle, den Ersatz von Präsident und Supreme Court durch dem Kongress untergeordnete Gremien sowie die Einführung von Verhältniswahlrecht mit Rangfolgen-Stimmabgabe. „Das ist ein kompletter Umbau unseres Verfassungssystems“, merkte Sacks an. Eine Gewinnerin, die 32-jährige Shioalier, erklärte, sie wolle die „westliche Zivilisation auslöschen“ und nahm am Tag nach dem 7. Oktober an einer Kundgebung teil, die den Tod israelischer Zivilisten feierte.

Der Co-Vorsitzende der DSA, Josh Block, äußerte sich explizit zur Strategie: „Wir nutzen die Demokratische Partei als Vehikel für den Wahlzettel. Nicht, weil wir ihre Ziele teilen. Wir bauen unsere eigene Organisation auf, lassen uns unter dem Label der Demokraten wählen, bilden bei Bedarf Fraktionen mit den Demokraten und treiben unsere eigene Agenda von innen heraus voran. Wir sehen das demokratische Establishment als Hindernis, nicht als Heimat.“

Baker argumentierte, dass Mamdani selbst „einer der talentiertesten Politiker ist, die ich je gesehen habe“, und verglich ihn positiv mit AOC. „Er kann großartige Reden halten. Er ist gut in Interviews. Er kann all das anzapfen. Er ist wie ein Chamäleon, das sich anpassen kann.“ Baker betonte jedoch, dass die tatsächliche Wählerbasis der DSA „relativ wohlhabende weiße Liberale sind, die sozial absteigen“, und nicht die Arbeiterklasse, Armen, Schwarzen oder Hispanics, die traditionell von den Demokraten vertreten wurden.

Die Gastgeber brachten den sozialistischen Aufschwung mit zwei Generationen von Amerikanern in Verbindung, die sich wirtschaftlich ausgegrenzt fühlen. „Sie glauben nicht, dass sie am System teilhaben können. Sie haben das Gefühl, das System sei manipuliert“, sagte Baker. „Und wenn jemand daherkommt, der sie anspricht, und sie haben kein Konzept von Sozialismus oder davon, was in Deutschland oder während der ‚Red Scare‘ passiert ist, dann haben sie keine Ahnung, was Sozialismus oder Kommunismus ist.“

Kalanick bot einen philosophischen Rahmen: „Wahrheit und Gerechtigkeit sind das Immunsystem der Gesellschaft. Wenn das Immunsystem unterdrückt wird, brechen alle sozialen Übel aus.“ Er fügte hinzu: „Kommunismus steckt in uns allen. Kommunismus liegt uns als Menschen im Blut. Waren Sie jemals in Ihrem Leben faul? Wollten Sie jemals etwas für nichts haben? Der Unterschied ist: Machen Sie das zu einer Lebensweise?“

Cerebras fällt unter Ausgabepreis, während Marktdisziplin zurückkehrt

Cerebras fiel im ersten Quartal als börsennotiertes Unternehmen unter den IPO-Preis, was laut Baker „preisunsensible Verkäufe“ durch Portfoliomanager auslöste, die Positionen automatisch auflösen, sobald der Ausgabepreis unterschritten wird. „Es gibt Leute, die riesige Fonds verwalten, die ich persönlich kenne: Wenn eine Aktie den Ausgabepreis bricht, verkaufen sie, egal was passiert“, sagte Baker. „Shortseller wissen, dass sie, wenn eine Aktie nahe an den Ausgabepreis kommt, leerverkaufen, weil sie den Preis drücken und dann schnell 10 % oder 20 % Gewinn mitnehmen wollen.“

Baker argumentierte, die Marktreaktion sei primär auf das Timing der Lieferkette zurückzuführen und nicht auf fundamentale geschäftliche Probleme. Er erläuterte, dass sich der wegweisende Vertrag, den Cerebras im Dezember 2025 mit OpenAI unterzeichnete, erst ab dem Labor Day 2026 auf den Umsatz auswirken werde. „Es dauert vier Monate von der Bestellung bis zur Chip-Produktion bei Taiwan Semi, dann brauchen wir etwa zwei Monate, um diesen Chip in einen Server zu verwandeln. Und wenn wir Glück haben und Strom finden, dauert es einen Monat, diesen Chip in Betrieb zu nehmen und Tokens zu generieren.“

Die entscheidende Frage für Investoren von Cerebras sei die Geschwindigkeit bei der Bereitstellung von Energie. „Außer den Hyperscalern sind CoreWeave, Crusoe und SpaceX AI die einzigen Unternehmen, die jemals mehr als ein Gigawatt ans Netz gebracht haben“, merkte Baker an. Wenn Cerebras 2027 monatlich 50 Megawatt hinzufügen könnte, würden sie das Jahr mit einer Cloud-Computing-Run-Rate von etwa 9 Milliarden Dollar beenden – bei einer aktuellen Marktkapitalisierung von unter 40 Milliarden Dollar.

Baker riet Unternehmen, die an die Börse gehen, dazu, „den Preis so zu gestalten, dass wir in den ersten neun Monaten als börsennotiertes Unternehmen nicht unter den Ausgabepreis fallen“, während Palihapitiya vehement für auktionsbasierte IPO-Prozesse plädierte, um den wahren Marktpreis zu finden, anstatt sich auf das Urteil der Underwriter zu verlassen.

Anthropic vor Börsendebüt mit 3 Billionen Dollar bewertet

Baker lieferte eine beeindruckende Bewertung für Anthropic und argumentierte, das Unternehmen „ist heute 3 Billionen Dollar wert“ und „das ist ungefähr der Bereich, in dem es wahrscheinlich als börsennotiertes Unternehmen gehandelt würde.“ Er stützte dies auf Umsatzprognosen, nach denen Anthropic das Jahr 2026 mit „deutlich über 100 Milliarden Dollar“ Umsatz beenden und 2028 wahrscheinlich 200 bis 300 Milliarden Dollar erreichen werde. „Es wird wahrscheinlich nicht mit dem Zehnfachen dieser Zahl gehandelt werden, und es wird bei dieser Größenordnung sehr profitabel sein, weil es Inferenz-dominiert sein wird“, sagte Baker und verwies auf Berichte über Bruttomargen von 85 % bei der Inferenz.

Diese Bewertung würde Anthropic größer machen als die erwartete Börsenbewertung von OpenAI und eines der größten Technologie-Angebote der Geschichte darstellen. Baker spielte jedoch Bedenken hinsichtlich der Marktaufnahmefähigkeit herunter. „Es ist nur eine Verschiebung von privat zu öffentlich“, sagte er. „Im Maßstab der globalen Kapitalmärkte wirken diese Zahlen riesig. Man bewegt sich lediglich von den privaten Märkten zu den öffentlichen, die noch größer sind.“

Das Gespräch verdeutlichte, wie radikal sich die Bewertungsmaßstäbe im KI-Zeitalter verschoben haben. Baker und Kalanick erinnerten an Ubers Series C im Jahr 2014, als eine Bewertung von 17 Milliarden Dollar als bahnbrechend und kontrovers galt. „Wir wurden in der Presse dafür niedergemacht, dass wir nicht wüssten, was wir tun“, erinnerte sich Baker an die Bewertung von Uber mit 14 Milliarden Dollar bei Fidelity. Ein Jahrzehnt später sorgt eine Bewertung von 3 Billionen Dollar für Anthropic bei erfahrenen Investoren kaum noch für Aufsehen.

Bezüglich des kürzlichen SpaceX-Börsengangs merkte Baker an, dass im Gegensatz zu typischen Tech-IPOs die meisten SpaceX-Stakeholder in den letzten zehn Jahren durch Tender-Angebote regelmäßige Liquiditätsmöglichkeiten hatten, was den potenziellen Verkaufsdruck reduziere. „Fast die Hälfte der Mitarbeiter bei SpaceX hat beim IPO gekauft“, sagte er. Palihapitiya entgegnete jedoch, dass die achtfache Wertsteigerung im letzten Jahr vor dem Börsengang – von einer privaten Bewertung von 350 Milliarden Dollar auf den öffentlichen Preis – dennoch signifikante Liquiditätsereignisse für langfristige Halter schaffen könnte, die jahrelang moderatere jährliche Zuwächse von 20 % bis 30 % erlebt hatten.

Haftungsausschluss: Dieser Artikel dient nur zu Informationszwecken und stellt keine Anlageberatung oder eine Empfehlung zum Kauf, Verkauf oder Halten von Wertpapieren dar. Unsere Analysten bieten eine detaillierte Abdeckung von Unternehmensereignissen, können jedoch Fehler machen; führen Sie immer Ihre eigene Due-Diligence-Prüfung durch. Die geäußerten Ansichten und Meinungen spiegeln nicht unbedingt die von DruckFin wider. Wir haben nicht alle hier verwendeten Informationen unabhängig verifiziert, und sie können Fehler oder Auslassungen enthalten. Konsultieren Sie einen qualifizierten Finanzberater, bevor Sie eine Anlageentscheidung treffen. DruckFin und seine verbundenen Unternehmen lehnen jede Haftung für Verluste ab, die durch das Vertrauen auf diese Inhalte entstehen. Die vollständigen Bedingungen finden Sie in unseren Nutzungsbedingungen.