DruckFin

Intel auf der Computex 2026: Agentische KI verändert das GPU/CPU-Verhältnis – und Intel liefert das passende Rack

Die Keynote von Lip-Bu Tan auf der Computex am 2. Juni 2026 liefert das bisher deutlichste Signal, dass agentische KI die Nachfrage nach Rechenzentrum-Chips strukturell zu Gunsten von Intel verschiebt.

Die CPU ist nicht länger nur Statist

Die wichtigste Botschaft der Intel-Keynote auf der Computex 2026 ist keine Produktneuvorstellung. Es ist ein grundlegender Wandel im Rechenverhältnis, das den Bau moderner Rechenzentren bestimmt. Jahrelang dominierte die GPU die Ökonomie der KI-Infrastruktur, während die CPU lediglich den Datenverkehr um sie herum orchestrierte. Intel demonstrierte am Dienstag live, dass agentische KI – Systeme, die planen, ausführen, iterieren und Sub-Agenten erzeugen, anstatt nur auf Eingaben zu reagieren – dieses Verhältnis nahezu vollständig umkehrt.

In einer herkömmlichen Pipeline für KI-Inferenz liegt das Verhältnis von CPU- zu GPU-Auslastung bei etwa sieben zu eins zugunsten der GPU. In einem agentischen System, wie es in Echtzeit auf Intels Xeon 6-Prozessoren gezeigt wurde, verschiebt sich das Verhältnis in Richtung Parität und neigt sich sogar in Richtung CPU-Lastigkeit. „Während das System arbeitet, nutzt es Werkzeuge, liest und schreibt Dateien, prüft Regeln – und für jeden dieser Schritte sind die Anforderungen an die zugrunde liegende Rechenleistung sehr unterschiedlich“, erklärte ein Intel-Manager für Rechenzentrum-Technologien auf der Bühne. „Das ist der Hauptgrund für den rasanten Anstieg der CPU-Nachfrage. Bei agentischer KI übernimmt die CPU die Führung.“

Die kommerzielle Schlussfolgerung ist direkt. Wenn sich agentische KI als dominierendes Inferenz-Paradigma durchsetzt – und die Dynamik der KI-Einführung in Unternehmen deutet darauf hin –, dann ist der aktuelle Infrastrukturausbau, der bisher überwiegend auf GPU-zentrierte Architekturen setzte, bei der CPU untergewichtet. Intel ist mit seiner Xeon-Produktreihe und dem neuen Xeon 6+, der 288 Kerne und 576 Megabyte L3-Cache pro Prozessor bietet, gut positioniert, um von dieser Neuausrichtung zu profitieren. Ein auf Xeon 6+ Efficiency-Cores basierendes Rack, so das Unternehmen, könne bis zu 150.000 Agenten auf 32 Recheneinheiten ausführen – eine Dichteangabe, die zwar noch unabhängiger Validierung bedarf, aber für CIOs bei der Bewertung von Infrastrukturkosten richtungsweisend ist.

SambaNova-Demo macht heterogenes Computing konkret

Der technisch prägnanteste Moment der Keynote war eine Live-Demonstration gemeinsam mit dem CEO von SambaNova, Rodrigo Liang. Sie zeigte eine disaggregierte Inferenz, bei der die rekonfigurierbaren Datenflusseinheiten (RDUs) von SambaNova gleichzeitig mit Intel Xeon CPUs und Nvidia GPUs eingesetzt wurden. Die Architektur weist jeder Chip-Klasse die Phase der Pipeline zu, die sie am effizientesten bewältigt: Xeon-Prozessoren führen die Werkzeuge aus, SambaNova RDUs übernehmen die Token-Dekodierung und -Generierung, und GPUs verwalten das Prompt-Caching und Pre-Filling.

„Wenn alle drei Chip-Typen zusammenarbeiten, reduziert man die End-to-End-Latenz drastisch – Agenten benötigen die höchste Geschwindigkeit“, sagte Liang. Er ergänzte, dass unabhängige Tests von Artificial Analysis ergeben hätten, dass der disaggregierte Stack bei gleichem Modell und Prompt zwei- bis dreimal schneller sei als GPUs allein. Die Partnerschaft, die Anfang des Jahres als mehrjährige Zusammenarbeit angekündigt wurde, liefert nun physische Produkte: Ein KI-Infrastruktursystem im Rack-Maßstab namens SambaNova Summer, das für agentische Workloads optimiert ist, wird noch in diesem Jahr an Kunden ausgeliefert.

Robert Smith von Vista Equity, der gemeinsam mit Tan auf der Bühne stand, unterstrich die Nachfrageseite. Vista betreut über 90 Portfoliounternehmen, von denen mehr als die Hälfte bereits auf agentische Lösungen umgestellt hat. Sie bedienen etwa 750 Millionen Nutzer und generieren nach Smiths Schätzung über 10 Milliarden Agenten. Vista hat „Vector Core Compute“ eingeführt, das als weltweit erste kommerziell verfügbare Architektur für disaggregierte Inferenz gilt. Über 50 Implementierungen in den USA sind geplant, um bestehende Rechenzentren in Inferenz-Rechenzentren umzuwandeln. „ForwardTogether AI ist der erste kommerzielle Kunde und freut sich darauf, diese Architektur als Service zu nutzen, um Inferenz-Workloads zu beschleunigen“, so Smith.

Intel steigt offiziell in den Markt für kundenspezifische Chips ein

Die strategisch vielleicht am meisten unterschätzte Ankündigung der Keynote war der offizielle Einstieg von Intel in den Markt für zweckgebundene, kundenspezifische Chips – das ASIC- und Custom-Chip-Geschäft, das bisher von Broadcom, Marvell und den internen Chip-Teams der Hyperscaler dominiert wurde.

Der Leiter für kundenspezifische Silizium-Lösungen bei Intel gab zwei namhafte Kundengewinne bekannt. Erstens arbeitet Google mit Intel zusammen, um eine Infrastructure Processing Unit (IPU) zu entwickeln und einzusetzen – diese befindet sich bereits in der Produktion und ist kein bloßes Zukunftsprojekt. Zweitens hat Ericsson Intel ausgewählt, um Infrastruktur-Chips der nächsten Generation für sein globales Telekommunikationsnetz zu liefern. „Welcher Ort wäre besser geeignet als die Computex in Taipeh, wo kundenspezifische Chips wirklich das A und O sind, um bekannt zu geben, dass Intel offiziell in diesen Markt eingestiegen ist“, sagte der Manager.

Tan untermauerte die strategische Absicht explizit und beschrieb Ambitionen, kundenspezifische Chips mit „führenden Unternehmen sowie einigen der dynamischsten Startups aus verschiedenen Industriebranchen“ zu entwickeln. Dies umfasst Bereiche wie biomedizinische Technik, industrielle Automatisierung und Energie. Zu den hervorgehobenen Partnerschaften gehören Eddie Chang, Neurochirurg an der UCSF und Mitgründer von ACCO Neuro Technologies, der mit Intel an gehirntrainierten Algorithmen für Streaming-Sprache arbeitet; der Kardiologe Joseph Wu von der Stanford University mit Greenstone Biosciences, das Intel-KI-Rechenleistung mit der weltweit größten Biobank für induzierte pluripotente Stammzellen für die Arzneimittelentwicklung kombiniert; Siemens, das die Anwendung von der Entwicklung über die Fertigung bis hin zu Chip-Applikationen in eigenen Produkten ausweitet; sowie Hitachi, mit Fokus auf Fertigungswerkzeuge und Quantencomputersysteme.

Rack-Scale-Partnerschaft mit Foxconn und Vorstoß für offene Standards

Intel kündigte zudem eine formelle Entwicklungspartnerschaft für Rack-Scale-Systeme mit Foxconn an, eine der operativ bedeutendsten Beziehungen in der globalen Hardware-Lieferkette. Beide Unternehmen werden gemeinsam differenzierte KI-Infrastrukturlösungen im Rack-Maßstab entwickeln, integrieren und vermarkten, wobei der Schwerpunkt auf heterogenen Architekturen für vielfältige KI-Workloads liegt. Die Partnerschaft erweitert Intels „Rack-Scale Blueprint“-Initiative, die auf der Entwicklung von Referenzarchitekturen auf Basis offener Standards abzielt – explizit positioniert gegen proprietäre Anbieterbindung –, zusammen mit Partnern wie Foxconn und SambaNova.

Zwei Referenz-Blueprints wurden vorgestellt: einer für agentische Performance unter Verwendung von Xeon 6 mit Performance-Kernen und einer für Agentendichte mit Xeon 6 Efficiency-Kernen. Die Ausrichtung auf offene Standards ist ein bewusstes Wettbewerbssignal an Unternehmenskunden, die zunehmend skeptisch gegenüber den Kosten und der Anbieterabhängigkeit der aktuellen GPU-zentrierten KI-Infrastruktur sind.

Perplexity-Partnerschaft definiert On-Device-KI neu

Auf der Client-Seite demonstrierte Aravind Srinivas, Mitgründer und CEO von Perplexity, hybride agentische Inferenz auf dem Intel Core Ultra Series 3, dem ersten Produkt auf Basis von Intels AT&A-Prozesstechnologie. Der Anwendungsfall: Ein Private-Equity-Analyst führt eine vertrauliche Analyse für einen Leveraged Buyout durch. Sensible Dokumente aus dem Datenraum, Geheimhaltungsvereinbarungen (NDAs) und Finanzmodelle werden lokal auf dem Gerät verarbeitet, während nicht-sensible Rechercheanfragen an Cloud-Modelle weitergeleitet werden. „Das lokale Modell entscheidet, was sehr wichtige Arbeit ist und nicht an den Server gesendet werden sollte. Es liest die Dateien und klassifiziert, was sensibel ist und was nicht“, erklärte Srinivas.

„Hybride agentische Inferenz ist der Weg, wie wir den Token-Wert pro Watt pro Nutzer maximieren“, sagte er. Die Architektur spiegelt eine kommerzielle Realität wider, in der sich beide Unternehmen einig sind: Datenschutzsensible Unternehmens-Workflows können nicht vollständig in die Cloud-Inferenz ausgelagert werden, und die Wirtschaftlichkeit der Inferenz am Edge wird sich verbessern, je leistungsfähiger On-Device-Modelle werden. Intels AT&A-Plattform untermauert mittlerweile mehr als 300 ausgelieferte Designs in Consumer- und kommerziellen Segmenten. Mit einer im April gestarteten Core Series 3 Mainstream-Variante, die bereits über 70 Designs erreicht hat, umfasst das Gesamtportfolio nun fast 400 Designs.

Xeon 6+ und das Argument der Rechenzentrum-Effizienz

Intel stellte auf der Computex den Xeon 6+ Prozessor vor, die Efficiency-Core-Variante der Xeon 6-Familie, mit 288 Kernen, 576 Megabyte L3-Cache und einem Fokus auf Rechendichte und Energieeffizienz für Cloud- und Netzwerkinfrastrukturen. Das Unternehmen sieht darin den Schlüssel zu kompakteren Server- und Rack-Konfigurationen – ein wichtiges Verkaufsargument, da Betreiber von Rechenzentren mit steigenden Anforderungen an Stromversorgung und Platzbedarf konfrontiert sind. Prognosen, die auf der Bühne zitiert wurden, gehen davon aus, dass der grundlegende Bedarf der Rechenzentren bis 2030 von 80 Gigawatt auf 100 Gigawatt steigen wird, wobei KI-Inferenz-Workloads bis dahin voraussichtlich 40 % des gesamten Strombedarfs ausmachen werden.

Der Xeon 6+ ergänzt die bereits ausgelieferte Xeon 6-Variante mit Performance-Kernen und gibt Intel eine Zwei-Produkt-Antwort auf die divergenten Rechenanforderungen agentischer Pipelines. Intels Behauptung, dass x86 bis 2030 acht von zehn installierten Servern antreiben werde, ist eine bewusst selbstbewusste Einschätzung zur architektonischen Beständigkeit in einem Markt, in dem Arm-basierte Alternativen von Ampere, AWS Graviton und anderen signifikante Marktanteile gewonnen haben.

Die Glaubwürdigkeit der Umsetzung bleibt die entscheidende Frage

Der intellektuelle Rahmen, den Tan rund um agentische KI, heterogenes Computing und zweckgebundene Chips aufbaut, ist schlüssig und – sollte sich der Markt wie von Intel prognostiziert entwickeln – ein echter Vorteil für die Positionierung des Unternehmens. Das Problem, das Intel noch nicht gelöst hat – und das Tan indirekt einräumte –, ist die Glaubwürdigkeit bei der Umsetzung. „Die Ausführung stand bei mir immer ganz oben auf der Liste“, sagte er und merkte an, dass der Hochlauf der AT&A-Fertigung auf hohes Volumen mit mehreren Produkten und Fortschritte bei Meilensteinen der Advanced Packaging-Technologie echte Fortschritte nach 14 Monaten seiner Amtszeit darstellten. Doch Intels Geschichte von Fertigungsverzögerungen, verlorenen Foundry-Kunden und Marktanteilsverlusten sowohl im Client- als auch im Rechenzentrum-Bereich bedeutet, dass die Lücke zwischen architektonischem Argument und tatsächlichem Umsatz weiterhin groß ist. Investoren werden mehr als nur Demos und Partnerschaftsankündigungen verlangen, bevor sie ihre langfristigen Schätzungen signifikant nach oben korrigieren.

Was die Computex 2026 jedoch zeigt: Tans Intel verfügt über ein klareres und differenzierteres strategisches Narrativ, als das Unternehmen es seit Jahren hatte. Das Argument des Rechenverhältnisses bei agentischer KI ist kein Marketing – es ist eine strukturell haltbare These. Ob Intel in der Lage ist, in dem Volumen und Tempo zu fertigen, zu verpacken und auszuliefern, das für die Erschließung der identifizierten Chancen erforderlich ist, ist eine separate, schwierigere Frage. Die Antwort darauf wird bestimmen, ob diese Keynote einen Wendepunkt markiert oder nur einen weiteren Datenpunkt in einer langwierigen Erholungsgeschichte darstellt.

Haftungsausschluss: Dieser Artikel dient nur zu Informationszwecken und stellt keine Anlageberatung oder eine Empfehlung zum Kauf, Verkauf oder Halten von Wertpapieren dar. Unsere Analysten bieten eine detaillierte Abdeckung von Unternehmensereignissen, können jedoch Fehler machen; führen Sie immer Ihre eigene Due-Diligence-Prüfung durch. Die geäußerten Ansichten und Meinungen spiegeln nicht unbedingt die von DruckFin wider. Wir haben nicht alle hier verwendeten Informationen unabhängig verifiziert, und sie können Fehler oder Auslassungen enthalten. Konsultieren Sie einen qualifizierten Finanzberater, bevor Sie eine Anlageentscheidung treffen. DruckFin und seine verbundenen Unternehmen lehnen jede Haftung für Verluste ab, die durch das Vertrauen auf diese Inhalte entstehen. Die vollständigen Bedingungen finden Sie in unseren Nutzungsbedingungen.