XPeng-Transkript: He Xiaopeng über die Abkehr vom milliardenschweren ADAS-System zugunsten von Physical AI und das hochkarätige Rennen um humanoide Roboter
Video-Podcast-Interview mit Zhang Xiaojun, 28. Mai 2026
Die Rolle von KI-Tools und Programmierung in modernen Unternehmen
Zhang Xiaojun: Hallo zusammen, ich bin Xiaojun. „Unfinished Date“ ist ein erstklassiges Programm, koproduziert von Weibo Finance und dem Language is the World Studio. Heute ist unser Gast He Xiaopeng, Gründer und CEO der XPeng Group. Wir werden über seine Erkundungen im Bereich der Physical AI sprechen, auch wenn er noch viele Geheimnisse für sich behalten muss. Bevor wir offiziell beginnen, möchte ich eine kurze Umfrage zu Ihren jüngsten Erfahrungen mit KI machen. Welche KI-Produkte haben Sie zuletzt genutzt?
He Xiaopeng: Um ehrlich zu sein, nutze ich nicht viele. Ich verwende nach wie vor sehr traditionelle KI-Produkte wie Tongyi Qianwen und Doubao. In unserem Team setzen wir KI jedoch intensiv für die Programmierung ein. Ich persönlich möchte sie nicht zu tiefgreifend nutzen. Als mein Team mich fragte, warum ich sie selbst nicht intensiver einsetze, gab ich ihnen ein interessantes Beispiel aus der Zeit, als wir Internetprodukte entwickelten. Wenn man ein Produkt täglich nutzt, verliert man sich schnell in kleinsten Details. Man konzentriert sich zu sehr auf unmittelbare Mängel und Funktionen, die nicht funktionieren, anstatt das langfristige Potenzial zu sehen. Sobald man es ständig nutzt, steckt man alle Energie in die Lösung aktueller Bugs, was den Blick in die Ferne verstellt. Obwohl ich die rasanten technologischen Veränderungen genau verfolge, bin ich der Meinung, dass die Führungsebene diese Tools nicht zu intensiv nutzen sollte. Auf operativer Ebene müssen wir die Einführung jedoch fördern, ja sogar erzwingen, bis sie schließlich zur Normalität wird.
Zhang Xiaojun: Ist KI-gestützte Programmierung für die Unternehmensführung sinnvoll? Glauben Sie, dass sie XPeng, der Automobilindustrie oder der intelligenten Fahrtechnologie insgesamt nützen wird? Wird sie echte Veränderungen bewirken?
He Xiaopeng: Ich halte sie für ein exzellentes Werkzeug für Junior-Programmierer, aber derzeit bleibt sie ein Hilfsmittel. Vielleicht wird sie in zwei bis drei Jahren Junior-Programmierer dazu zwingen, schnell zu Senior-Programmierern zu reifen. Für Bereiche wie intelligentes assistiertes Fahren oder andere hochspezialisierte KI-Fähigkeiten ist der direkte Nutzen jedoch relativ gering. Es ist nur eines von vielen Werkzeugen. Die gesamte zugrunde liegende Infrastruktur muss zuerst stehen. Wenn das System etabliert ist, hilft KI-Coding eigentlich nur auf der Anwendungsebene. Wenn man auf der Kernebene arbeitet, etwa bei der Entwicklung eines Betriebssystems, liegt der Kernwert in der Systeminfrastruktur selbst, nicht im Coding.
Die Finanz- und Rechenkapazitätsrealitäten großskaliger Physical AI
Zhang Xiaojun: Wie viele Tokens verbraucht Ihr Unternehmen monatlich? Wie stark achten Sie auf diese Kennzahl?
He Xiaopeng: Wir achten nicht sonderlich auf den Token-Verbrauch. Im letzten Jahr wurde das oft thematisiert. Ich denke, kleine und mittlere digitale Unternehmen müssen sich stark auf Tokens konzentrieren, und mittelgroße bis große digitale Firmen sollten ihr angemessene Aufmerksamkeit schenken, aber es sollte keine umfassende Messgröße sein. Bei manchen Unternehmen sind die Kernbereiche nicht vollständig digitalisiert. Wir haben eine interessante Statistik für unsere Autos erhoben: Wenn unser neues Vision-Language-Action-Modell (VLA) nur drei bis vier Stunden am Tag läuft, wie viele Tokens verbraucht es dann? Ich kenne die exakte Zahl nicht, aber es wird als innere Schleife verarbeitet. Bei digitaler KI ist die Anzahl der Tokens weit geringer als die, die zur Analyse der physischen Welt erforderlich ist. Ein Vergleich ist jedoch letztlich sinnlos, da ein selbstfahrendes Auto als automatisierte Maschine agiert. Es verbraucht so viele Tokens, wie es zur Verarbeitung der Umgebung benötigt. In der physischen Welt wird es beim Token-Verbrauch letztlich darum gehen, wie viel Wert eine Maschine für Menschen und Unternehmen generieren kann – das ist eine völlig andere Dimension als bei digitaler KI.
Zhang Xiaojun: Was halten Sie für ein angemessenes Budget für Tokens und wie verwalten Sie diese Kosten intern?
He Xiaopeng: Das weiß ich nicht. Intern versuche ich, den Token-Verbrauch für niemanden zu beschränken. Viele Führungskräfte fragen mich nach der Kontrolle der Ausgaben, da sie behaupten, sie könnten in einem Quartal die Kosten eines ganzen Jahres einsparen. Ich glaube: Wenn jemand wirklich Wert schöpft, ist es meine Aufgabe, nur die extremsten Ausreißer zu überwachen, etwa die Top-Ten-Spitzenreiter bei den Ausgaben. Der Rest sollte offen bleiben. Wenn ein Mitarbeiter tausend oder zehntausend RMB im Monat ausgibt, aber massiven Wert generiert, warum sollten wir ihn einschränken, wenn sein Gehalt ohnehin weit darüber liegt? Derzeit konzentriert sich unsere Token-Verteilung auf unser General Intelligence Center, das unsere Abteilungen für autonomes Fahren und Cockpit-Systeme vereint. Das ist ein riesiges Team. Wir messen eher die Rechenleistung als nur die Tokens. Wir schauen beispielsweise darauf, wie effizient ein Geschäftsbereich eine Zuteilung von 30.000 oder 50.000 NVIDIA H100 GPUs nutzt.
Zhang Xiaojun: Sie erwähnten die Verwaltung von Ausreißern. Auf welche Daten-Ausreißer haben Sie sich zuletzt konzentriert?
He Xiaopeng: Wir haben kürzlich strenge Kontrollen rund um Daten eingeführt. Viele sprechen über den Wert von Daten, aber nur wenige Unternehmen realisieren die astronomischen Kosten ihrer Verwaltung. Im Bereich der digitalen KI ist die Datenmenge für das Training relativ klein, oft nur Dutzende Terabytes. Wenn wir jedoch Physical-AI-Modelle trainieren, verarbeiten wir Dutzende bis Hunderte Terabytes in einem einzigen Durchlauf. Die Speicherung und Verwaltung dieser Daten ist unglaublich teuer. Unsere direkten, fixen Kosten für Dateninvestitionen belaufen sich auf fast eine Milliarde RMB pro Jahr. Wir müssen analysieren, welche Daten wertvoll sind, welche nur temporär nützlich, auf welche schnell zugegriffen werden muss und welche archiviert werden können. Die Optimierung dieser Workflows kann zweistellige Millionenbeträge einsparen und die Effizienz massiv steigern. Deshalb haben wir dedizierte Teams für Daten und Rechenleistung – und deshalb mache ich mir keine Sorgen über die Token-Anzahl einzelner Ingenieure. Die beim Training von physischen Modellen benötigte Rechenleistung ist der eigentliche Kostenfaktor.
Warum die Automatisierung der CEO-Rolle weitaus schwieriger ist als autonomes Fahren
Zhang Xiaojun: Wenn wir ein KI-Modell trainieren würden, um Ihre Fähigkeiten zu replizieren – eine „He-Xiaopeng-Fähigkeit“ –, welche Trainingsdaten bräuchten wir und wie sähe diese Fähigkeit aus?
He Xiaopeng: Heute machen digitale und physische Modelle die Automatisierung von Fähigkeiten einfacher für einfache Büroangestellte als für gewerbliche Kräfte. Wenn wir jedoch die logische Entwicklung der Entqualifizierung betrachten, ergeben sich massive gesellschaftliche Risiken, sobald höherwertige gewerbliche und bürokratische Rollen automatisiert werden. Ein CEO könnte theoretisch in einigen Jahrzehnten oder in einem Jahrhundert ersetzt werden. Bis dahin könnten meine Fähigkeiten tatsächlich in eine KI-Fertigkeit verpackt werden. Aber bis dahin werden menschliche CEOs ebenfalls stärkere, umfassendere Fähigkeiten entwickelt haben. Wir haben intensiv darüber nachgedacht, weil wir Roboter bauen. Es gibt hier zwei große Widersprüche: Die meisten Menschen überlegen, wie sie ihre bestehenden Fähigkeiten in Skills umwandeln können. Aber aus Modellsicht: Woher weiß das System, dass eine digitalisierte Fähigkeit korrekt ist und wie verbessert sie sich durch kontinuierliches Lernen? In einem physischen Simulationsmodell kann dies verstärkt werden. Das unterscheidet sich stark vom Coding oder autonomen Fahren. Dort ist klar, wenn ein System einen Fehler macht. Aber wenn man versucht, die Entscheidungsfindung von He Xiaopeng in einen Skill zu verwandeln, ist es extrem schwierig, in Echtzeit zu beurteilen, ob eine strategische Entscheidung korrekt war oder nicht. Deshalb konzentrieren wir uns darauf, das zugrunde liegende System selbst zu bauen, anstatt nur ein von anderen entwickeltes System zu nutzen.
Zhang Xiaojun: Intuitiv, was wäre der größte Mangel einer digitalisierten He-Xiaopeng-Fähigkeit?
He Xiaopeng: Ich denke, sobald die Fähigkeiten einer Person vollständig digitalisiert sind, wird jeder erkennen, dass diese Person tatsächlich viele Mängel hat. Als CEO bin ich da sicherlich keine Ausnahme.
Zhang Xiaojun: Glauben Sie als CEO, dass der Fokus Ihres Unternehmens auf KI heute ausreicht?
He Xiaopeng: Ich denke, Unternehmen in der digitalen Welt können sich stark auf KI konzentrieren und vielleicht einen zweistelligen Prozentsatz ihrer Ressourcen darauf verwenden. In der physischen Welt ist XPeng ein Unternehmen mit zehntausenden Mitarbeitern, und ich glaube, wir sollten 15 bis 20 Prozent unserer gesamten Ressourcen in das investieren, was ich „Pan-KI“ nenne. Dazu gehören unsere Abteilung für autonomes Fahren und unsere Robotik-Sparte. Das ist ein angemessener und ausreichender Anteil.
Der Schwenk vom KI-Autobauer zum Physical-AI-Kraftzentrum
Zhang Xiaojun: Wenn wir KI-Unternehmen auf die eine und Fertigungsunternehmen auf die andere Seite stellen, wie bringen Sie beides in Einklang? Haben Sie einen internen Kampf darüber, ob XPeng ein KI-Unternehmen oder ein Automobilhersteller sein sollte?
He Xiaopeng: So sehe ich das nicht. Ich glaube, die Fahrzeugentwicklung besteht aus mehreren Arten der Forschung und Entwicklung. Erstens Hardware-F&E, zweitens Software-F&E, und KI ist nur eine Komponente der Software. Dann gibt es die Fertigungs-F&E. Hardware-F&E und Fertigung sind zwei völlig unterschiedliche Kompetenzen. Man kann zwar das Design-Talent haben, einen schönen Tisch zu entwerfen, aber wahrscheinlich nicht die Fertigungskapazität, ihn tatsächlich zu bauen. In einem Automobilunternehmen ist die Beherrschung dieser verschiedenen F&E-Kompetenzen das Fundament. In Zukunft könnte es sogar eine fünfte Art von Kompetenz geben.
Zhang Xiaojun: Letztes Jahr nannten Sie XPeng noch ein „KI-Auto-Unternehmen“. Dieses Jahr wurde das Unternehmen offiziell in XPeng Group umbenannt, und Sie erklärten, XPeng sei nun ein „Physical-AI-Unternehmen“. Was war der strategische Grund für diese Namensänderung und was sind die praktischen Auswirkungen?
He Xiaopeng: Dieser Übergang hat gerade erst begonnen, und es gibt viele Details, die wir noch nicht vollständig offenlegen können, aber ich kann etwas Kontext teilen. Im letzten Jahrzehnt konzentrierte sich XPeng auf intelligente Elektrofahrzeuge. Wir haben unsere ersten Autos entworfen, in Serie produziert, die ersten 100.000 Einheiten verkauft und sind in einen Standard-Fertigungszyklus eingetreten. Als wir 2014 starteten, glaubte im Grunde niemand an Fahrzeugintelligenz. Nur wenige glaubten an die Elektrifizierung, und die meisten sahen Autos als traditionelles Massengeschäft. Bis letztes Jahr, 2025, akzeptierte jeder, dass die Elektrifizierung aufgrund des globalen Wandels hin zu neuen Energien die Zukunft ist. Obwohl sich die Intelligenz im Automobilbereich schnell entwickelt hat, war der Fortschritt dennoch unbefriedigend. Von Toyota und Google bis hin zu Baidu, Tesla und XPeng haben wir alle immense Ressourcen in autonomes Fahren gesteckt. Wir haben signifikante Ergebnisse erzielt, aber nicht die Höhe erreicht, die wir uns wirklich wünschten. Die Systeme, die wir bauten, waren das, was ich „Stitch Monsters“ nenne – eine Kombination aus Software-Regeln und KI-Algorithmen, statt eines integrierten KI-Fahrers, der vollständig auf einem einheitlichen KI-Modell basiert. Es war immer noch softwarebasierte Logik.
Die milliardenschwere Wette: Abschied vom „Stitch Monster“ für das VLA-Grundlagenmodell
Zhang Xiaojun: Was ist letztes Jahr bei XPeng passiert, um dieses Paradigma zu ändern?
He Xiaopeng: Letztes Jahr stießen wir auf einen wichtigen Wendepunkt. Wir arbeiteten gleichzeitig an zwei Generationen unseres intelligenten assistierten Fahrsystems. Intern nannten wir sie VLA der ersten und zweiten Generation. Die erste Generation vergrößerte das Modell, um den Einfluss traditioneller Software-Regeln zu verringern, die Backend-Fähigkeiten zu verbessern und das Post-Training zu stärken. Die zweite Generation schlug eine völlig andere Richtung ein. Wir verwarfen die traditionelle End-to-End-Logik und nutzten ein weitaus größeres Grundlagenmodell, um die absolute Obergrenze autonomer Fahrfähigkeiten freizuschalten. Dann arbeiteten wir daran, die Untergrenze zu konvergieren, was bedeutet, kritische Fehler zu minimieren und sicherzustellen, dass sich das Auto exakt wie erwartet verhält. Die Generalisierung beim autonomen Fahren bleibt ein massives Problem. Heute kann kein Unternehmen für autonomes Fahren reibungslos in einem unbekannten Tiefgaragen-Parkhaus fahren, ohne sich auf speichergestütztes Fahren zu verlassen, bei dem das Auto die Strecke erst einmal abfahren muss, um den Raum zu kartieren. Das zeigt, dass das tatsächliche Verständnis des Systems für die physische Welt extrem gering ist. Die Obergrenze der alten Architektur war schlicht zu niedrig. Um es gut zu machen, muss man 10.000 Möglichkeiten eröffnen, aber die alten Systeme waren bei 1.000 gedeckelt. Etwa um diese Zeit letztes Jahr öffnete mir das VLA der zweiten Generation die Augen für einen massiven Wandel. Seine Obergrenze konnte 100.000 oder sogar eine Million Punkte erreichen, aber die Untergrenze war anfangs schrecklich. Unter dem alten System hatte man vielleicht eine Obergrenze von 1.000 und eine Untergrenze von 900, was sehr stabil ist. Mit dem neuen Modell lag die Untergrenze anfangs weit unter unseren bestehenden kommerziellen Produkten. Wir standen vor der Wahl: Weiterhin Software-Engineering-Methoden und KI als Werkzeugkasten innerhalb eines traditionellen Geschäftsflusses nutzen oder ein massives Wagnis eingehen. Wir erkannten, dass die Nutzung traditioneller Software-Methoden mit KI-Tools nur ein leistungsfähigeres Software-„Stitch Monster“ schafft. Also haben wir im April letzten Jahres massiv gewettet. Wir stoppten die Entwicklung unseres vorherigen Systems, dessen Aufbau uns mehrere Milliarden RMB gekostet hatte.
Zhang Xiaojun: Warum haben Sie entschieden, ein milliardenschweres System zu töten? Was war der Auslöser?
He Xiaopeng: Weil ich erkannte, dass das alte System niemals echtes fahrerloses Autonomes erreichen würde, noch würde es Robotern erlauben, zu generalisieren. Wenn ein Roboter in einen unbekannten Raum geht, Sie erkennt, sich hinsetzt und natürlich reagiert, wenn Sie ein Glas Wasser ablehnen, kann das nicht durch starre Regeln und kleine KI-Algorithmen erreicht werden. Ich erkannte, dass wir zwar ein unglaublich intelligentes Auto bauen wollten, unsere bestehenden Software-Methoden es aber niemals unendlich intelligent machen würden. Es war eine Abkürzung, aber nicht der eigentliche Weg. Wir mussten den echten Pfad finden. Wir mussten darauf vertrauen, dass sich der Wert von Hardware und Software schließlich 50/50 aufteilen würde, wobei Kunden bereit wären, 150.000 RMB für die Hardware eines 300.000-RMB-Autos zu zahlen und weitere 150.000 RMB für dessen umfassende Software- und Intelligenzfähigkeiten. Wir mussten unsere strategische Planung und unsere F&E-Prozesse von Grund auf neu strukturieren.
Zhang Xiaojun: Gab es wegweisende Meetings im Unternehmen, als Sie diese massive Wette eingingen? Wie haben Sie einen so großen organisatorischen Wandel vollzogen?
He Xiaopeng: Es gab kein einziges dramatisches Meeting; ich traf die finale Entscheidung in meinem Kopf und wir gingen aufs Ganze. Bis Ende des dritten Quartals letzten Jahres vollzogen wir den Schritt und strukturierten unser Zentrum für autonomes Fahren komplett um. In jeder Organisation haben talentierte Menschen Trägheit. Sie fühlen sich wohl dabei, alte Methoden zu nutzen, selbst wenn sie die neuesten KI-Tools in der Hand halten. Aber um wirklich zu innovieren, muss man die Kernmethodik und die Denkweise ändern. Ich kann die exakten operativen Schritte nicht teilen, da sie hochgradig strategisch und proprietär sind. Wir haben verschiedene Geschäftseinheiten mit unterschiedlichem Tempo angepasst und uns stark auf Führung und Organisationsstruktur konzentriert. Es ist extrem schwierig. Wenn man die zugrunde liegende Logik nicht ändert, baut man mit KI das Haus nur schneller, repariert aber immer noch ein altes Haus. Wir wollten etwas völlig Neues bauen. Als CEO muss man die Wette platzieren, das Feedback akzeptieren und die Organisation durch den Wandel führen. XPeng ist ein großes Startup mit zehntausenden Mitarbeitern, daher ist die Steuerung dieses organisatorischen Wandels eine völlig andere Herausforderung als bei einem kleinen Team. Wenn man das Gesamtbild im Blick hat, erhält man Ratschläge aus vielen verschiedenen Blickwinkeln, aber die meisten sind unvollständig. Letztlich muss man diese Perspektiven integrieren und die Entscheidung treffen.
Zhang Xiaojun: Ich habe gehört, dass Sie in den letzten drei Jahren viel eher bereit sind, bei großen Entscheidungen zu pokern.
He Xiaopeng: Es geht nicht darum, ein Spieler zu sein; es geht darum zu wissen, wann man eine Wette platzieren muss, und es früh zu tun. Ende 2022, als XPeng vor massiven Herausforderungen stand, habe ich zwei Kernphilosophien für mich aufgestellt. Erstens: Gib niemals auf. Zweitens: Sei bereit, eine Niederlage einzugestehen. Beides auszubalancieren bedeutet, dass man selbst bei immensen Schwierigkeiten beharrlich bleiben und durchhalten muss. Aber man muss auch die objektive Klarheit bewahren, Projekte zu schließen, die nicht mehr tragfähig sind – genau wie wir es taten, als wir unser VLA der ersten Generation komplett stoppten. Zögern, Warten und Beobachten verzögert nur den Zeitplan und macht Erfolg unmöglich. In ein paar Jahren, wenn wir erfolgreicher sind, können wir die exakten Details besprechen. Jedes Unternehmen muss seinen eigenen, einzigartigen Weg finden. Heute in China spricht jeder davon, Firma A oder Firma B zu kopieren, aber das ist ein Fehler. Was für digitale KI funktioniert, kann nicht einfach auf Physical AI kopiert werden. Es ist eine völlig andere Welt. Wenn digitale KI-Unternehmen versuchen, die physische Welt zu definieren, ohne jemals ein physisches Geschäft betrieben zu haben, bauen sie Physical AI in einem sehr engen Sinne. Die tatsächliche physische Welt beinhaltet komplexe menschliche Interaktionen, Umweltvariablen, regulatorische Compliance und wirtschaftliche Tragfähigkeit. Man muss viel breiter denken, als nur ein paar starke Funktionen zu haben. Deshalb können CEOs digitaler KI-Unternehmen den Übergang zu Physical AI nicht einfach erklären; sie finden erst noch heraus, ob sie überhaupt erfolgreich sein können.
Die Wiedergeburt von XPengs humanoiden Roboter IRON
Zhang Xiaojun: Lassen Sie uns über Ihren humanoiden Roboter IRON sprechen, der letztes Jahr für massives Aufsehen sorgte. Wie kam es zu diesem Produkt und warum sind Sie 2023 auf universelle humanoide Roboter umgeschwenkt?
He Xiaopeng: XPengs Robotik-Reise umfasst eigentlich drei verschiedene Phasen. Die erste Phase war von 2018 bis 2020. Es war ein unabhängiges Team aus etwa vier oder fünf Unternehmen in China, die vierbeinige Robotik erforschten. Die zweite Phase war von 2020 bis 2023. Über diese vier Jahre hinweg haben wir drei verschiedene Meilensteine erreicht. Wir versuchten, Roboter mit traditionellen Robotik-Methoden zu bauen und versuchten sogar, Roboter so zu fertigen, wie wir Autos bauen – durch das Zusammenfügen verschiedener Elemente, mit gemischtem Erfolg. Die dritte Phase begann nach 2023. Als wir Ende 2022 den Fortschritt der Grundlagenmodelle sahen, änderte sich unsere gesamte Logik. Zuvor glaubten wir, es sei unmöglich, ein erfolgreiches Robotergehirn zu bauen, weil die Komplexität des Kleinhirns – die Aufrechterhaltung des physischen Gleichgewichts und der Bewegungssteuerung – zu hoch war. Heute behaupten viele Unternehmen, sie hätten ein Roboter-Kleinhirn entwickelt, weil ihr Roboter langsam in einem monotonen Tempo vorwärts laufen kann. Das ist kein Kleinhirn; das ist nur ein grundlegendes Rückgrat oder ein Hirnstamm, der das Gleichgewicht hält. Sie sind weit davon entfernt, echte Kleinhirn-Funktionalität zu erreichen.
Zhang Xiaojun: Welche großen organisatorischen Änderungen haben Sie 2023 vorgenommen, um diese neue Vision zu verwirklichen?
He Xiaopeng: 2023 entschieden wir uns, komplett von vier Beinen auf zwei Beine umzuschwenken. Wir gaben unsere alten Annahmen auf und konzentrierten uns auf ein brandneues Design, das direkt vom Gehirn des Roboters gesteuert wird, kombiniert mit unserer Ingenieursexpertise aus dem Automobilsektor. Gute Technologie zu haben, garantiert kein gutes Produkt, und ein gutes Produkt zu haben, garantiert nicht, dass man die Produktion skalieren kann. Autos haben einen hochgradig ausgereiften Prozess, der von Planung und Design über ET, PT, SOP bis hin zu SOD reicht. Bis Ende dieses Jahres hoffen wir, unsere Roboter in einen SOP-Prozess auf Automobilniveau zu überführen. Bis 2027 erwarten wir, dass hochgradige Roboter weltweit ihr erstes echtes Jahr der kommerziellen Massenproduktion erleben. Zu diesem Zeitpunkt werden traditionelle bewegungsgesteuerte Roboter an Bedeutung verlieren, während fortschrittliche Physical-AI-Roboter übernehmen. Der Kernwert von Physical AI liegt in der Fähigkeit, sowohl emotionalen als auch physischen Wert für Menschen zu generieren, indem sie tatsächliche Arbeit verrichten. 2023 erkannten wir, dass unser bestehendes Robotik-Team, obwohl es mit traditioneller Robotik bestens vertraut war, nicht in der Lage war, diese neue Generation von Physical-AI-Robotern zu bauen. Damals bestand unsere Robotik-Abteilung unter der Leitung von LC aus etwa 300 Leuten. Wir lösten das Team auf und behielten weniger als 60 Kernmitglieder. Viele, die gingen, gründeten eigene Startups und sammelten mehrere Finanzierungsrunden ein. Aber um die Logik des gesamten Roboters zu rekonstruieren, konnten wir uns nicht allein auf traditionelle Automobilingenieure oder Robotik-Experten verlassen. Wir brauchten ein völlig neues Team mit einem einheitlichen Verständnis von KI, Automobiltechnik, Fertigung und Robotik.
Zhang Xiaojun: Warum haben Sie LC gewählt, um diese Bemühungen zu leiten, obwohl er weder ein traditioneller Robotik-Experte noch ein Spezialist für intelligentes Fahren war?
He Xiaopeng: Manchmal ist es Schicksal. Sein strategisches Denken und sein mentales Quadranten-Modell stimmten perfekt mit meinem überein, was ihn zum richtigen Mann machte, um diese neue Denkweise voranzutreiben. Viele der Roboter-Demos, die Sie heute von anderen Unternehmen sehen, nutzen immer noch das, was wir als Technologie-Stacks der dritten oder vierten Generation betrachten. Sie führen nur grundlegende Tests durch. Bei XPeng haben wir die Geduld und den Mut, langfristig zu investieren. Eine schnelle Demo bedeutet sehr wenig. Es ist genau wie 2017, als China hunderte Startups für autonomes Fahren hatte, die Level-4-Daten präsentierten; sehr wenige dieser Technologien übersetzten sich jemals in einen echten, kommerzialisierten Wert.
Zhang Xiaojun: Was ist LCs Rekrutierungs- und Talentstrategie für dieses neu aufgebaute Team?
He Xiaopeng: LC konzentriert sich stark auf das, was er Talentdichte nennt, was ich als Talentpotenzial betrachte. Er rekrutiert die absolut besten Köpfe. Von Ende letzten Jahres bis zur ersten Hälfte dieses Jahres hat unsere Robotik-Abteilung allein fast 80 Master- und Doktorabsolventen von Spitzeninstitutionen eingestellt. Sie sind unglaublich teuer, aber wir sind voll und ganz entschlossen, ihre langfristige Forschung zu unterstützen. Wir glauben, dass wir super-kluge Leute einsetzen müssen, um super-schwierige Probleme zu lösen, anstatt uns auf starre Prozesse und vordefinierte Werkzeuge zu verlassen. LC ist unglaublich ehrgeizig – er sagt mir oft, er wolle künstliche Menschen erschaffen, anstatt nur kommerzielle Roboter zu bauen. Er möchte, dass Roboter ein echtes Gefühl der Teilhabe an unserer Gesellschaft haben und sich tief mit menschlichen Emotionen verbinden.
Die Fallstricke der zweibeinigen humanoiden Robotik überwinden
Zhang Xiaojun: Warum haben Sie sich so fest auf universelle zweibeinige humanoide Roboter festgelegt und nicht auf andere Formen?
He Xiaopeng: Es ist der herausforderndste Weg, aber er wird den tiefgreifendsten Einfluss auf die menschliche Gesellschaft haben. In den nächsten Jahrzehnten werden universelle humanoide Roboter tief in das menschliche Leben integriert sein. Während digitale KI darauf beschränkt ist, bei ein paar Dutzend Büro-Rollen zu assistieren, können Physical-AI-Roboter hunderte physische Rollen übernehmen, insbesondere in alternden Gesellschaften. Ich glaube, die zwei kritischsten Faktoren für die Zukunft der Menschheit sind medizinische KI, um älteren Menschen ein längeres, gesünderes Leben zu ermöglichen, und Physical-AI-Roboter, die Pflege und Gesellschaft bieten. Für viele ältere Menschen könnte ein Roboter schließlich ihr primäres Unterstützungssystem werden. Wir haben diesen schwierigen Weg gewählt, weil wir die grundlegenden Mängel anderer Formen analysiert haben. Wir haben zum Beispiel zuvor vierbeinige Roboter entwickelt – Hunde und Pferde. Aber wenn man einen Roboterhund, der über einen Meter groß ist, in ein normales Zuhause bringt, kann er nicht funktionieren. Er kann sich nicht neben einem Nachttisch umdrehen, ohne die Wände zu zerkratzen oder das Bett zu beschädigen. Im Gegensatz zu einem echten Golden Retriever, dessen Schwanz und Körper weich sind, verursacht ein starrer Roboterhund zwangsläufig Schäden. Wenn man den Roboterhund kleiner macht, wird seine Batterielaufzeit zu kurz und sein Nutzen sinkt auf einfache Gesellschaft.
Zhang Xiaojun: Was ist mit zweibeinigen Robotern? Was sind die humanzentrierten Design-Herausforderungen?
He Xiaopeng: Wenn man einen massiven, 1,8 Meter großen zweibeinigen Roboter baut, der mit schwerer Metallpanzerung bedeckt ist, wird selbst sein Designer ein intensives Gefühl physischer Unterdrückung verspüren, wenn er daneben steht. Man macht sich natürlich Sorgen, dass er hinfällt, überhitzt, Hochspannung freilegt oder einfach schmutzig ist. Wenn Erwachsene das so empfinden, wie werden Kinder und ältere Menschen reagieren? Wie löst man diese Sicherheits- und rechtlichen Vorschriften in einem häuslichen Umfeld? Während Industrieroboter dieses Design nutzen können, weil sie in kontrollierten Umgebungen operieren, müssen Haushaltsroboter anders gestaltet sein. Sie müssen für Menschen angenehm im Umgang sein. Deshalb ist unsere aktuelle Generation von Robotern so konzipiert, dass sie etwa 1,69 bis 1,70 Meter groß sind – eine Höhe, die sowohl für Männer als auch für Frauen angenehm ist. Sie sind so konzipiert, dass sie Kleidung tragen können und sogar Haare haben können, aber sie dürfen kein realistisches menschliches Gesicht haben, um den „Uncanny Valley“-Effekt und andere komplexe soziologische Probleme zu vermeiden.
Hinter den Kulissen der großen Kontroverse um humanoide Roboter
Zhang Xiaojun: Während Ihrer Pressekonferenz letztes Jahr erwähnten Sie, dass Ihr Team tief zerstritten darüber war, ob man beweisen sollte, dass der Roboter auf der Bühne voll autonom war und nicht von einem Menschen bedient wurde. Warum war das ein solcher Kampf?
He Xiaopeng: Persönlich war es mir egal, aber mein Team war unglaublich besorgt. Sie argumentierten, je mehr wir versuchten zu erklären, desto skeptischer würden die Leute werden, da die öffentliche Meinung online oft zynisch ist. Sie wollten 24 Stunden warten, um zu sehen, wie die Öffentlichkeit reagiert, bevor sie eine Erklärung abgeben. Aber nach ein paar Stunden konnte ich die sich ausbreitenden Gerüchte nicht mehr ertragen. In China und weltweit verbreiteten sich die Spekulationen blitzschnell. Wenn wir 24 Stunden gewartet hätten, wäre das Narrativ völlig außer Kontrolle geraten. Wir wussten intern, dass es ein echter Roboter war und dass sein Wärmemanagement noch in der Entwicklung war, was ihn heiß laufen ließ. Aber es war ein wichtiger Meilenstein für uns, und wir wussten, dass zukünftige Versionen deutlich besser sein würden. Also rief ich das Team in dieser Nacht an und sagte ihnen, sie sollten eine Demonstration für den nächsten Morgen vorbereiten. Ich bestand darauf, dass wir allen zeigen, dass es ein echter Roboter war, der autonom operierte, anstatt die Skepsis weiter schüren zu lassen.
Zhang Xiaojun: Wie haben Sie es der Öffentlichkeit bewiesen?
He Xiaopeng: Wir entschieden, dass die einfachste und unbestreitbarste Methode darin bestand, den Roboter laufen zu lassen, während wir sein linkes Bein entfernten. Da der Roboter von links nach rechts läuft, ist das linke Bein für das Publikum am besten sichtbar. Das Entfernen des Beins, während er funktionierte, demonstrierte die interne mechanische und Software-Architektur klar und bewies, dass es kein Mensch in einem Anzug war. Das hat die PR-Krise schnell bereinigt.
Das Marktpotenzial, die Kommerzialisierung und der Zeithorizont für humanoide Roboter
Zhang Xiaojun: Wie hat sich Ihre Robotik-Strategie seit diesem öffentlichen Ereignis entwickelt?
He Xiaopeng: Es hat unsere Rekrutierung beschleunigt. Wir haben eine unglaubliche Auswahl an Talenten für unsere Robotik-Abteilung gewonnen. Ein Robotik-Unternehmen zu starten ist völlig anders als ein Auto-Unternehmen zu gründen. Ich glaube, ein Robotik-Unternehmen zu starten ist 20- bis 100-mal schwieriger als ein Auto-Unternehmen zu bauen. Selbst mit XPengs etablierter Fertigungs- und KI-Expertise hat unser Erfolg im letzten Jahr unsere Gesamterfolgswahrscheinlichkeit nur um einen kleinen Prozentsatz erhöht. Heute gibt es über 200 Robotik-Startups in China, was doppelt so viele sind wie die Anzahl der Elektroauto-Startups, die wir während des Höhepunkts des Automobilbooms sahen. Aber im Gegensatz zu Autos, die primär in Personen-, Nutz- oder Spezialfahrzeuge kategorisiert werden, wird es bei Robotern unzählige Klassifizierungen geben, von medizinischen Anwendungen über Frachttransport bis hin zur Frachtinspektion. Viele dieser spezialisierten Roboter müssen nicht humanoid sein. Aber auf dem Weg zu universellen zweibeinigen humanoiden Robotern werden 99 Prozent der Unternehmen scheitern. Die Software-Komplexität ist einfach zu hoch, und es gibt keine Open-Source-Plattform, die einem Robotik-Startup beim Bau von hochpräziser Physical-AI-Software helfen könnte. Wir konzentrieren uns darauf, diese Fallstricke selbst zu navigieren, denn man versteht die technischen Herausforderungen erst wirklich, wenn man in die Fallen tritt.
Zhang Xiaojun: Wen betrachten Sie als Ihre Hauptkonkurrenten im Bereich universeller humanoider Robotik?
He Xiaopeng: Im Moment haben universelle humanoide Roboter keine echten Rivalen. Es ist ein reines Rennen gegen uns selbst. Jedes Robotik-Unternehmen muss sich darauf konzentrieren, sich so stark wie möglich zu machen, die zugrunde liegende Organisation, die Hardware-Infrastruktur und die gesamte Systemintegration aufzubauen. Letztes Jahr ging unser Roboter viral wegen seiner hochgradig lebensechten Bewegungssteuerung. Die traditionelle Automobil-Bewegungssteuerung wurde im letzten Jahrhundert weitgehend kommerzialisiert, wobei Automobilunternehmen Motorsteuerungen von Tier-1-Zulieferern kaufen. Aber um einen Roboter wirklich leistungsfähig zu machen, muss seine Bewegungssteuerung weit integrierter und reaktionsschneller sein als die eines Autos. In einem Auto sind verschiedene Steuerungsdomänen isoliert. Das funktioniert für Standardfahrten, aber wenn ein Auto mit den linken Reifen auf Schnee und den rechten Reifen auf Gras steht und eine 47-Grad-Kurve ausführen muss, während plötzlich eine Person vor dem Fahrzeug auftaucht, ist das unglaublich schwierig. Die Verwaltung der Allradtraktion, des Bewegungsabgleichs und der Latenz unter diesen Bedingungen bleibt eine Herausforderung. Für einen Roboter vervielfacht sich die Komplexität. Ein Mensch hat über 200 Gelenke, was eine unendliche Schleife potenzieller Bewegungskombinationen ermöglicht. Diese vollständige Personifizierung mittels KI-gesteuerter Bewegungssteuerung statt regelbasierter Software zu replizieren, ist unglaublich schwierig. Wir wollen unseren Robotern denselben physischen Instinkt verleihen, den ein Mensch hat, wenn er auf Schnee, Eis oder Gras läuft, Reibung spürt und das Gleichgewicht sofort anpasst. Deshalb entwickeln wir 80 Prozent unserer Roboter-Hardware im Haus, einschließlich unserer Aktuatorgelenke und Hände, während wir mit Upstream-Tier-2-Zulieferern kooperieren, um die Qualität zu skalieren.
Zhang Xiaojun: Was sind die wichtigsten technischen und kommerziellen Engpässe, mit denen Sie bei der Vorbereitung auf die Massenproduktion konfrontiert sind?
He Xiaopeng: Der erste Engpass ist sicherzustellen, dass unsere interne Hardware außergewöhnlich zuverlässig und stabil ist. Der zweite ist die nahtlose Passung zwischen unseren hochgradigen Grundlagenmodellen und den physischen Aktuatoren. Der dritte ist der Nachweis der kommerziellen Tragfähigkeit des Produkts. Der Markt wartet auf seinen „iPhone 4“-Moment. Die ersten kommerziell produzierten Roboter werden wahrscheinlich nicht einmal so poliert sein wie das ursprüngliche iPhone 1, aber sie werden einen massiven Paradigmenwechsel darstellen. Sobald ein Roboter generalisierte Software-Fähigkeiten erreicht, werden seine Marktakzeptanz und Produktionsskalierung weitaus schneller erfolgen als bei Autos. Autos brauchten ein Jahrhundert zur Skalierung, weil wir eine globale Straßeninfrastruktur bauen, Verkehrsregeln etablieren und hochkomplexe Fertigungslogistik verwalten mussten. Roboter können sofort in bestehende menschliche Umgebungen eingesetzt werden. Wenn die Software bereit ist, wird Physical AI schnell skalieren.
Einführung des GX: XPengs sechssitziges Flaggschiff-SUV und das frontmontierte Robotaxi
Zhang Xiaojun: Lassen Sie uns über Ihr Automobilgeschäft sprechen. Sie bringen dieses Jahr mehrere neue Autos auf den Markt, darunter den GX. Das stellt XPengs Rückkehr in den High-End-Markt dar, richtig?
He Xiaopeng: Ja, der GX ist unser erstes vollformatiges, sechssitziges Flaggschiff-SUV. Was den GX einzigartig macht, ist, dass wir viele unserer fortschrittlichen F&E-Kompetenzen aus unseren Abteilungen für fliegende Autos und Robotik in dieses Fahrzeug integriert haben. Zum Beispiel haben wir die Sicherheitsredundanzsysteme, die für die flugkritischen Komponenten unserer fliegenden Autos entwickelt wurden, in den GX eingebaut. Der GX ist Chinas erstes in Serie produziertes Personenfahrzeug, das mit einer frontmontierten Robotaxi-Architektur ausgestattet ist und über sechs vollständige Sicherheitsredundanzen verfügt. Selbst wenn die primäre Stromversorgung in der Wildnis ausfällt, kann das Auto immer noch gefahren werden. Selbst wenn eine Maus einen Kabelbaum durchbeißt, bleibt das System betriebsbereit, ähnlich wie die Sicherheitssysteme in Verkehrsflugzeugen.
Zhang Xiaojun: Wie integriert sich die Software-Architektur des GX mit seinem physischen Chassis?
He Xiaopeng: Wir haben unser drahtgesteuertes Chassis mit unserer neuen Elektronik- und Elektroarchitektur (EEA) und unserem VLA-System für autonomes Fahren verbunden. Diese Integration ermöglicht es dem Chassis, VLA-Entscheidungen mit deutlich kürzerer Latenz auszuführen, was die Sicherheitsuntergrenze anhebt und die Steuerungssensitivität um zweistellige Prozentsätze verbessert. Wir haben auch die Logik der Roboter-Aufgabenplanung in das Fahrzeug eingebracht. Bei zukünftigen Interaktionen im Auto wird das Fahrzeug Aufgaben ähnlich wie ein humanoider Roboter verarbeiten. Wenn Sie dem System eine Aufgabe geben, identifiziert es zuerst, wer spricht, bestimmt dessen Autorisierungsgrad und plant eine Abfolge von Aktionen, um den Befehl auszuführen. Zudem haben wir den Innenraum so gestaltet, dass er hochgradig vielseitig ist. Die dritte Reihe kann komplett flach umgeklappt werden, wodurch sich das SUV sofort von einem Sechssitzer in ein hochgradig geräumiges Vier- oder Fünfsitzer-Fahrzeug verwandelt. Wir haben jedes Detail angepasst, erstklassiges Sichtschutzglas gemeinsam mit Fuyao Glass und einen In-Car-Kühlschrank der neuen Generation mit Midea entwickelt. Ein Fahrzeug mit diesem Grad an integrierter Leistungsfähigkeit zu bauen, ist der einzige Weg, um auf dem heutigen hart umkämpften Markt zu gewinnen.
Zhang Xiaojun: Wie haben Sie die Preisgestaltung für den GX bestimmt? Haben Sie Angst, die strategischen Fehler des ursprünglichen G9-Starts zu wiederholen?
He Xiaopeng: Ich bin überhaupt nicht besorgt. Unser strategisches Denken, unsere Preislogik und unsere organisatorischen Fähigkeiten befinden sich in einer völlig anderen Dimension als beim Start des G9. In den letzten dreieinhalb Jahren haben wir unsere Produktplanung, Organisationsstruktur, unser Kundenverständnis und unsere Kernlogik komplett überarbeitet. Wenn Ihre systemischen Fähigkeiten eine höhere Dimension erreichen, können Sie frühere Fehler leicht identifizieren und verhindern, dass sie sich wiederholen. Unser offizielles Launch-Event am 21. Mai wird unsere Konfiguration und Preisgestaltung klar präsentieren. Der GX ist als familienorientiertes, technologisch luxuriöses Fahrzeug für Fachleute, Manager und Unternehmer über 30 konzipiert, die begierig darauf sind, den Luxus modernster Technologie zu erleben.
Konsolidierung und der Kampf im „Blutmeer“ der Automobilindustrie
Zhang Xiaojun: Wie sehen Sie den harten Wettbewerb mit anderen Flaggschiff-SUVs wie Li Autos L9 oder Nios Flaggschiff-SUV-Serie?
He Xiaopeng: Ich sehe sie sowohl als Verbündete als auch als Konkurrenten. Wir sind alle Freunde. Während der Beijing Auto Show besuchte ich Li Xiangs Stand, um mir den neuen L9 anzusehen, und ich besuchte William Lis Stand, um Nios Flaggschiff-SUV-Serie zu sehen. Wir alle haben unsere eigenen, einzigartigen Verständnisse und Lösungen für dieses Segment. Ästhetik ist letztlich subjektiv, aber ich bin sehr zuversichtlich in Bezug auf das visuelle Design unserer Fahrzeuge. Wir sind auf einem Weg, auf dem unsere Designs immer schöner werden. Manche Leute fragen, warum wir uns nicht darauf konzentrieren, weniger Modelle zu bauen, anstatt dieses Jahr vier Autos auf den Markt zu bringen. Jedes Unternehmen hat seinen eigenen strategischen Pfad. Für uns steht die Einführung dieser Modelle im Einklang mit unserem breiteren Geschäftsumfang und unserer Strategie zur Technologieintegration.
Zhang Xiaojun: Wo verbringen Sie jetzt den Großteil Ihrer persönlichen Zeit? Ist es bei Autos, Robotern, KI oder organisatorischem Management?
He Xiaopeng: Ich nehme an all diesen Bereichen teil, aber ich verbringe den Großteil meiner Zeit mit langfristiger Strategie und Planung. In der Automobilindustrie garantiert Größe allein keinen dauerhaften Erfolg, und kurzfristige Gewinne können oft schmerzhaft und temporär sein. Mein Job ist es, unsere technischen Fähigkeiten, unsere Organisationsstruktur und unsere Marktpositionierung in eine kohärente, langfristige Strategie zu integrieren. Autos sind hochkomplexe, zusammengesetzte Systeme. Ein einzelnes „langes Brett“ (Stärke) nützt nichts, wenn Ihre „kurzen Bretter“ (Schwächen) versagen. Zum Beispiel prahlen manche Unternehmen damit, dieses Jahr Level 4 Autonomie zu erreichen, was schlicht unrealistisch ist. Ich glaube, dass echtes Level 4 Autonomes Fahren in 18 bis 24 Monaten mit der tatsächlichen Implementierung beginnen wird. Wenn es implementiert ist, wird es definitiv den Autoverkauf ankurbeln, obwohl der genaue Multiplikator noch abzuwarten bleibt. Ende März haben wir die erste Version unseres VLA der zweiten Generation veröffentlicht. Während Chinas gesamte Autoverkäufe im April einen Rückgang von etwa 20 Prozent gegenüber dem Vorjahr verzeichneten, stiegen XPengs Verkäufe um 50 bis 70 Prozent, was zu einem beträchtlichen Teil direkt durch unser VLA der zweiten Generation getrieben wurde. Echter Erfolg für ein Automobilunternehmen erfordert eine Meisterklasse in der Multi-System-Integration, die Hardware, Software, Fertigung, Design und Betrieb kombiniert.
Zhang Xiaojun: Yu Kai, der Gründer von Horizon Robotics, sagt oft, dass Sie sein schwierigster Partner sind, weil Sie auf Eigenentwicklung bestehen. Er glaubt, Automobilunternehmen sollten sich letztlich auf Drittanbieter für Software und Intelligenz verlassen. Was halten Sie von seiner Ansicht?
He Xiaopeng: Yu Kai ist ein enger Freund, und Horizon Robotics hat hervorragende Arbeit geleistet. Sein strategischer Pfad hängt jedoch davon ab, ob es in Zukunft mehr oder weniger Automobil- und Robotikhersteller geben wird. Wenn sich der Markt konzentriert, schrumpft sein adressierbarer Markt, was seinen Weg schwieriger macht. Ich glaube, der Markt wird sich stark konzentrieren. Bis 2030 wird China vielleicht nur noch fünf große Automobilgruppen haben. Während andere kleine Akteure in Nischensegmenten überleben könnten, wird es aufgrund ihres mangelnden Umfangs immer schwieriger, zu konkurrieren. Historisch gesehen führten viele Automobilunternehmen keine echte Eigenforschung durch; sie spezialisierten sich auf Montage und Integration. Wenn Ihr Ziel kurzfristige taktische Ausführung ist, ist die Abhängigkeit von Drittanbieter-Integration korrekt. Aber wenn Ihr Ziel langfristiges Überleben ist, müssen Sie Eigenforschung beherrschen. In zehn Jahren wird Software mehr als 50 Prozent des Wertes eines Autos ausmachen. Ein Tier-1-Zulieferer kann nicht einfach hunderten verschiedenen Partnern helfen, dieses Niveau an tiefer, domänenübergreifender Fusion zu erreichen. Sie müssen Hardware, Software, Fertigung und Benutzerbetrieb in ein einziges, kohärentes System integrieren.
Zhang Xiaojun: Sind Sie heute endlich aus dem „Blutmeer“ der Automobilindustrie herausgeschwommen?
He Xiaopeng: Nein, wir schwimmen alle noch. Ich glaube nicht, dass es bisher jemand wirklich aus dem Blutmeer herausgeschafft hat. Der Robotik-Markt wird etwas besser sein, weil die Software-Hürde außergewöhnlich hoch ist, was die unmittelbaren, homogenen Preiskriege verhindert, die wir im Automobilsektor sehen. Mein Tagesablauf bleibt intensiv, wie bei jedem anderen Unternehmer. Ich beginne meinen Tag spät, arbeite bis tief in die Nacht und treffe schnelle Entscheidungen in allen Geschäftsbereichen. Ich lese nicht mehr viele Wirtschaftsbücher, weil sich die physische Welt zu schnell verändert; bis ein Buch gedruckt ist, sind seine Erkenntnisse bereits veraltet. Ich ziehe es vor, Wissen durch direkte, praktische Anwendung, Reisen und ständige Kommunikation aufzunehmen. Wenn ich zurückblicke, hege ich keine Reue über meine vergangenen Entscheidungen. Wir machen im Geschäft viel zu viele Fehler, als dass wir Zeit damit verbringen könnten, sie zu bereuen. Der Schlüssel ist, zu analysieren, warum ein Fehler aufgetreten ist, daraus zu lernen und weiterzumachen.