샤오펑 인터뷰: 허샤오펑이 수십억 달러 규모의 ADAS 시스템을 버리고 물리적 AI와 휴머노이드 로봇 전쟁에 뛰어든 이유
장샤오쥔 비디오 팟캐스트 인터뷰, 2026년 5월 28일
현대 기업에서의 AI 도구와 코딩의 역할
장샤오쥔: 여러분 안녕하세요, 샤오쥔입니다. '미완의 날짜(Unfinished Date)'는 웨이보 파이낸스와 '언어는 세계다(Language is the World)' 스튜디오가 공동 제작하는 일류 프로그램입니다. 오늘 저희는 샤오펑 그룹(XPeng Group)의 창업자이자 CEO인 허샤오펑을 모셨습니다. 아직 공개할 수 없는 많은 비밀을 안고 있는 그와 함께 물리적 AI에 대한 탐색을 논해보겠습니다. 본격적인 시작에 앞서, 최근 AI 경험에 대한 짧은 설문을 하나 하겠습니다. 최근 가장 많이 사용하신 AI 제품은 무엇인가요?
허샤오펑: 솔직히 말하면, 저는 그렇게 많이 사용하지 않습니다. 여전히 '통이첸원(Tongyi Qianwen)'이나 '더우바오(Doubao)' 같은 전통적인 AI 제품을 씁니다. 다만 우리 팀 내부에서는 코딩에 AI를 매우 많이 활용합니다. 개인적으로는 너무 깊게 관여하고 싶지 않습니다. 팀원들이 왜 직접 사용하지 않느냐고 묻길래 인터넷 제품을 만들던 시절의 흥미로운 사례를 하나 들려줬습니다. 제품을 매일 사용하면 금세 사소한 디테일에 매몰되기 때문입니다. 장기적인 잠재력보다는 당장 눈앞의 단점이나 작동하지 않는 기능에만 집착하게 되죠. 계속 사용하다 보면 모든 에너지를 버그 해결에만 쏟게 되어 멀리 내다볼 수 없게 됩니다. 그래서 저는 기술의 급격한 변화를 예의주시하고는 있지만, 1인자의 위치에 있는 사람은 이런 도구를 너무 깊게 사용해서는 안 된다고 생각합니다. 반면 실무 레벨에서는 도입을 장려하고 강제하며, 결국 일상화해야 합니다.
장샤오쥔: AI 보조 프로그래밍이 기업의 1인자에게 의미가 있을까요? 이것이 샤오펑, 자동차 산업, 혹은 지능형 주행 산업 전체에 이득이 될까요? 실질적인 변화를 가져올까요?
허샤오펑: 주니어 프로그래머에게는 훌륭한 도구이지만, 현재로서는 보조적인 수단에 불과합니다. 아마 2~3년 내에 주니어 프로그래머들이 빠르게 시니어 프로그래머로 성장하도록 강제하는 역할을 할 것입니다. 하지만 지능형 보조 주행이나 기타 고도화된 특수 AI 역량 측면에서 직접적인 도움은 상대적으로 적습니다. 수많은 도구 중 하나일 뿐이죠. 전체적인 기반 인프라가 먼저 구축되어야 합니다. 시스템이 확립된 후 AI 코딩은 애플리케이션 계층에서만 도움을 줄 뿐입니다. 운영체제 작성과 같은 커널 계층에서 일한다면, 핵심 가치는 코딩 자체가 아니라 전체 시스템 인프라에 있습니다.
대규모 물리적 AI의 재무 및 컴퓨팅 현실
장샤오쥔: 귀사는 매달 몇 개의 토큰을 사용하나요? 그 지표에 얼마나 신경을 쓰십니까?
허샤오펑: 토큰 사용량에는 크게 신경 쓰지 않습니다. 지난 1년간 많은 이들이 이 문제를 제기했습니다. 디지털 중소기업은 토큰에 집중해야 할지 모르고, 중견·대형 디지털 기업은 적절한 관심을 기울여야겠지만, 이것이 포괄적인 지표가 되어서는 안 됩니다. 일부 기업의 핵심 지원 사업은 완전히 디지털화되지 않았거든요. 사실 우리는 우리 차에서 흥미로운 통계를 낸 적이 있습니다. 차세대 VLA(Vision-Language-Action) 모델이 하루 3~4시간만 작동한다면 토큰을 얼마나 사용할까요? 정확한 숫자는 기억나지 않지만, 내부 루프로 처리됩니다. 디지털 AI에서 토큰 사용량은 물리적 세계를 해석하는 데 필요한 토큰 수보다 훨씬 적습니다. 하지만 두 가지를 비교하는 것은 결국 무의미합니다. 자율주행차는 자동화된 기계로 작동하기 때문입니다. 환경을 처리하는 데 필요한 만큼 토큰을 사용하죠. 물리적 세계에서 토큰 사용량은 결국 기계가 사람과 기업을 위해 얼마나 가치를 창출할 수 있느냐의 문제가 될 것이며, 이는 디지털 AI와는 완전히 다른 차원입니다.
장샤오쥔: 합리적인 토큰 예산은 얼마라고 보며, 내부적으로 비용을 어떻게 관리하나요?
허샤오펑: 모르겠습니다. 내부적으로는 모두의 토큰 사용을 제한하지 않으려 합니다. 많은 임원이 토큰 비용을 통제해 분기마다 1년치 비용을 절감할 수 있다고 주장하며 제게 묻습니다. 저는 누군가 정말 가치를 창출할 수 있다면, 제 역할은 지출 측면에서 상위 10위권의 이상치(outlier)와 같은 가장 비정상적인 사례만 모니터링하고 관리하는 것이라고 믿습니다. 나머지는 개방해야 합니다. 직원이 월 1,000위안이나 10,000위안을 쓰더라도 막대한 가치를 창출한다면, 그들의 급여가 그보다 훨씬 높은데 왜 제한해야 합니까? 현재 우리의 토큰 분배는 자율주행과 콕핏 부서가 통합된 '일반 지능 센터(General Intelligence Center)'에 집중되어 있습니다. 그들은 거대한 팀이죠. 우리는 토큰만이 아니라 컴퓨팅 파워를 측정합니다. 예를 들어, 3만~5만 개의 NVIDIA H100 GPU 할당량을 얼마나 효율적으로 사용하는지를 봅니다.
장샤오쥔: 이상치 관리를 언급하셨는데, 최근 어떤 데이터 이상치에 집중하고 계신가요?
허샤오펑: 최근 데이터와 관련해 엄격한 통제를 수립했습니다. 많은 이들이 데이터의 가치를 말하지만, 이를 관리하는 데 따르는 천문학적인 비용을 깨닫는 기업은 거의 없습니다. 디지털 AI 분야에서 학습 데이터 규모는 수십 테라바이트 정도로 상대적으로 작습니다. 하지만 물리적 AI 모델을 학습시킬 때는 한 번의 실행에 수십에서 수백 테라바이트를 처리합니다. 이 데이터를 저장하고 관리하는 비용은 엄청납니다. 우리의 데이터 투자에 대한 직접적이고 고정적인 비용만 매년 10억 위안이 넘습니다. 어떤 데이터가 가치 있고, 어떤 데이터가 일시적으로 유용하며, 어떤 데이터에 빠르게 접근해야 하고, 어떤 데이터를 재사용할 수 있는지 분석해야 합니다. 이러한 워크플로우를 최적화하면 수천만 위안을 절감하고 막대한 효율성을 얻을 수 있습니다. 바로 이런 이유로 데이터와 컴퓨팅 파워를 전문적으로 관리하는 팀을 두고 있으며, 그래서 개별 엔지니어의 토큰 수치에는 크게 신경 쓰지 않는 것입니다. 물리적 모델 학습에 필요한 컴퓨팅 파워가 진짜 비용이 발생하는 곳이니까요.
CEO 역할을 자동화하는 것이 자율주행보다 훨씬 어려운 이유
장샤오쥔: 만약 당신의 기술을 복제하는 AI 모델, 즉 '허샤오펑 기술'을 학습시킨다면 어떤 학습 데이터가 필요하며, 그 기술은 어떤 모습일까요?
허샤오펑: 오늘날 디지털 및 물리적 모델은 블루칼라보다 화이트칼라 노동자의 기술을 자동화하는 것을 훨씬 쉽게 만듭니다. 하지만 기술 소외(deskilling)의 논리적 과정을 보면, 고급 블루칼라와 화이트칼라 역할이 자동화되면 막대한 사회적 위험이 따를 것입니다. CEO는 기술적으로 수십 년이나 한 세기 뒤에 대체될 수 있을지도 모릅니다. 그때가 되면 제 역량이 AI 기술로 패키징될 수도 있겠죠. 하지만 그때쯤이면 인간 CEO들도 더 강력하고 포괄적인 역량을 갖추게 될 것입니다. 우리는 로봇을 만들고 있기 때문에 이 문제를 깊이 고민해 왔습니다. 여기에는 두 가지 큰 모순이 있습니다. 대부분의 사람은 기존 능력을 어떻게 기술로 바꿀지 생각합니다. 하지만 모델 관점에서 시스템은 디지털화된 기술이 올바른지 어떻게 알고, 지속적인 학습을 통해 개선할까요? 물리적 시뮬레이션 모델에서는 이를 강화할 수 있습니다. 이는 코딩이나 자율주행과는 매우 다릅니다. 코딩과 자율주행에서는 시스템이 실수를 하면 명확히 드러납니다. 하지만 허샤오펑의 의사결정을 기술로 만들려 한다면, 전략적 결정이 실시간으로 옳은지 그른지 판단하기가 극도로 어렵습니다. 그래서 우리는 남이 만든 시스템을 사용하기보다 기반 시스템 자체를 구축하는 데 집중하고 있습니다.
장샤오쥔: 직관적으로, 디지털화된 허샤오펑 기술의 주된 단점은 무엇일까요?
허샤오펑: 누군가의 능력이 완전히 디지털화되면 모두가 그 사람에게 사실 많은 단점이 있다는 것을 깨닫게 될 것입니다. CEO로서 저 역시 예외는 아닙니다.
장샤오쥔: CEO로서, 오늘날 귀사의 AI 집중도가 충분하다고 보십니까?
허샤오펑: 디지털 세계 기업들은 자원의 수십 퍼센트를 AI에 집중할 수 있다고 봅니다. 물리적 세계에서 샤오펑은 수만 명의 직원을 둔 기업이며, 저는 우리가 자원 전체의 15~20%를 '범용 AI(pan-AI)'에 써야 한다고 생각합니다. 여기에는 자율주행 부서와 로봇 공학 부서가 포함됩니다. 이는 합리적이고 충분한 비중입니다.
AI 자동차 회사에서 물리적 AI 강자로의 전환
장샤오쥔: 인공지능 기업을 한쪽에, 제조 기업을 다른 쪽에 둔다면 이 둘을 어떻게 균형 잡습니까? 샤오펑이 AI 기업이어야 할지, 자동차 제조 기업이어야 할지에 대한 내부적인 갈등이 있나요?
허샤오펑: 저는 그렇게 보지 않습니다. 자동차 개발은 여러 유형의 연구개발(R&D)로 구성된다고 믿습니다. 첫째는 하드웨어 R&D, 둘째는 소프트웨어 R&D이며 AI는 소프트웨어의 한 구성요소일 뿐입니다. 그다음은 제조 R&D입니다. 하드웨어 R&D와 제조는 완전히 다른 기술 세트입니다. 예를 들어, 아름다운 테이블과 의자를 스케치할 설계 능력은 있을지 몰라도, 실제로 그것을 만들 제조 능력은 없을 수 있습니다. 자동차 회사에서 이러한 다양한 R&D 역량을 마스터하는 것이 핵심 기반입니다. 미래에는 다섯 번째 유형의 역량이 생길지도 모릅니다.
장샤오쥔: 작년까지만 해도 샤오펑을 "AI 자동차 회사"라고 부르셨습니다. 올해는 공식적으로 '샤오펑 그룹'으로 리브랜딩하며 "물리적 AI 회사"라고 선언하셨죠. 이러한 사명 변경의 전략적 이유와 실질적인 의미는 무엇입니까?
허샤오펑: 이 전환은 이제 막 시작되었고, 아직 완전히 공개할 수 없는 디테일이 많지만 맥락을 공유할 수는 있습니다. 지난 10년간 샤오펑은 스마트 전기차에 집중했습니다. 첫 차를 설계하고, 양산하고, 10만 대를 판매하며 표준 제조 주기에 진입했습니다. 2014년 시작할 때만 해도 차량 지능을 믿는 사람은 거의 없었습니다. 전동화를 믿는 이들도 소수였고, 대부분은 자동차를 전통적인 대규모 사업으로만 보았습니다. 작년인 2025년에는 전 세계적인 신에너지 전환으로 인해 전동화가 미래라는 점을 모두가 받아들였습니다. 그러나 자동차 분야에서 지능화가 빠르게 발전했음에도 그 진척은 여전히 만족스럽지 못했습니다. 도요타, 구글부터 바이두, 테슬라, 샤오펑까지 모두 자율주행에 막대한 자원을 쏟아부었습니다. 상당한 성과를 거뒀지만 우리가 진정 원하는 높이에는 도달하지 못했습니다. 우리가 만든 시스템은 제가 '스티치 몬스터(Stitch Monster)'라고 부르는 것들, 즉 통합된 AI 모델이 아닌 소프트웨어 규칙과 AI 알고리즘의 결합체였습니다. 여전히 소프트웨어 기반 논리였던 것이죠.
수십억 달러의 내기: 스티치 몬스터를 버리고 VLA 파운데이션 모델로
장샤오쥔: 작년 샤오펑 내부에서 이 패러다임을 바꿀 어떤 일이 있었나요?
허샤오펑: 작년에 우리는 중대한 변곡점을 맞이했습니다. 두 세대의 지능형 보조 주행 시스템을 동시에 개발 중이었죠. 내부적으로는 1세대 VLA와 2세대 VLA라고 불렀습니다. 1세대 VLA는 모델을 확대해 전통적인 소프트웨어 규칙의 영향력을 낮추고 백엔드 역량을 강화하며 사후 학습을 보강했습니다. 2세대 VLA는 완전히 다른 방향을 택했습니다. 전통적인 엔드투엔드 논리를 버리고 훨씬 큰 파운데이션 모델을 활용해 자율주행 역량의 절대적인 상한선을 열었습니다. 그러고 나서 하한선을 수렴시키는 작업을 했습니다. 즉, 치명적인 오류를 최소화하고 차가 정확히 예상대로 움직이게 하는 것입니다. 자율주행에서의 일반화는 여전히 거대한 문제입니다. 오늘날 어떤 자율주행 기업도 메모리 보조 주행(차가 경로를 미리 한 번 주행해 공간을 매핑해야 하는 방식)에 의존하지 않고 낯선 지하 주차장에서 매끄럽게 주행할 수 없습니다. 이는 시스템이 물리적 세계를 실제로 이해하는 수준이 매우 낮다는 것을 보여줍니다. 구형 아키텍처의 상한선은 너무 낮았습니다. 잘하려면 1만 가지 가능성을 열어야 하는데, 구형 시스템은 1천 가지에 묶여 있었죠. 작년 이맘때쯤 2세대 VLA는 제게 거대한 변화를 보여주었습니다. 상한선이 10만, 심지어 100만 포인트에 달할 수 있었지만 당시 하한선은 끔찍했습니다. 구형 시스템에서는 상한선 1,000에 하한선 900으로 매우 안정적일 수 있었죠. 새 모델에서는 하한선이 기존 상용 제품보다 훨씬 낮았습니다. 우리는 선택에 직면했습니다. 소프트웨어 공학 방법론과 전통적인 비즈니스 흐름 내의 도구로서 AI를 계속 사용할 것인가, 아니면 거대한 도박을 할 것인가. 우리는 AI 도구와 함께 전통적인 소프트웨어 방법론을 사용하는 것이 더 강력한 소프트웨어 스티치 몬스터를 만들 뿐이라는 것을 깨달았습니다. 그래서 작년 4월경, 우리는 거대한 내기를 했습니다. 수십억 위안을 들여 구축했던 이전 시스템의 개발을 중단했습니다.
장샤오쥔: 왜 수십억 위안짜리 시스템을 폐기하기로 결정했나요? 계기는 무엇이었습니까?
허샤오펑: 구형 시스템으로는 진정한 무인 자율주행을 달성할 수 없고, 로봇이 일반화될 수도 없다는 것을 깨달았기 때문입니다. 로봇이 낯선 방에 들어가 당신을 알아보고, 자리에 앉고, 물 한 잔을 거절할 때 자연스럽게 반응하려면 강력한 규칙과 사소한 AI 알고리즘으로는 불가능합니다. 우리는 믿을 수 없을 정도로 똑똑한 차를 만들고 싶었지만, 기존 소프트웨어 방법론으로는 무한히 똑똑해질 수 없다는 것을 알았습니다. 그것은 지름길이었지 실제 길은 아니었습니다. 우리는 진짜 길을 찾아야 했습니다. 하드웨어와 소프트웨어의 가치가 결국 50대 50으로 나뉠 것이라는 점을 믿어야 했습니다. 고객이 30만 위안짜리 차의 하드웨어에 15만 위안을, 포괄적인 소프트웨어와 지능 역량에 나머지 15만 위안을 기꺼이 지불할 것이라는 점을요. 우리는 전략 기획과 R&D 프로세스를 바닥부터 완전히 재구조화해야 했습니다.
장샤오쥔: 그 거대한 내기를 할 때 사내에 기념비적인 회의가 있었나요? 어떻게 그런 대규모 조직 변화를 실행했습니까?
허샤오펑: 드라마틱한 회의는 없었습니다. 제가 머릿속으로 최종 결정을 내렸고 우리는 전력을 다했습니다. 작년 3분기 말, 우리는 움직임을 시작했고 자율주행 센터를 완전히 재구조화했습니다. 모든 조직에서 재능 있는 사람들은 관성이 있습니다. 그들은 최신 AI 도구를 손에 쥐고도 옛 방법론을 사용하는 데 익숙해져 있죠. 하지만 진정으로 혁신하려면 핵심 방법론과 사고방식을 바꿔야 합니다. 우리가 취한 정확한 운영 단계는 고도의 전략적이고 독점적인 내용이라 공유할 수 없습니다. 우리는 리더십과 조직 구조에 집중하며 부서마다 다른 템포로 조정했습니다. 극도로 어렵습니다. 근본 논리를 바꾸지 않으면 AI를 사용해 집을 더 빨리 짓는 것뿐이지, 여전히 낡은 집을 수리하는 것에 불과합니다. 우리는 완전히 새로운 것을 짓고 싶었습니다. CEO로서 베팅을 하고, 피드백을 수용하며, 조직이 전환 과정을 겪도록 이끌어야 합니다. 샤오펑은 수만 명의 직원을 둔 거대 스타트업이기에, 이 조직 변화를 관리하는 것은 작은 팀과는 차원이 다른 도전입니다. 전체 그림을 쥐고 있으면 여러 각도에서 조언을 받지만, 대부분 불완전합니다. 결국 그 관점들을 통합해 결단을 내려야 합니다.
장샤오쥔: 지난 3년간 큰 결정에 훨씬 더 기꺼이 베팅하는 모습이 보인다는 이야기를 들었습니다.
허샤오펑: 도박꾼이 되라는 것이 아니라, 언제 베팅해야 하는지 알고 일찍 실행하라는 뜻입니다. 2022년 말, 샤오펑이 거대한 도전에 직면했을 때 저는 스스로를 위해 두 가지 핵심 철학을 세웠습니다. 첫째, 절대 패배를 인정하지 마라. 둘째, 기꺼이 패배를 인정하라. 이 둘 사이의 균형은 막대한 어려움에 직면해도 끈기 있게 밀고 나가야 한다는 뜻입니다. 하지만 동시에 1세대 VLA를 완전히 중단했을 때처럼 더 이상 실행 불가능한 프로젝트를 닫을 수 있는 객관적인 명료함을 유지해야 합니다. 주저하고 기다리며 관망하는 것은 타임라인만 늦출 뿐 성공을 불가능하게 만듭니다. 몇 년 뒤 우리가 더 성공하면 정확한 디테일을 논할 수 있겠죠. 모든 기업은 자신만의 독특한 길을 찾아야 합니다. 오늘날 중국에서는 모두가 A사나 B사를 베끼려 하지만, 그것은 실수입니다. 디지털 AI에 통하는 것이 물리적 AI에 그대로 복제될 수는 없습니다. 완전히 다른 세상입니다. 물리적 사업을 운영해 본 적 없는 디지털 AI 기업들이 물리적 세계를 정의하려 할 때, 그들은 매우 좁은 의미의 물리적 AI를 구축할 뿐입니다. 실제 물리적 세계는 복잡한 인간 상호작용, 환경 변수, 규제 준수, 상업적 생존 가능성을 포함합니다. 단순히 강력한 기능 몇 개를 갖는 것보다 훨씬 넓게 생각해야 합니다. 디지털 AI CEO들이 물리적 AI로의 전환을 쉽게 설명하지 못하는 이유가 바로 그겁니다. 그들은 자신이 성공할 수 있을지조차 아직 발견하는 중이니까요.
샤오펑의 휴머노이드 로봇 IRON의 재탄생
장샤오쥔: 작년 엄청난 주목을 받았던 휴머노이드 로봇 IRON에 대해 이야기해 보죠. 이 제품은 어떻게 탄생했으며, 왜 2023년에 범용 휴머노이드 로봇으로 방향을 틀었나요?
허샤오펑: 샤오펑의 로봇 여정은 사실 세 가지 뚜렷한 단계로 나뉩니다. 첫 번째 단계는 2018년부터 2020년까지입니다. 중국의 4~5개 기업이 독립적인 팀을 꾸려 사족 보행 로봇을 탐색하던 시기였죠. 두 번째 단계는 2020년부터 2023년까지입니다. 그 4년 동안 우리는 세 가지 다른 이정표를 세웠습니다. 전통적인 로봇 공학 방식으로 로봇을 만들고, 자동차를 만들듯이 여러 요소를 꿰매어 붙이는 방식도 시도했지만 결과는 엇갈렸습니다. 세 번째 단계는 2023년 이후 시작되었습니다. 2022년 말 파운데이션 모델의 진전을 보았을 때 우리의 모든 논리가 바뀌었습니다. 이전에는 성공적인 로봇 두뇌를 만드는 것이 불가능하다고 믿었습니다. 소뇌의 복잡성, 즉 물리적 균형 유지와 동작 제어의 난도가 너무 높았기 때문입니다. 오늘날 많은 기업이 로봇이 단조로운 속도로 천천히 앞으로 걸을 수 있다는 이유로 로봇 소뇌를 개발했다고 주장합니다. 그것은 소뇌가 아닙니다. 그저 균형을 유지하는 기본적인 척수나 뇌간일 뿐이죠. 그들은 진정한 소뇌 기능을 달성하기엔 멀었습니다.
장샤오쥔: 2023년 이 새로운 비전을 실현하기 위해 어떤 주요 조직 변화를 단행했나요?
허샤오펑: 2023년 우리는 4족에서 2족으로 완전히 방향을 틀기로 했습니다. 과거의 가정을 버리고 로봇의 두뇌가 직접 구동하는 완전히 새로운 설계에 집중했습니다. 여기에 자동차 부문에서 쌓은 엔지니어링 전문 지식을 결합했죠. 좋은 기술이 있다고 좋은 제품이 되는 것은 아니며, 좋은 제품이 있다고 대량 생산을 할 수 있는 것도 아닙니다. 자동차는 기획과 설계부터 ET, PT, SOP, SOD에 이르는 고도로 성숙한 프로세스를 가지고 있습니다. 올해 말까지 우리는 로봇을 자동차급 SOP 프로세스로 전환하고자 합니다. 2027년까지는 고성능 로봇이 전 세계적으로 첫 번째 진정한 상업적 대량 생산의 해를 맞이할 것으로 기대합니다. 그때가 되면 전통적인 동작 제어 로봇은 쇠퇴하고 고급 물리적 AI 로봇이 그 자리를 대신할 것입니다. 물리적 AI의 핵심 가치는 실제 업무를 수행함으로써 인간에게 정서적, 물리적 가치를 창출하는 능력에 있습니다. 2023년 우리는 기존 로봇 팀이 전통적인 로봇 공학에는 매우 익숙하지만, 이 새로운 세대의 물리적 AI 로봇을 만들 역량이 없다는 것을 깨달았습니다. 당시 LC가 이끌던 로봇 부서에는 300명 정도가 있었습니다. 우리는 팀을 해체하고 60명 미만의 핵심 멤버만 남겼습니다. 떠난 이들 중 다수는 자신의 스타트업을 차려 여러 차례 투자를 받았습니다. 하지만 로봇 전체의 논리를 재구성하려면 전통적인 자동차 엔지니어나 로봇 전문가에게만 의존할 수 없었습니다. AI, 자동차 공학, 제조, 로봇 공학에 대한 통합된 이해를 갖춘 완전히 새로운 팀이 필요했습니다.
장샤오쥔: 전통적인 로봇 전문가도, 지능형 주행 전문가도 아닌 LC를 이 노력의 수장으로 선택한 이유는 무엇인가요?
허샤오펑: 때로는 운명입니다. 그의 전략적 사고와 사고의 4분면이 저와 완벽하게 일치했기에, 이 새로운 사고방식을 이끌 적임자였습니다. 오늘날 다른 기업들이 보여주는 로봇 데모 중 상당수는 여전히 우리가 3~4세대 기술 스택으로 간주하는 것을 활용하고 있습니다. 그저 기본적인 테스트를 수행하는 수준이죠. 샤오펑에는 장기적인 투자를 할 인내와 용기가 있습니다. 빠른 데모는 큰 의미가 없습니다. 2017년 중국에 수백 개의 자율주행 스타트업이 레벨 4 데이터를 과시했지만, 실제 상업적 가치로 이어진 기술은 거의 없었던 것과 같습니다.
장샤오쥔: LC의 재건된 팀을 위한 채용 및 인재 전략은 무엇인가요?
허샤오펑: LC는 그가 '인재 밀도(talent density)'라고 부르는 것, 저는 '인재 잠재력'이라고 보는 것에 집중합니다. 그는 절대적으로 최고의 인재를 채용합니다. 작년 말부터 올해 상반기까지 로봇 부서에서만 일류 기관 출신의 석·박사 졸업생 80명 가까이를 채용했습니다. 매우 비싸지만, 우리는 그들의 장기적인 탐색을 전폭적으로 지원합니다. 우리는 고정된 프로세스와 미리 정의된 도구에 의존하기보다, 초지능적인 사람들을 사용해 초난제의 문제를 해결해야 한다고 믿습니다. LC는 매우 야심 찹니다. 그는 종종 제게 상업용 로봇을 만드는 것을 넘어 인공 인간을 만들고 싶다고 말합니다. 로봇이 우리 사회에 진정한 참여 의식을 갖고 인간의 감정과 깊이 연결되기를 원하죠.
이족 보행 휴머노이드 로봇의 함정 극복
장샤오쥔: 왜 다른 형태보다 범용 이족 보행 휴머노이드 로봇에 그렇게 확고하게 매진하셨나요?
허샤오펑: 가장 도전적인 길이지만, 인간 사회에 가장 심오한 영향을 미칠 길이기 때문입니다. 향후 수십 년 동안 범용 휴머노이드 로봇은 인간의 삶에 깊이 통합될 것입니다. 디지털 AI가 몇십 개의 화이트칼라 역할을 보조하는 데 그친다면, 물리적 AI 로봇은 특히 고령화 사회에서 수백 개의 물리적 역할을 수행할 수 있습니다. 저는 인류의 미래를 위한 두 가지 가장 중요한 요소가 노인들이 더 길고 건강한 삶을 살도록 돕는 의료 AI와, 돌봄과 동반을 제공하는 물리적 AI 로봇이라고 믿습니다. 많은 노인에게 로봇은 결국 그들의 주요 지원 시스템이 될 것입니다. 우리는 다른 형태들의 근본적인 결함을 분석했기에 이 어려운 길을 택했습니다. 예를 들어, 우리는 이전에 4족 보행 로봇(개와 말)을 개발했습니다. 하지만 1미터가 넘는 로봇 개를 일반 가정에 들여놓으면 제 기능을 할 수 없습니다. 벽을 긁거나 침대를 손상시키지 않고는 침대 옆 탁자 근처에서 돌 수도 없죠. 꼬리와 몸이 부드러운 진짜 골든 리트리버와 달리, 딱딱한 로봇 개는 필연적으로 피해를 줍니다. 로봇 개를 더 작게 만들면 배터리 수명이 너무 짧아지고, 활용도는 기본적인 동반 수준으로 떨어집니다.
장샤오쥔: 이족 보행 로봇은 어떤가요? 인간 중심 설계의 도전 과제는 무엇인가요?
허샤오펑: 무거운 금속 갑옷으로 덮인 1.8미터짜리 거대한 이족 보행 로봇을 만들면, 그 옆에 서 있는 설계자조차 강렬한 물리적 압박감을 느낄 것입니다. 넘어지거나, 과열되거나, 고전압이 노출되거나, 단순히 더럽다는 걱정을 자연스럽게 하게 되죠. 성인이 그런 느낌을 받는다면 아이들과 노인들은 어떻게 반응할까요? 가정 환경에서 그런 안전 및 법적 규제를 어떻게 해결하죠? 산업용 로봇은 통제된 환경에서 작동하므로 그런 설계를 활용할 수 있지만, 가정용 로봇은 다르게 설계되어야 합니다. 인간이 상호작용하기에 편안해야 하죠. 그래서 현재 우리 로봇 세대는 남녀 모두에게 편안한 높이인 1.69~1.70미터 정도로 설계되었습니다. 옷을 입을 수 있고 머리카락을 가질 수도 있지만, 불쾌한 골짜기(uncanny valley) 효과와 기타 복잡한 사회학적 문제를 피하기 위해 현실적인 인간의 얼굴을 가져서는 안 됩니다.
휴머노이드 로봇 논란의 비하인드 스토리
장샤오쥔: 작년 기자회견에서 무대 위의 로봇이 인간에 의해 조종되는 것이 아니라 완전히 자율적이라는 것을 증명하기 위해 팀이 깊이 갈등했다고 언급하셨죠. 왜 그렇게 힘들었나요?
허샤오펑: 개인적으로는 신경 쓰지 않았지만, 팀은 엄청나게 불안해했습니다. 그들은 우리가 설명하려고 노력할수록 온라인 여론이 냉소적이라 의심만 더 커질 것이라고 주장했습니다. 성명을 내기 전에 24시간 동안 대중의 반응을 지켜보자고 했죠. 하지만 몇 시간 후, 저는 퍼져나가는 루머를 더 이상 참을 수 없었습니다. 중국과 전 세계에서 추측이 빛의 속도로 퍼지고 있었습니다. 24시간을 기다리면 내러티브는 완전히 통제 불능이 될 것이었습니다. 우리는 내부적으로 그것이 진짜 로봇이고 열 관리가 여전히 진행 중이라 뜨겁게 작동한다는 것을 알고 있었습니다. 하지만 우리에게 중요한 이정표였고 미래 버전은 훨씬 나아질 것임을 알았죠. 그래서 그날 밤 팀을 불러 다음 날 아침 시연을 준비하라고 했습니다. 의심이 남게 두기보다는 진짜 로봇이 자율적으로 작동하는 모습을 모두에게 보여주겠다고 고집했습니다.
장샤오쥔: 대중에게 어떻게 증명했나요?
허샤오펑: 가장 간단하고 반박할 수 없는 방법은 로봇이 걷는 동안 왼쪽 다리를 제거하는 것이라고 결정했습니다. 로봇은 왼쪽에서 오른쪽으로 걷기 때문에 왼쪽 다리가 관객에게 가장 잘 보입니다. 로봇이 작동하는 중에 다리를 제거함으로써 내부 기계 및 소프트웨어 아키텍처를 명확히 보여주었고, 인간이 슈트를 입은 것이 아님을 증명했습니다. 이것으로 PR 위기는 빠르게 해소되었습니다.
휴머노이드 로봇의 시장 잠재력, 상용화 및 미래 타임라인
장샤오쥔: 그 공개 이벤트 이후 로봇 전략은 어떻게 진화했나요?
허샤오펑: 채용이 가속화되었습니다. 로봇 부서에 놀라운 인재들이 모여들었습니다. 로봇 사업을 시작하는 것은 자동차 회사를 시작하는 것과는 완전히 다릅니다. 저는 로봇 회사를 시작하는 것이 자동차 회사를 세우는 것보다 20~100배는 더 어렵다고 생각합니다. 샤오펑의 확립된 제조 및 AI 역량에도 불구하고, 작년의 성공은 우리의 전체적인 성공 확률을 아주 조금 높였을 뿐입니다. 오늘날 중국에는 200개가 넘는 로봇 스타트업이 있는데, 이는 자동차 붐 당시 전기차 스타트업 수의 두 배입니다. 하지만 승용차, 상용차, 특수 차량으로 주로 분류되는 자동차와 달리 로봇은 의료, 화물 운송, 화물 검사 등 수많은 분류를 가질 것입니다. 이러한 전문 로봇 중 상당수는 휴머노이드일 필요가 없습니다. 하지만 범용 이족 보행 휴머노이드 로봇의 길에서 99%의 기업은 실패할 것입니다. 소프트웨어 복잡성이 너무 높고, 로봇 스타트업이 고충실도 물리적 AI 소프트웨어를 구축하도록 돕는 오픈 소스 플랫폼이 없기 때문입니다. 우리는 스스로 이 함정들을 헤쳐 나가는 데 집중하고 있습니다. 함정을 밟아봐야 엔지니어링 도전 과제를 진정으로 이해할 수 있기 때문입니다.
장샤오쥔: 범용 휴머노이드 로봇 분야에서 당신의 주요 경쟁자는 누구라고 생각하십니까?
허샤오펑: 현재 범용 휴머노이드 로봇에는 진정한 라이벌이 없습니다. 완전히 우리 자신과의 싸움입니다. 모든 로봇 기업은 스스로를 최대한 강하게 만들고, 기반 조직, 하드웨어 인프라, 전체 시스템 통합을 구축하는 데 집중해야 합니다. 작년 우리 로봇이 매우 생생한 동작 제어로 화제가 된 이유입니다. 전통적인 자동차 동작 제어는 지난 1세기 동안 대부분 상품화되었고, 자동차 회사들은 Tier 1 공급업체로부터 모터 컨트롤러를 구매해 왔습니다. 하지만 로봇이 진정으로 유능하려면 그 동작 제어가 자동차보다 훨씬 통합되고 반응적이어야 합니다. 자동차에서 다른 제어 도메인들은 분리되어 있습니다. 이는 표준 주행에는 통하지만, 차의 왼쪽 타이어는 눈 위에, 오른쪽 타이어는 풀 위에 있는 상태에서 갑자기 나타난 사람을 피해 47도 회전을 수행하는 것은 극도로 어렵습니다. 그런 조건에서 4륜 트랙션, 움직임 균형, 레이턴시를 관리하는 것은 여전히 도전 과제입니다. 로봇에게는 복잡성이 배가됩니다. 인간은 200개가 넘는 관절을 가지고 있어 무한한 루프의 잠재적 움직임 조합이 가능합니다. 규칙 기반 소프트웨어가 아닌 AI 기반 동작 제어를 사용하여 이 전체적인 의인화를 복제하는 것은 엄청나게 어렵습니다. 우리는 로봇에게 인간이 눈, 얼음, 풀 위를 걸을 때 마찰을 느끼고 즉시 균형을 잡는 것과 같은 물리적 본능을 주고 싶습니다. 이것이 우리가 액추에이터 관절과 손을 포함한 로봇 하드웨어의 80%를 자체 개발하고, 품질을 확장하기 위해 상위 Tier 2 공급업체와 협력하는 이유입니다.
장샤오쥔: 대량 생산을 준비하면서 직면한 주요 엔지니어링 및 상업적 병목 현상은 무엇인가요?
허샤오펑: 첫 번째 병목은 자체 하드웨어가 예외적으로 신뢰할 수 있고 안정적인지 확인하는 것입니다. 두 번째는 고수준 파운데이션 모델과 물리적 액추에이터 간의 매끄러운 결합을 달성하는 것입니다. 세 번째는 제품의 상업적 생존 가능성을 증명하는 것입니다. 시장은 아이폰 4 같은 순간을 기다리고 있습니다. 처음 상업적으로 생산된 로봇은 아마 오리지널 아이폰 1만큼도 세련되지 않았겠지만, 거대한 패러다임 전환을 상징할 것입니다. 로봇이 일반화된 소프트웨어 역량을 달성하면, 그 시장 채택과 생산 확장은 자동차보다 훨씬 빨라질 것입니다. 자동차는 글로벌 도로 인프라를 구축하고, 교통 규정을 수립하고, 매우 복잡한 제조 물류를 관리해야 했기에 규모를 키우는 데 한 세기가 걸렸습니다. 로봇은 기존 인간 환경에 즉시 배치될 수 있습니다. 소프트웨어가 준비되면 물리적 AI는 빠르게 확장될 것입니다.
GX 소개: 샤오펑의 6인승 플래그십 SUV와 전방 장착 로보택시
장샤오쥔: 자동차 사업 이야기를 해보죠. 올해 GX를 포함해 여러 신차를 출시하시죠. 이것이 샤오펑의 고급 시장 복귀를 의미하는 것인가요?
허샤오펑: 네, GX는 우리의 첫 풀사이즈 6인승 플래그십 SUV입니다. GX의 독특한 점은 플라잉 카와 로봇 부서의 고급 R&D 역량을 이 차량에 통합했다는 것입니다. 예를 들어, 플라잉 카의 비행 핵심 부품을 위해 개발된 안전 리던던시(redundancy) 시스템을 GX에 구축했습니다. GX는 6개의 완전한 안전 리던던시를 갖춘 전방 장착 로보택시 아키텍처를 탑재한 중국 최초의 양산 승용차입니다. 야생에서 주 전원이 실패해도 차는 여전히 주행할 수 있습니다. 쥐가 배선을 갉아먹어도 상업용 항공기의 안전 시스템처럼 시스템은 계속 작동합니다.
장샤오쥔: GX의 소프트웨어 아키텍처는 물리적 섀시와 어떻게 통합되나요?
허샤오펑: 우리는 와이어 컨트롤 섀시를 새로운 EEA(Electronic and Electrical Architecture) 및 VLA 자율주행 시스템에 연결했습니다. 이 통합을 통해 섀시는 훨씬 짧은 레이턴시로 VLA 결정을 실행할 수 있으며, 안전 하한선을 높이고 제어 민감도를 수십 퍼센트 향상시킵니다. 또한 로봇 작업 계획 논리를 차량에 도입했습니다. 미래의 차량 내 상호작용에서 차량은 휴머노이드 로봇처럼 작업을 처리할 것입니다. 시스템에 작업을 부여하면, 누가 말하는지 식별하고 권한 수준을 결정하며 명령을 실행하기 위한 일련의 동작을 계획합니다. 또한 내부 공간을 매우 다재다능하게 설계했습니다. 3열은 완전히 평평하게 접을 수 있어 SUV를 6인승에서 매우 넓은 4인승이나 5인승 차량으로 즉시 변환할 수 있습니다. 푸야오 글래스(Fuyao Glass)와 프리미엄 프라이버시 글래스를 공동 개발하고, 미디어(Midea)와 차세대 차량용 냉장고를 공동 개발하는 등 모든 디테일을 맞춤화했습니다. 이 정도 수준의 통합 역량을 갖춘 차량을 만드는 것이 오늘날 치열한 시장에서 승리하는 유일한 길입니다.
장샤오쥔: GX 가격은 어떻게 결정했나요? 오리지널 G9 출시 때의 전략적 실수를 되풀이할까 봐 걱정되지 않나요?
허샤오펑: 전혀 걱정하지 않습니다. 우리의 전략적 사고, 가격 책정 논리, 조직 역량은 G9을 출시했을 때와는 완전히 다른 차원에 있습니다. 지난 3년 반 동안 우리는 제품 기획, 조직 구조, 고객 이해, 핵심 비즈니스 논리를 완전히 개편했습니다. 시스템 역량이 더 높은 차원에 도달하면 과거의 오류를 쉽게 식별하고 다시는 발생하지 않도록 방지할 수 있습니다. 5월 21일 공식 출시 이벤트에서 구성과 가격을 명확히 보여드릴 것입니다. GX는 최첨단 기술의 럭셔리를 경험하고 싶어 하는 30대 이상의 전문가, 관리자, 기업가를 위한 가족 지향적이고 기술적으로 럭셔리한 차량으로 설계되었습니다.
자동차 '혈해'에서의 통합과 전투
장샤오쥔: 리오토(Li Auto)의 L9이나 니오(Nio)의 플래그십 SUV 시리즈 같은 다른 플래그십 SUV들과의 치열한 경쟁을 어떻게 보십니까?
허샤오펑: 그들은 경쟁자이자 동맹이라고 봅니다. 우리는 모두 친구입니다. 베이징 모터쇼 기간에 리샹의 부스를 방문해 새 L9을 구경했고, 윌리엄 리의 부스를 방문해 니오의 플래그십 SUV 시리즈를 보았습니다. 우리 모두는 이 세그먼트에 대해 각자의 독특한 이해와 솔루션을 가지고 있습니다. 미학은 결국 주관적이지만, 저는 우리 차량의 시각적 디자인에 매우 자신 있습니다. 우리는 디자인이 점점 더 아름다워지는 길을 걷고 있습니다. 어떤 이들은 왜 올해 4대의 차를 출시하는 대신 모델 수를 줄이는 데 집중하지 않느냐고 묻습니다. 모든 기업은 자신만의 전략적 경로가 있습니다. 우리에게 이 모델들을 출시하는 것은 더 넓은 사업 규모 및 기술 통합 전략과 일치합니다.
장샤오쥔: 지금 개인적인 시간을 가장 많이 보내는 곳은 어디인가요? 자동차, 로봇, AI, 아니면 조직 관리인가요?
허샤오펑: 그 모든 영역에 참여하지만, 장기 전략과 기획에 대부분의 시간을 씁니다. 자동차 산업에서 규모만으로는 영구적인 성공을 보장할 수 없으며, 단기적인 이익은 종종 고통스럽고 일시적입니다. 제 직업은 우리의 기술 역량, 조직 구조, 시장 포지셔닝을 응집력 있는 장기 전략으로 통합하는 것입니다. 자동차는 매우 복잡하고 복합적인 시스템입니다. 짧은 판(shortboard)이 실패하고 있는데 긴 판(longboard) 하나만 자랑하는 것은 소용없습니다. 예를 들어, 일부 기업은 올해 레벨 4 자율주행을 달성했다고 자랑하는데, 이는 단순히 비현실적입니다. 저는 진정한 레벨 4 자율주행이 18~24개월 내에 실제 구현되기 시작할 것이라고 믿습니다. 구현되면 자동차 판매를 확실히 견인할 것이지만, 정확한 배수는 지켜봐야 합니다. 3월 말, 우리는 2세대 VLA의 첫 버전을 출시했습니다. 4월 중국 전체 자동차 판매가 전년 대비 20% 정도 감소했지만, 샤오펑의 판매량은 50~70% 증가했는데, 그 상당 부분이 2세대 VLA에 의해 직접적으로 견인되었습니다. 자동차 회사의 진정한 성공은 하드웨어, 소프트웨어, 제조, 디자인, 운영을 결합한 다중 시스템 통합의 마스터 클래스를 요구합니다.
장샤오쥔: 호라이즌 로보틱스(Horizon Robotics)의 창업자 위카이는 당신이 가장 까다로운 파트너라고 자주 말합니다. 그는 자동차 회사가 결국 소프트웨어와 지능은 타사 공급업체에 의존해야 한다고 믿죠. 그의 견해를 어떻게 생각하십니까?
허샤오펑: 위카이는 가까운 친구이며 호라이즌 로보틱스는 훌륭한 일을 해왔습니다. 하지만 그의 전략적 경로는 미래에 자동차 및 로봇 제조업체가 더 많아질지 적어질지에 달려 있습니다. 시장이 집중되면 그의 주소 가능한 시장은 줄어들어 그의 길은 더 어려워집니다. 저는 시장이 고도로 집중될 것이라고 믿습니다. 2030년까지 중국에는 5개의 대규모 자동차 그룹만 남을지도 모릅니다. 다른 소규모 업체들이 니치 세그먼트에서 살아남을 수는 있겠지만, 규모의 부족으로 경쟁하기가 점점 더 어려워질 것입니다. 역사적으로 많은 자동차 회사는 진정한 자체 연구를 수행하지 않았습니다; 그들은 조립과 통합을 전문으로 했죠. 목표가 단기적인 전술적 실행이라면 타사 통합에 의존하는 것이 맞습니다. 하지만 목표가 장기적인 생존이라면 자체 연구를 마스터해야 합니다. 10년 후 소프트웨어는 자동차 가치의 50% 이상을 차지할 것입니다. Tier 1 공급업체는 수백 개의 다른 파트너가 그 정도 수준의 깊은 도메인 간 융합을 달성하도록 쉽게 도울 수 없습니다. 하드웨어, 소프트웨어, 제조, 사용자 운영을 하나의 응집력 있는 시스템으로 통합해야 합니다.
장샤오쥔: 오늘날 자동차의 '혈해(sea of blood)'에서 마침내 헤엄쳐 나왔습니까?
허샤오펑: 아니요, 우리 모두 여전히 헤엄치고 있습니다. 혈해에서 진정으로 빠져나온 사람은 아무도 없다고 생각합니다. 로봇 시장은 소프트웨어 장벽이 예외적으로 높아서 자동차 분야에서 보는 즉각적이고 동질적인 가격 전쟁을 막아주기 때문에 조금 더 나을 것입니다. 제 일상은 다른 기업가들과 마찬가지로 여전히 강렬합니다. 늦게 하루를 시작해 밤늦게까지 일하고, 모든 사업 부서에 걸쳐 속사포처럼 결정을 내립니다. 물리적 세계가 너무 빠르게 변하기 때문에 비즈니스 서적을 많이 읽지도 않습니다. 책이 인쇄될 때쯤이면 통찰력은 이미 구식이 되어버리죠. 저는 직접적인 실무, 여행, 끊임없는 소통을 통해 지식을 흡수하는 것을 선호합니다. 과거를 돌아보면 과거의 결정에 대해 어떠한 후회도 하지 않습니다. 비즈니스에서 실수를 너무 많이 하기 때문에 후회할 시간이 없습니다. 핵심은 실수가 왜 발생했는지 분석하고, 배우고, 계속 나아가는 것입니다.