엔비디아 트랜스크립트: 젠슨 황, 에이전트 컴퓨팅의 미래와 50% 현금 환원, Vera Rubin CPU 아키텍처 공개
GTC 타이베이 2026 금융 애널리스트 Q&A, 2026년 6월
대규모 자본 환원 발표
젠슨 황 CEO는 이번 세션의 시작과 함께 중요한 재무적 결정을 발표했다. 엔비디아는 올해와 내년, 그리고 그 이후에도 잉여현금흐름(FCF)의 50% 이상을 주주에게 환원할 계획이다. 이는 앞서 발표된 800억 달러 규모의 자사주 매입 프로그램과 25배 상향된 배당금에 이은 조치다. 황 CEO는 자사주 매입과 배당을 점진적으로 확대해 나갈 것이라며, 이는 주주들에 대한 강력한 약속이라고 강조했다.
핵심 아이디어: 에이전트 컴퓨팅 패턴
황 CEO는 지난 2년간 강조해 온 핵심 개념을 설명하는 데 많은 시간을 할애했다. AI의 컴퓨팅 패턴은 '에이전트(Agentic)'이며, 에이전트야말로 현대의 애플리케이션이라는 것이다. 이러한 에이전트는 추론하고, 도구를 사용하며, 장기 기억에 접근할 수 있다. 기억은 구조화된 데이터일 수도, 비구조화된 데이터일 수도 있다. 에이전트는 PC, 클라우드, 설계 툴, 소프트웨어 프로그래밍 툴, 데이터베이스 검색 및 처리, 칩 설계 툴 등 다양한 도구를 활용할 수 있다. 과거 애플리케이션이 모든 곳에서 실행되었던 것처럼, 이 컴퓨팅 패턴 역시 클라우드, PC, 워크스테이션, 자동차, 심지어 휴머노이드 로봇에 이르기까지 모든 곳에서 구동될 것이다.
이러한 컴퓨팅 방식은 분산 및 분리형(disaggregated) 구조를 띠며, 에이전트 컴퓨팅 패턴의 각 부분은 데이터 센터의 서로 다른 위치에서 실행된다. Hopper는 사전 학습(pre-training)을 위해 설계되었고, Grace Blackwell은 사전 학습과 사후 학습(post-training)에 추론(inference) 기능을 더했다. MVLink 72는 토큰 생성 비용을 기존 대비 20배 낮추는 혁신을 가능케 했다. 이제 엔비디아는 세계에서 가장 낮은 비용으로 토큰을 생성하는 솔루션을 제공한다. 목표는 저렴한 데이터 센터를 구축하는 것이 아니라, 낮은 비용으로 제품을 생산하는 것이다. 엔비디아의 Grace Blackwell은 세계에서 가장 낮은 비용으로 토큰을 생성한다.
Vera Rubin 아키텍처
Vera Rubin은 사전 학습, 사후 학습, 추론, 그리고 에이전트 실행을 위해 설계되었다. 이 컴퓨팅 패턴은 분리되고 분산되어 있어, 워크로드의 각 부분이 Vera Rubin의 서로 다른 영역에서 실행된다. AI 수익의 핵심인 토큰 생성은 가장 무거운 작업이다. 따라서 GPU 수를 최대화하는 것이 중요하다. 기업들이 판매하는 것이 바로 토큰이기 때문이다. 기업들은 매출을 극대화하기 위해 1기가와트(GW) 데이터 센터에 GPU를 얼마나 탑재할 수 있을지부터 고민하게 될 것이다.
컴퓨팅의 중간 단계는 사고(thinking) 과정이며, 이는 매우 무거운 연산을 수반한다. 사고에는 문맥 읽기, 문서 전체 파악, 추론, 계획 수립, 그리고 도구 실행을 위한 명령어 생성이 포함된다. 도구로부터 피드백이 돌아오면 시스템은 답변의 정확성을 평가한다. AI가 대기하는 동안 도구 사용이 매우 빨라야 하므로 엔비디아는 전체 소프트웨어 산업과 협력해 애플리케이션 가속화를 추진하고 있다. Adobe는 수십 년 만에 처음으로 Photoshop과 Premiere의 아키텍처를 완전히 재설계했다. 엔비디아는 Cadence, Synopsys, Ansys, Siemens 등의 가속화를 지원하고 있다.
CPU는 단순히 대여하기 쉽거나 저렴해서는 안 된다. 빠른 응답 속도가 필수적이며, 이것이 바로 단일 스레드 성능이 중요한 이유다. 멀티 스레드나 멀티 코어가 아닌, 하나의 CPU가 하나의 AI를 위해 하나의 작업을 수행할 때 초고속 성능을 내야 한다. 분리형 구조이기 때문에 엔비디아는 올바른 CPU 설계와 배치 방식을 고민했다. Vera Rubin은 메모리 시스템을 위한 세계 최고의 데이터 프로세서다. AI는 장기 기억과 단기 기억을 모두 갖춰야 하며, 메모리는 곧 데이터다. 데이터 센터 전체에서 데이터를 이동시키려면 엄청난 대역폭이 필요하다.
Vera는 최고의 입출력(IO) 대역폭을 보유하고 있다. 또한 데이터 처리 시 CPU 간 통신이 잦기 때문에 CPU 대 CPU 대역폭도 극대화했다. 하나의 거대한 다이(die)로 구성되어 있어 칩렛(chiplet) 비용이 발생하지 않는다. 엔비디아는 이를 4개나 6개의 작은 다이로 만들 수도 있었지만, 다이를 넘나들 때마다 칩렛 비용이 발생한다. Vera의 CPU 간 대역폭은 3.5배 더 높다. 칩 내부의 단면 대역폭과 IO 대역폭 모두 세계 최고 수준이며, 15% 개선이 아닌 수 배(X factors) 이상의 격차를 보인다.
맞춤형 CPU 코어 설계
Grace는 엔비디아가 처음으로 시도한 CPU였으며, Vera는 2세대다. Vera의 CPU 코어는 완전히 맞춤형으로 설계되었는데, 이는 세계 최고의 클록당 명령어 처리 횟수(IPC)를 구현하기 위해서였다. Vera는 파이프라인 전체에서 10개의 명령어를 동시에 가져오고, 해독하고, 실행한다. 전 세계 어떤 CPU도 이런 방식은 아니다. Vera는 인간이 아닌, 매우 성급한 에이전트를 위해 설계되었다. 에이전트를 위한 가속 컴퓨팅인 셈이다. 이 시스템 전체는 사전 학습이나 추론만을 위한 것이 아니라, 에이전트 실행을 위해 설계되었다.
Microsoft와 함께하는 PC의 재발명
약 3년 전, 황 CEO는 사티아 나델라(Satya Nadella) 마이크로소프트 CEO에게 미래에는 사람들이 항상 도움을 받길 원하기 때문에 AI가 기기 내에서도 실행되어야 한다고 말했다. 현재는 노트북과 대화하려면 방으로 돌아가야 하지만, 미래에는 WhatsApp으로 메시지를 보내기만 하면 된다. 노트북이 하루 종일 AI이자 비서가 되는 것이다. 모든 것을 클라우드에서 실행할 필요는 없다. 노트북이나 휴대폰처럼 로컬에서 실행할 수 있다면 무료이기 때문이다.
황 CEO와 나델라 CEO, 그리고 엔비디아와 마이크로소프트는 완전히 새로운 컴퓨터 라인업을 만들기로 합의했다. 이 라인업은 텐서 처리, 파라미터 압축, 그리고 에이전트를 안전한 샌드박스에 넣고 권한을 부여할 수 있는 운영체제를 갖춘 세계 최초의 제품이다. 워크스테이션, 데스크톱, 노트북을 모두 포함한다. 지난 3년간 양사는 밤낮없이 협력해 모든 애플리케이션을 호환시키고 성능을 벤치마킹했다.
PC 산업 전체가 이 재발명에 동참할 것이다. 이는 40년 만의 진정한 PC 재발명이다. PC의 동작 방식이 바뀔 것이며, 기존의 모든 기능을 더 잘 수행함과 동시에 AI 비서의 역할까지 겸하게 될 것이다.
파운데이션 모델과 생태계
엔비디아는 세계적인 수준의 물리 AI(Physical AI) 파운데이션 모델을 발표했다. 이는 로봇 시스템과 자율주행을 위한 최첨단 모델이다. 엔비디아는 이를 생태계에 공개했다. 모델을 확보한 후 에이전트 워크플로우를 적용해 어디서든 실행하는 것이 미래다. 엔비디아는 컴퓨팅의 모든 측면을 재발명하고 있다.
CPU 시장 기회
CPU 매출 200억 달러 목표에 대한 질문에 황 CEO는 Vera 이전의 모든 CPU는 인간을 위해 만들어졌다고 설명했다. 과거와 미래의 CPU 특성은 매우 다를 것이다. Vera는 압도적인 IPC, 코어당 대역폭, 코어 수, 에너지 효율성을 갖춘 최초의 CPU다. 에이전트 세대를 위한 미래의 CPU는 과거와는 완전히 다르다.
엔비디아 GPU를 탑재한 모든 데이터 센터는 Vera를 사용할 가능성이 높다. 엔비디아는 수백만 개의 GPU를 판매한다. 그 절반이 헤드 노드의 CPU 수가 될 것이다. 헤드 노드 밖에는 워크로드를 조정하는 CPU와 스토리지 서버용 CPU가 있다. 엔비디아 GPU 환경에서 이 세 가지 구성 모두 엔비디아 CPU가 사용될 가능성이 크며, 이는 CPU 수요를 사실상 두 배로 늘린다.
엔비디아의 CPU 점유율은 GPU 점유율보다 더 높을 수 있다. 엔비디아는 100% GPU 점유율을 가지고 있으며, 엔비디아 GPU 외부에서도 더 많은 CPU를 판매할 것이기 때문이다. MVLink Fusion 파트너십을 통해 스위치, NIC, CPU를 함께 판매한다. Vera는 엔비디아 GPU를 넘어 확장될 것이다. 클라우드에서 가장 큰 워크로드인 데이터 처리를 위해 엔비디아는 많은 CPU를 판매할 것이다. 또한 단일 스레드 성능이 중요한 EDA 및 시뮬레이션 분야에서도 많은 CPU를 판매하게 될 것이다.
과거와 미래의 CPU는 설계 중심이 다르다. 엔비디아는 '에이전트'라는 0달러 규모의 시장을 공략하고 있다. 6개월 전에는 존재하지 않았던 시장이지만, 이제는 유용한 AI를 가능하게 하며 엄청난 수요를 견인하고 있다. Vera는 이를 위해 만들어졌으며, 이제 그 시대가 왔다.
미래에 대한 추론: CPU 대 GPU 비율
황 CEO는 미래를 예측하는 능력은 추론에서 나오며, 추측이나 희망이 아니라고 강조했다. 기업들은 토큰을 통해서만 수익을 창출한다. AI 기업들은 CPU 코어를 대여하고 싶어 하지 않는다. 그들은 토큰을 팔고 싶어 한다. 비즈니스 모델은 토큰이다. 기업들은 두 가지를 원한다. 대형 모델을 통해 토큰의 스마트함을 극대화하여 ASP(평균판매단가)를 높이는 것, 그리고 처리량을 극대화하여 최대한 많은 토큰을 생산하는 것이다.
이 공장은 오직 토큰을 위해서만 가치가 있다. 황 CEO는 고객들에게 데이터 센터 내 Vera Rubin MVLink 72의 수를 극대화하라고 조언한다. 두 번째는 GPU를 지원하기 위해 필요한 만큼만 최소한의 CPU를 배치하는 것이다. 기업들은 Vera Rubin의 수를 최대화하여 수익을 극대화하길 원한다. 500억~600억 달러를 데이터 센터에 투자한다면 수익을 많이 내야 한다. CPU는 토큰을 생성하지 않으므로 수익을 회수하지 못한다. 아무것도 하지 않는 300억 달러어치의 CPU가 왜 필요한가?
에이전트는 어디서 실행되는가? 오늘날은 모두 클라우드에서 실행된다. 하지만 미래에는 어디서 실행될까? 모든 곳이다. 그곳에는 모두 CPU가 있다. 그래서 엔비디아는 모든 곳에서 훌륭한 CPU를 제공한다. 엔비디아 내부의 에이전트들도 현재는 클라우드에서 실행되지만, 우리는 이를 다시 가져오려 한다. 노트북에서 실행하고 클라우드의 AI 모델을 호출하는 방식이다. CPU는 분산될 것이고, 엔비디아는 여전히 많은 CPU를 판매할 것이다.
이유는 간단하다. 오늘날 컴퓨터 사용자는 10억 명이지만, 미래에는 수백억 개의 에이전트가 컴퓨터를 사용할 것이다. 이 새로운 지능형 개체들은 작동하기 위해 컴퓨터가 필요하다. 그들은 많은 CPU, 노트북, 워크스테이션, 그리고 사고를 위한 Vera Rubin이 필요할 것이다. CPU 시장은 훨씬 커지겠지만, 가치 면에서 GPU에 근접할 수는 없다.
엔터프라이즈 소프트웨어 스택
엔터프라이즈 비즈니스에 대한 질문에 황 CEO는 엔비디아의 엔터프라이즈 스택이 모든 소프트웨어 기업을 에이전트 기업으로 전환하는 방법이라고 설명했다. Cadence를 예로 들면, 컴퓨팅 패턴은 모델 하네스(model harness), 도구와 기술, 런타임 등 4가지 요소로 구성된다. 이것이 에이전트의 운영체제다. 엔비디아는 모든 SaaS 기업과 협력 중이다. 엔비디아 AI 엔터프라이즈 레이어를 제외한 모든 것은 오픈 소스다. 엔비디아는 GPU당 연간 약 1,000~1,500달러의 런타임 레이어 비용을 청구한다.
이 소프트웨어 라이선스 매출은 성장하고 있다. SaaS 기업들이 클라우드에서 이를 실행할 때 발생하는 수익은 수십억 달러 규모의 큰 비즈니스 기회가 될 것이다.
PC 전략과 가치 제안
황 CEO는 엔비디아가 PC 시장에 진입하는 이유를 설명했다. 엔비디아는 오랫동안 PC 산업에 몸담아 왔다. 단순히 범용 기기를 만들려는 것이 아니다. 엔비디아는 세상이 변했거나 세상을 바꾸고 싶을 때 CPU를 만든다. 과거 그래픽 산업에 진출했을 때 그래픽 카드의 ASP는 49달러였고 하이엔드는 100달러였다. 지금 엔비디아는 1,500달러에서 8,000달러에 이르는 GPU를 판매한다. 우리는 그래픽의 의미를 재정의했고, 이를 GPU로 탈바꿈시켰다.
PC도 마찬가지다. 엔비디아는 PC를 만드는 것이 아니라 PC의 정의를 바꾸려 한다. 오늘날의 PC는 타자기처럼 타이핑하고 클릭하는 기기다. 미래에는 항상 실행되는 비서가 될 것이다. 스마트 타자기에서 항상 대기 중인 AI 비서로 바뀌면 가치 제안이 달라진다. 오늘날 1,500달러짜리 PC를 생각할지 모르지만, 매일 업무를 수행하는 10,000달러짜리 비서를 갖는 것은 비논리적이지 않다. 과거 99달러짜리 전화기를 쓰던 시절에서 지금 2,000달러짜리 스마트폰을 쓰는 것과 같다. 마이크로소프트와 엔비디아는 PC라는 카테고리를 재발명하고 있다. 이제 PC는 '개인용 AI'다. 엔비디아는 PC를 저가 범용품으로 만들기 위해 이 시장에 진입한 것이 아니다.
10년 전 자동차 산업에 진출했을 때, 차량용 임베디드 컨트롤러는 29달러 수준이었다. 엔비디아는 그 29달러짜리 시장을 노린 것이 아니다. 자동차를 로봇이자 자율주행차로 재발명하려 했다. 소프트웨어 프로그래밍이 가능하게 하고 섀시와 아키텍처를 재정의했다. 이제 Hyperion은 어디에나 있다. 29달러짜리 Hyperion은 없다. 엔비디아는 자동차의 개념을 재발명했다. 이것이 엔비디아의 방식이다.
광학(Optics) 및 구리(Copper) 전략
데이터 센터 내 광학 부품에 대한 질문에 황 CEO는 구리를 최대한 활용해야 한다고 답했다. 구리는 신뢰할 수 있고 매우 비용 효율적이다. 엔비디아가 발명한 SerDes 덕분에 MVLink에서 역사상 가장 긴 구리 배선을 구현했다. 랙의 전체 백플레인을 구리로 연결한 것이다. 아무도 가능하다고 생각하지 못했지만, 엔비디아는 '구리를 섹시하게' 만들었다. Amphenol과 협력한 마이크로 커넥터 역시 마찬가지다.
구리는 1미터 정도가 한계지만, 엔비디아는 최대한 이를 활용할 것이다. 하지만 데이터 센터 규모가 커짐에 따라 광학도 필수적이다. 첫 OpenAI 시스템은 18,000개의 GPU였고, Hopper 시대에는 10만 개, Blackwell 시대에는 20만~25만 개였다. 이제 Vera Rubin 시대에는 최소 50만 개가 필요하다. 50만 개의 GPU는 고도의 네트워킹이 필요하며, Spectrum 6는 이를 위해 설계된 세계 최초의 800기가비트 CPO다. 구리만으로는 불가능하다.
엔비디아는 구리로 스케일업(scale up)하고, 실리콘 포토닉스와 광학으로 스케일아웃(scale out)한다. 우리는 구리, 커넥터, 광학 부품이 모두 필요하며, 그래서 Coherent, Lumentum, Corning 등에 투자했다. Marvell과의 파트너십도 엔비디아와 함께 확장하기 위한 준비 과정이다.
추론 및 에이전트 채택
추론은 RTX Spark가 PC에 도입될 때 본격화될 것이다. 에이전트는 곧 '유용한 AI'다. 에이전트는 PC의 모든 소프트웨어를 다시 작성하지 않는다. 대신 운영체제, DirectX, Adobe Photoshop, Autodesk 등의 도구를 활용한다. 에이전트는 매뉴얼을 읽고 도구 활용법을 학습하여 전문가가 된다. 사용자는 명령어 대신 에이전트에게 도움을 요청하기만 하면 된다. 에이전트가 생각할 때마다 추론이 발생한다. 에이전트가 등장하면서 추론이 폭발적으로 증가하고 있다.
데이터 센터의 경우, 엔비디아 시스템은 학습과 추론 모두에 유연하게 사용될 수 있다. 연구자들은 매년 학습 성능을 기하급수적으로 높이고 있다. 시스템이 유연(fungible)할수록 유틸리티가 높아지고, TCO(총소유비용)는 낮아지며, 수명은 길어진다. 엔비디아 플랫폼은 세계에서 가장 낮은 TCO를 자랑한다. A100은 이미 감가상각이 끝났음에도 시간당 3~4달러의 가치를 창출하고 있다. 이는 매우 효율적인 투자다.
AI 인식 및 채택에 대한 대응
AI가 핵발전보다 더 인기가 없다는 지적에 대해 황 CEO는 아시아에서는 AI가 사랑받지만 미국에서는 미움을 받는다고 답했다. 이는 기업들이 규제 포획을 위해 부적절한 단어를 사용하기 때문이다. AI를 핵폭탄과 비교하는 것은 터무니없고 비논리적이다. 이는 대중을 공포에 떨게 하며, 기술 산업 전체에 해를 끼친다.
물론 AI는 안전하게 구축되어야 하며, 부적절한 사용을 막기 위한 정책도 필요하다. 하지만 특정 기업만이 안전을 책임진다는 생각은 잘못되었다. 자동차 산업 전체가 안전한 차를 만드는 것처럼, 기술 산업 전체의 책임이다. 황 CEO는 자신의 자녀들에게도 AI를 사용하라고 권한다. 뒤처지게 하고 싶지 않기 때문이다. 산업계는 AI를 진지하게, 그리고 안전하고 보안성 있게 구축해야 한다.
기가와트당 비용 경제성
기가와트당 비용이 500억 달러에서 900억 달러로 증가하는 것에 대해 황 CEO는 1기가와트 데이터 센터에 500억 달러어치 컴퓨터를 넣는 것과 1조 달러어치를 넣는 것 중 무엇이 나은지 반문했다. 1조 달러가 낫다. 전력은 같지만 생산성이 훨씬 높기 때문이다. 에너지 효율이 압도적이어야 가능하다. 엔비디아는 전력당 성능(perf per watt)을 극대화하는 데 탁월하다. 이것이 가장 중요하다.
엔비디아의 극단적인 공동 설계(co-design) 역량은 랙 전체와 소프트웨어 스택을 아우른다. 이를 통해 에너지 효율을 극대화한다. 전력당 성능은 세계 최고 수준이며, 앞으로도 AI 공장의 가장 중요한 특성이 될 것이다.
사업 부문 공개의 이유
재무 보고서를 세분화한 이유는 비즈니스의 작동 방식을 설명하기 위해서다. 단순히 데이터 센터 하나로 묶으면 비즈니스 구조가 보이지 않는다. 엔비디아 비즈니스는 세 가지 방식으로 작동한다. 첫째, 하이퍼스케일러와의 협력이다. 둘째, 검색, 데이터 처리, SQL 쿼리 등 내부 워크로드다. 셋째, Anthropic, OpenAI, XAI와 같은 AI 모델 기업들과의 협력이다.
두 번째 카테고리는 HP, Dell, Lenovo와 같은 OEM과 AI 네이티브 클라우드(NCP)다. CoreWeave나 Lambda 같은 기업들은 엔비디아의 레퍼런스 아키텍처를 필요로 한다. 그들은 복잡한 소프트웨어 스택을 직접 설계할 엔지니어가 부족하며, 운영에 집중하고 싶어 한다. 엔비디아는 이들에게 레퍼런스 아키텍처와 소프트웨어 스택을 제공하고 고객을 연결해 준다. 이 부문은 전체 비즈니스의 50%를 차지하며 매년 100% 성장하고 있다.
세 번째는 로봇공학 및 엣지 컴퓨팅이다. 모든 공장에는 '공장 두뇌'가 필요하다. 이 에이전트 워크로드는 클라우드에만 머물 수 없다. 산업적, 데이터 보안적 이유로 지역별 데이터 센터가 필요하기 때문이다. 엔비디아는 이 세 가지 범주를 통해 비즈니스의 세분성을 높이고 시장이 성장하는 방식을 보여주고자 한다.
생산성 영향에 대한 증거
경기 침체 위험에 대해 황 CEO는 AI의 생산성 향상 증거를 제시했다. 전 세계 소프트웨어 엔지니어들은 연간 3~4조 달러의 인건비를 소비한다. 2023년에는 3억 건의 소프트웨어 커밋이 있었고, 2025년에는 5억 건이었다. 2026년 초에는 연간 14억 건으로 급증했다. 소프트웨어 엔지니어들의 생산성이 3배 증가한 것이다. 6조 달러 이상의 생산성 창출 효과다. 기업들은 AI를 사용하는 엔지니어를 해고하지 않고 오히려 더 많이 고용할 것이다. 코드 생성은 곧 문제 해결이자 GDP 성장, 혁신이다.
공급망 지원
엔비디아는 강력한 성장을 뒷받침할 수 있는 전체 생태계와 공급망의 지원을 받고 있다. 전년 대비 100% 가까이 성장했음에도 여전히 공급이 부족한 상황이지만, 공급망의 지원을 통해 가이던스를 충분히 달성할 수 있는 robust한 성장을 이어갈 것이다.