DruckFin

NVIDIA 트랜스크립트: '베라 루빈(Vera Rubin)' 본격 양산 및 AI 에이전트 전용 신규 CPU 공개

NVIDIA GTC 타이베이 2026 젠슨 황 CEO 기조연설 — 2026년 6월 1일, 대만 타이베이

환영사 및 생태계 현황

젠슨 황 CEO는 대만 GTC 행사장에 열광적인 환호 속에 등장하며 기조연설을 시작했습니다. 그는 대만 전역에서 70개의 동시 런칭 파티가 열려 기조연설을 생중계로 시청하고 있다는 점을 언급하며 행사의 규모를 강조했습니다. 이어 현장에 참석한 부모님을 소개하며 박수를 유도했고, 식전 공연을 펼친 출연진에게 감사를 표했습니다.

황 CEO는 NVIDIA 생태계의 광범위함을 설명하며, 흔히 생태계라고 하면 NVIDIA의 컴퓨팅 시스템 위에 구축된 소프트웨어 스택과 개발자 커뮤니티만을 떠올리지만, 실제 NVIDIA의 생태계는 모든 것이 시작되는 대만의 공급망부터 데이터센터, 그리고 최종 사용자에 이르기까지 전 과정을 아우른다고 강조했습니다. 그는 대만 생태계를 세계 최고의 공급망 생태계라고 평가하며 깊은 감사를 전했습니다. 또한 전날 대만의 연간 GDP가 10% 가까이 성장할 것으로 예상된다는 이야기를 들었다며, 이는 믿기 어려운 성과라고 덧붙였습니다.

에이전트 AI의 도래: 소프트웨어 생산성 혁명

황 CEO는 이번 기조연설의 핵심 주제를 제시했습니다. 2년 전 그는 생성형 AI를 넘어선 다음 물결로 '에이전트 AI(Agentic AI)'를 언급했는데, 이제 그 에이전트 AI가 도래했으며 유용한 AI의 시대가 열렸다고 선언했습니다.

그는 이를 설명하기 위해 소프트웨어 코딩 분야에서 에이전트 AI를 가장 먼저 도입한 사례로 GitHub를 꼽았습니다. 전 세계 전문 소프트웨어 개발자 수는 약 3,000만~4,000만 명에 달합니다. 그는 개발자가 코드를 다운로드, 수정 및 업로드하는 횟수인 GitHub 커밋 데이터를 제시했습니다. 2023년 3억 건이었던 커밋 수는 2024년 4억 건, 2025년 5억 건으로 증가했으며, 2026년 초 몇 달 동안에는 그 수치가 거의 3배로 폭증했습니다.

황 CEO는 이를 경제적 관점에서 해석했습니다. 3,000만 명의 소프트웨어 개발자는 연봉 기준으로 약 3조 달러 규모의 GDP를 창출하며, 이는 다시 경제 전반의 성장을 견인합니다. 현재 3조 달러의 급여가 거의 3배에 달하는 산출물을 만들어내고 있으며, 이는 3조 달러의 인건비로 9조 달러의 생산성을 창출하는 효과를 의미합니다. 그는 이것이 바로 AI가 가진 잠재력이자 약속이라고 강조했습니다.

그는 AI가 일자리를 줄인다는 주장에 대해 "완전한 넌센스"라고 강하게 반박했습니다. 오히려 정반대의 현상이 일어나고 있다는 것입니다. 엔지니어 1인당 생산성이 비약적으로 높아짐에 따라 더 많은 소프트웨어 엔지니어를 채용하고 있습니다. 소프트웨어 엔지니어를 고용해 9조 달러의 생산적 가치를 창출할 수 있다면, 왜 채용을 줄이겠느냐는 논리입니다. 그는 이러한 효과가 조만간 경제 지표에 나타날 것이라고 말했습니다.

새로운 수익 단위가 된 토큰과 에이전트의 컴퓨팅 패턴

이어 황 CEO는 이러한 생산성 혁명이 컴퓨팅 수요로 연결된다고 설명했습니다. 이제 토큰은 엄청난 수요를 창출하고 있습니다. 이러한 생산성을 낼 수 있다면 더 많은 생산물을 원하기 때문입니다. 토큰은 수익을 창출하는 단위가 되었고, AI가 수익성을 입증함에 따라 기업들은 더 많은 AI 팩토리를 구축하고 더 많은 토큰을 생성하고자 합니다. 이것이 바로 대만에서 컴퓨팅 수요가 폭발하고 생태계 내 모든 기업이 호황을 누리는 이유라고 그는 설명했습니다.

그는 컴퓨팅 패턴의 근본적인 변화를 지적했습니다. 기존 모델은 애플리케이션, 그 안에서 실행되는 코드, 그리고 운영체제로 구성되었습니다. 새로운 모델은 '하니스(harness)' 내부에 위치한 대규모 언어 모델(LLM) 또는 다수의 모델로 구성된 에이전트입니다. 이 하니스는 모델이 생산적인 작업을 수행하도록 조율합니다. 입력, 이해, 관찰, 추론, 행동 및 도구 사용을 처리합니다. 도구에는 스프레드시트, 웹 브라우저, 데이터 처리 엔진, 데이터베이스 엔진 등이 포함됩니다. 에이전트는 인간과 마찬가지로 단기 작업 기억과 장기 기억을 관리합니다.

그는 특히 '도구 사용'을 큰 돌파구로 꼽았습니다. 에이전트 AI가 소프트웨어 기업을 망하게 할 것이라는 세간의 우려와 달리, 오히려 그 반대라고 강조했습니다. 수많은 에이전트가 등장하고 더 이상 인력 수에 제한받지 않는 세상이 오면, 에이전트들은 그 어느 때보다 더 많은 도구를 사용하게 될 것이기 때문입니다. 지금은 소프트웨어 기업에게 놀라운 기회의 시기이지만, 소프트웨어를 에이전트가 사용할 수 있는 방식으로 제공해야 한다고 덧붙였습니다.

CUDA-X 라이브러리: 에이전트 시대를 위한 NVIDIA의 자산

황 CEO는 NVIDIA의 1,000여 개 CUDA-X 라이브러리를 회사의 핵심 자산으로 소개했습니다. NVIDIA는 이제 이 라이브러리들을 인간보다 더 효과적으로 활용할 수 있는 에이전트들에게 제공할 수 있게 되었습니다. 이는 20년 전 가속 컴퓨팅을 위한 단일 아키텍처로 구축된 CUDA에서 시작되었습니다. 라이브러리는 전산 리소그래피를 위한 cuLitho, 의사결정 최적화를 위한 cuOpt, 직접 희소 솔버를 위한 cuDSS, 구조화 및 비구조화 문서의 심층 조사를 위한 AI-Q, AI RAN을 위한 Aerial, 미분 가능한 물리학을 위한 PhysicsNeMo, 유전체학을 위한 Parabricks 등 광범위한 분야를 포괄합니다.

그는 모든 CUDA-X 라이브러리에 '스킬(skills)'이 탑재될 것이라고 밝혔습니다. 이는 사실상 AI가 읽고 학습하여 사용하는 매뉴얼입니다. 에이전트가 이러한 라이브러리를 활용하는 능력은 엄청날 것이며, 모든 CUDA-X 라이브러리는 에이전트의 도구로 사용될 준비를 마쳤습니다.

에이전트 컴퓨팅의 분산 아키텍처

황 CEO는 에이전트 AI의 기반이 되는 분산 아키텍처를 상세히 설명했습니다. 그는 에이전트를 궁극의 분산형 컴퓨팅 모델로 정의했습니다. 단일 에이전트의 작업을 처리하기 위해 수많은 컴퓨터가 활성화되는 방식입니다. 모델, 하니스, 도구, 스킬, 런타임이 데이터센터의 각기 다른 곳에서 실행됩니다.

그는 모델을 뇌, 하니스를 신체, 도구를 작업장에서 사용하는 물건에 비유했습니다. 에이전트라는 작업자가 거대한 규모의 작업장에서 도구를 사용하는 셈입니다. 프로세스의 각 단계는 컴퓨터의 다른 부분에서 실행됩니다. LLM이 사고(문맥 처리, 추론, 계획, 행동)할 때는 Grace Blackwell NVLink 72 랙 전체가 활성화됩니다. 에이전트가 도구를 사용할 때는 CPU가 사용됩니다. 보안 하니스는 CPU와 DPU인 NVIDIA BlueField에서 실행되며, 모든 것의 오케스트레이션은 CPU가 담당합니다.

그는 메모리 시스템을 가장 어려운 부분 중 하나로 꼽았습니다. KV 캐싱이라 불리는 작업 기억은 구조화된 데이터와 비구조화된 데이터를 압축 및 검색하는 과정을 포함하며, 데이터 구조 간의 복잡한 온톨로지 관계를 다룹니다. 그는 AI의 메모리 시스템이 스토리지 시스템의 완전한 혁명을 불러올 것이라고 예견했습니다.

황 CEO는 이러한 분산형 이종 컴퓨팅 문제를 해결하기 위해 NVIDIA가 차세대 플랫폼 '베라 루빈(Vera Rubin)'을 구축했다고 밝혔습니다.

베라 루빈: 최초의 멀티 랙, 팟 스케일 AI 슈퍼컴퓨터 — 본격 양산 돌입

황 CEO는 베라 루빈을 단순한 칩이나 GPU가 아닌, 엔드 투 엔드 전체 시스템으로 정의했습니다. 여기에는 Vera Rubin NVL72 GPU, Vera CPU, 혁신적인 스토리지 시스템, ConnectX-9 네트워킹, DOCA 소프트웨어 스택, 그리고 저장 중, 이동 중, 사용 중인 모든 데이터를 암호화하는 보안 프로세서가 포함됩니다. 그는 베라 루빈이 NVIDIA 역사상 가장 야심 찬 프로젝트이며, 전사 4만 명의 엔지니어와 생태계 파트너들이 함께 노력한 결과라고 말했습니다.

그는 베라 루빈이 현재 본격적인 양산 단계에 돌입했다고 발표했습니다. 베라 루빈을 위해 구축된 공급망은 Grace Blackwell보다 두 배 더 크며, 과거 Grace Blackwell 랙 하나를 조립하는 데 2시간이 걸렸다면 이제는 5분이면 충분하다고 설명하며 대만 생태계의 공로에 감사를 표했습니다.

이어진 영상에서는 TSMC의 3나노 공정, CoWoS 패키징, 마이크론·SK하이닉스·삼성의 HBM4 메모리 등 베라 루빈의 기술적 상세가 소개되었습니다. Vera Rubin GPU는 6조 개의 트랜지스터와 1만 8,000개 이상의 부품으로 구성됩니다. Vera Rubin NVL72는 프롬프트 및 문맥 이해, 추론, 계획을 담당합니다. 시스템은 케이블이 없는 모듈형 컴퓨트 트레이와 새로운 PCB 미드플레인, ConnectX-9 SuperNIC, BlueField-4 DPU를 사용합니다. 18개의 컴퓨트 트레이와 9개의 핫스왑 가능한 NVLink 스위치 트레이가 탑재되었습니다. 새로운 고효율 액체 냉각 버스바는 전기차 20대가 급가속할 때와 맞먹는 5,000암페어 이상의 전류를 처리합니다. 총 130만 개의 부품이 이 3세대 MGX 랙을 구성합니다. 영상은 Microsoft, Dell, CoreWeave의 베라 루빈 NVL72 엔지니어링 랙 구축을 축하했습니다.

영상은 또한 모델 오케스트레이션, 메모리 관리, 도구 실행을 위해 액체 냉각 랙 하나에 256개의 CPU를 탑재한 Vera CPU 랙을 소개했습니다. Foxconn과 Quanta가 제작한 Vera LPX 랙은 16개의 트레이에 256개의 Groq LPU를 탑재하여 초저지연을 위한 초당 40페타바이트의 SRAM 대역폭을 제공합니다. NVL72가 최고의 처리량으로 토큰을 생성한다면, LPX 랙은 최저 지연 시간으로 토큰을 생성합니다. 또한 스토리지 처리 및 실리콘 보안을 위한 Vera BlueField-4 STX와 200기가비트 광통신이 통합된 세계 최초의 이더넷 스위치인 NVIDIA Spectrum-X Ethernet Photonics도 공개되었습니다. 5개의 랙 스케일 시스템으로 연결된 이 전체 시스템은 150개의 대만 공급망 파트너와 함께 구축된 AI 에이전트용 슈퍼컴퓨터로 소개되었습니다.

영상 후 실제 랙 시스템이 무대에 등장했습니다. 황 CEO는 Vera Rubin NVL72, LPX 랙, 256개의 액체 냉각 CPU가 탑재된 Vera CPU 랙, Vera BlueField 스토리지 및 보안 처리 시스템, 그리고 세계 최초의 CPO(공동 패키징 광학)인 Mellanox 네트워킹 스위치를 직접 선보였습니다. 그는 PCB 미드플레인을 통해 케이블과 호스를 제거하여 조립 시간을 획기적으로 단축하고 신뢰성을 높였다고 강조했습니다.

NVIDIA DSX: 대규모 AI 팩토리 인프라

베라 루빈에 대한 상세 설명에 앞서, 황 CEO는 AI 팩토리 인프라를 위한 'NVIDIA DSX' 프레임워크를 발표했습니다. 그는 전 세계가 인류 역사상 가장 거대한 인프라 구축인 AI 팩토리 건설에 뛰어들었다고 말했습니다. 1기가와트급 AI 팩토리 구축 비용은 기존 200억~300억 달러에서 현재 500억~600억 달러 수준이며, 곧 800억~1,000억 달러에 이를 전망입니다. 그는 엄청난 자본 비용이 투입되는 만큼, 이 팩토리들이 첫 가동부터 완벽하게 작동해야 한다고 강조했습니다.

DSX Sim은 옴니버스(Omniverse) 블루프린트를 통해 파트너들이 랙을 주문하기 전 디지털 트윈 상에서 레이아웃 계획, 전력 및 냉각 시뮬레이션, 네트워크 설계, 통합 검증을 가능하게 합니다. DSX OS는 인프라를 프로비저닝, 운영, 모니터링 및 복구합니다. DSX MaxLPS는 오늘날 AI 팩토리가 전력을 최대 40% 과잉 공급한다는 점에 착안해, 동일한 전력 예산 안에서 더 많은 GPU를 안전하게 배치할 수 있게 합니다. 45도 섭씨에서 작동하는 획기적인 액체 냉각 기술은 물과 에너지 사용량을 줄여줍니다. DSX Flex는 실시간 그리드 신호를 읽고 전력망에 여유가 필요할 때 동적으로 전력을 조절합니다. 영상은 100기가와트 규모의 AI 팩토리가 2030년 이전에 가동될 것이라고 밝혔습니다.

황 CEO는 NVIDIA가 단순한 GPU나 시스템 회사가 아닌 AI 인프라 기업으로 거듭났다고 설명했습니다. 컴퓨팅은 곧 수익이며, 와트당 성능, 빠른 팩토리 구축, 높은 처리량 유지, 신뢰성 확보, 수명 연장이 모두 수익과 직결되는 핵심 요소라는 경제적 논리입니다. 그는 시스템 전체에 걸친 극단적인 공동 설계(co-design) 덕분에 NVIDIA의 토큰 비용이 세계에서 가장 낮다고 자신했습니다.

NVIDIA Vera CPU: 사람을 위한 것이 아닌, 에이전트 전용 최초의 CPU

황 CEO는 새로운 성장 동력으로 에이전트 시대를 위해 특별히 설계된 'Vera CPU'를 소개했습니다.

그는 지금까지의 모든 CPU가 초 단위로 살아가며 클라우드에서 시간당 비용을 지불하는 '사람'을 위해 만들어졌다고 지적했습니다. 반면 에이전트는 근본적으로 다릅니다. 에이전트는 참을성이 없습니다. 그들은 나노초 단위의 세상에 살고 있습니다. 에이전트가 도구를 사용하거나 데이터베이스에 접근할 때 응답은 최대한 빨라야 합니다. 대기 시간은 에이전트의 다음 단계 진행을 가로막습니다. 또한 토큰 수익을 창출하는 고가의 GPU 인프라 옆에서 CPU가 작동하므로, 성능과 에너지 효율성이 모두 뛰어나야 합니다.

그는 Vera의 네 가지 핵심 속성을 제시했습니다. 첫째, 클럭당 명령어 처리(IPC)로, 클럭당 10개의 명령어를 가져오고 디코딩 및 실행하여 세계 최고 수준의 단일 스레드 성능과 낮은 지연 시간을 제공합니다. 둘째, 코어당 대역폭입니다. 셋째, 칩 내부 및 주변의 총 대역폭입니다. 에이전트 시스템은 분산되어 있어 데이터 이동이 핵심 문제인데, Vera는 88개의 Olympus 코어를 모놀리식 메시 상에서 초당 3.6테라바이트로 연결하는 2세대 확장형 일관성 패브릭을 갖췄습니다. PCIe Gen 6와 LPDDR5X 메모리를 최초로 채택하여 시장 최고 성능 CPU 대비 2~3배 높은 초당 1.2테라바이트의 대역폭을 제공합니다. 넷째, 에너지 효율성입니다. 토큰 생성에 필요한 전력을 뺏지 않고도 팩토리에 최대한 많은 CPU를 집약할 수 있게 합니다.

Vera CPU는 Python 런타임, 도구 호출, 샌드박스 코드 실행 등 현대적인 데이터센터 워크로드를 위해 설계되었습니다. 40% 낮은 피크 메모리 지연 시간을 달성했으며, NVLink를 통해 GPU와 CPU를 직접 연결합니다. x86 CPU 대비 1.8배의 에이전트 샌드박스 성능을 제공합니다.

무대로 돌아온 황 CEO는 벤치마크 결과를 공개했습니다. SQL 워크로드가 Vera에서 3배 빠르게 실행되었으며, 뉴욕증권거래소(NYSE)의 실시간 스트림 처리 결과는 6배 더 빨랐습니다. 그는 대만의 주요 OEM 및 ODM 업체들이 Vera를 지원하고 있으며, 에이전트용 CPU라는 새로운 시장이 열렸다고 강조했습니다. 에이전트의 수는 인간보다 훨씬 많아질 것이며, 에이전트의 조급함 때문에 이 시장은 이전보다 훨씬 커질 것이라고 확신했습니다. 그는 이미 주문이 시작되었으며 NVIDIA 역사상 가장 성공적인 제품 출시가 될 것이라고 예견했습니다.

기업용 AI를 위한 NVIDIA 에이전트 툴킷

황 CEO는 이번 기조연설의 가장 중요한 핵심으로 'NVIDIA 에이전트 툴킷(NVIDIA Agent Toolkit for Enterprise AI)'을 발표했습니다. 모든 기업이 에이전트를 운영하게 될 것이며, 안전하게 에이전트를 구축하고 운영하는 방법을 고민하고 있기 때문입니다.

툴킷은 네 가지 구성요소로 이루어집니다. 첫째, 더 스마트하고 저렴하며 빠른 모델. 둘째, 모든 것을 조율하는 하니스. 셋째, CUDA-X 라이브러리를 포함한 스킬을 갖춘 도구. 넷째, 이를 하나로 묶는 운영체제인 'OpenShell'입니다. OpenShell은 기업용으로 설계된 보안 하니스로, 에이전트를 보호하고 보안 정책을 준수하며 개인정보와 권한, 신원을 관리합니다. 오픈소스로 제공되며 Red Hat, Canonical, Microsoft 등이 도입했습니다. 툴킷에는 OpenClaw, Hermes와 같은 오픈 에이전트 하니스도 포함됩니다.

그는 Cadence와의 파트너십을 통해 구축한 '칩 설계 슈퍼 에이전트'를 시연했습니다. Nemotron 기반의 에이전트가 RTL 생성, 테스트 벤치 작성, 회귀 테스트 및 디버깅을 처리하는 모습이 공개되었습니다. 과거 팀 단위로 수주가 걸리던 작업을 이제는 단 몇 시간 만에 수행하며, 검증 주기가 40배 이상 빨라졌습니다. 황 CEO는 NVIDIA의 칩 디자이너들과 함께 수십만 개의 Cadence 슈퍼 에이전트가 협업하여 개발 속도를 가속화할 것이라고 밝혔습니다.

또한 상태 공간 모델(SSM)과 전문가 혼합(MoE) 하이브리드 아키텍처를 기반으로 한 세계 최초의 모델 'Nemotron 3 Ultra'를 공개했습니다. 기존 최고 모델 대비 5배 빠르고 30% 저렴하며, 이전 모델과 마찬가지로 학습 데이터와 스크립트까지 모두 공개하여 누구나 활용할 수 있게 했습니다. 현재 Nemotron 4를 개발 중이라고 덧붙였습니다. Cadence, CrowdStrike, ServiceNow, Palantir, SAP 등 파트너사들과 함께 에이전트가 기업 소프트웨어 시장의 가장 큰 기회가 될 것이라고 강조했습니다.

PC의 재발명: RTX Spark, Windows 머신, DGX Station

황 CEO는 PC의 40년 역사를 언급하며, Microsoft와 NVIDIA가 에이전트 시대를 위해 PC를 재발명했다고 선언했습니다. 그 결과물인 'RTX Spark'는 NVIDIA의 33년 노하우가 집약된 칩입니다. Blackwell RTX GPU, 6,144개의 텐서 코어, 1페타플롭의 AI 성능, MediaTek과 공동 설계한 20코어 Grace CPU, NVLink 퓨전, 128GB 통합 메모리, 3나노 공정, 700억 개의 트랜지스터를 탑재했습니다. 그는 디지털 생물학부터 컴퓨터 그래픽까지 NVIDIA의 모든 소프트웨어와 Windows의 모든 애플리케이션이 실행된다고 밝혔습니다.

시연 영상에서는 로컬에서 실행되는 에이전트가 Rhino와 Blender를 활용해 3D 모델링부터 렌더링까지 집 설계 과정을 자동화하는 모습이 담겼습니다. Adobe 또한 Photoshop과 Premiere의 핵심을 RTX Spark에 맞춰 재설계하여 속도를 2배 높이고 에이전트와 상호작용이 가능하도록 최적화했습니다.

그는 데스크톱, 노트북, 워크스테이션을 아우르는 새로운 Windows PC 라인업을 발표했습니다. MSI 데스크톱 버전의 RTX Spark는 사용자의 가전, 카메라, 보안 시스템과 연결되어 24시간 내내 사용자를 돕는 개인용 AI 에이전트로 작동합니다. 또한 768GB 메모리, 20페타플롭 성능을 갖춰 1조 개의 파라미터를 가진 모델을 로컬에서 실행할 수 있는 'DGX Station'도 공개했습니다.

황 CEO는 20년 전 휴대폰이 전화기였지만 지금은 스마트폰이 된 것처럼, 10년 후의 PC는 완전히 달라질 것이라고 확신했습니다. 미래의 가정에는 모든 에이전트와 어시스턴트를 24시간 가동하는 AI 슈퍼컴퓨터가 한 대씩 있을 것이며, 이는 전통적인 PC보다는 R2-D2나 C-3PO 같은 존재가 될 것이라고 말했습니다.

물리 AI: Cosmos 3, 자율주행, 휴머노이드 로보틱스

황 CEO는 디지털 로봇인 에이전트 AI가 물리적 시스템으로 확장되는 '물리 AI(Physical AI)'를 언급했습니다. 그는 로봇 학습 데이터가 인간의 관점이 아닌 로봇의 관점에서 생성되어야 한다는 점을 지적하며, teleoperation(원격 조작)부터 시뮬레이션 학습, 그리고 물리 세계를 이해하는 '월드 파운데이션 모델'로 이어지는 발전 단계를 제시했습니다.

그는 물리 AI의 최전선인 'Cosmos 3'를 발표했습니다. 팩토리 로봇 등 물리 세계에서 작동하는 모든 로봇을 위한 파운데이션 모델입니다. Mixture of Transformers 아키텍처 기반의 Cosmos는 픽셀, 동작, 소리, 언어를 입력받아 추론하고 계획하며, 물리적으로 정확한 합성 비디오를 생성하는 시뮬레이터 역할을 합니다. 모델, 데이터, 학습 방법론은 모두 공개됩니다.

또한 자율주행을 위한 오픈 모델 'Alpamayo 2 Super'를 발표했습니다. 세계 최초의 추론형 자율주행차 모델로, 전 세계 자동차 제조사의 80%가 NVIDIA DRIVE Hyperion을 사용 중입니다. 시연 영상에서는 Mercedes 차량이 도시 환경에서 보행자, 표지판, 차선 변경 등을 처리하며 실시간으로 자신의 추론 과정을 설명하는 모습이 공개되었습니다.

마지막으로 휴머노이드 로보틱스 플랫폼인 'NVIDIA Isaac GR00T'를 소개했습니다. 6피트(약 183cm) 키에 150파운드(약 68kg) 무게의 휴머노이드 로봇은 Jetson Thor 플랫폼에서 구동됩니다. 대학 연구자들을 위해 Isaac Lab, Isaac Teleoperation, Omniverse, Cosmos 등 전체 워크플로우를 모듈형으로 공개했습니다.

맺음말

황 CEO는 이번 발표를 요약하며 베라 루빈의 본격 양산, NVIDIA의 AI 인프라 기업으로의 전환, 에이전트 전용 Vera CPU의 혁신성, 그리고 새로운 PC 라인업을 재확인했습니다. 그는 에이전트 컴퓨팅 패턴이 클라우드, 기업, PC, 로봇, 위성, 공장 전반에 걸쳐 확산될 것이라고 강조했습니다. 그는 대만 생태계의 파트너십에 깊은 감사를 표하며 Computex 2026의 시작을 알렸습니다.

NVIDIA 심층 분석

컴퓨팅의 아키텍처

NVIDIA는 단순한 그래픽 처리 장치(GPU) 공급업체에서 지능형 시대의 '풀스택(full-stack) 설계자'로 완벽하게 변모했다. 이 회사의 비즈니스 모델은 인공지능(AI), 고성능 컴퓨팅(HPC), 첨단 데이터 시각화를 구동하는 가속 컴퓨팅 플랫폼을 설계하고 수익화하는 데 핵심을 두고 있다. NVIDIA는 단순히 범용 반도체를 판매하는 것이 아니라, 완전히 통합된 인프라를 제공한다. 이 생태계는 GPU와 중앙처리장치(CPU)를 포함한 기반 컴퓨팅 하드웨어는 물론, InfiniBand와 이더넷 스위치와 같은 핵심 데이터 센터 네트워킹 장비까지 아우른다. 이러한 하드웨어 계층은 광범위하고 독점적인 소프트웨어 스택으로 강력하게 보호받고 있으며, 이를 통해 회사는 데이터 센터 아키텍처 전반에서 가치를 창출한다.

이러한 풀스택 전략의 재무적 성과는 경이로운 수준이다. 2027 회계연도 1분기, NVIDIA는 전년 동기 대비 85% 성장한 816억 달러의 총매출을 기록했다. 데이터 센터 부문은 같은 분기에 752억 달러의 매출을 올리며 기존의 게임 사업부를 완전히 압도했다. 특히 NVIDIA는 네트워킹을 단순한 부가 기능에서 독립적인 핵심 사업 기둥으로 성공적으로 전환했다. Spectrum-X 이더넷과 NVLink 인터커넥트 도입에 힘입어 데이터 센터 네트워킹 매출만 해당 분기에 148억 달러를 기록했다. 나아가 NVIDIA는 GPU당 연간 약 4,500달러의 수익을 창출하는 'NVIDIA AI Enterprise'를 통해 반복적인 소프트웨어 매출을 체계적으로 확대하며, 하드웨어 설치 기반 위에 고마진 구독 경제 모델을 구축하고 있다. 이러한 운영 레버리지는 74.9%의 매출총이익률과 단일 분기 486억 달러의 잉여현금흐름(FCF) 창출이라는 수익성 지표로 고스란히 나타난다.

생태계: 고객, 공급업체, 그리고 경쟁사

NVIDIA의 고객 기반은 글로벌 AI 확장의 두 가지 엔진을 반영한다. 현재 데이터 센터 부문의 매출 비중은 완벽한 균형을 이루고 있다. 마이크로소프트, 알파벳, 아마존, 메타 등 하이퍼스케일 클라우드 서비스 제공업체(CSP)에서 발생하는 수요가 약 50%이며, 나머지 50%는 국가별 AI 이니셔티브, 기업용 데이터 센터, 산업용 애플리케이션 전반에 걸쳐 분산되어 있다. 이러한 다변화는 가속 컴퓨팅 수요가 소수의 클라우드 인프라 거대 기업을 넘어 성공적으로 확장되었음을 입증하는 중요한 리스크 완화 요인이다.

공급 측면에서 NVIDIA의 주요 취약점과 제약은 여전히 TSMC(Taiwan Semiconductor Manufacturing Company)와 구조적으로 연결되어 있다. 다중 칩 시스템의 물리적 복잡성으로 인해 회사는 TSMC의 CoWoS 첨단 패키징 용량에 크게 의존하고 있다. 2026년 말까지 월간 총 CoWoS 생산 능력은 12만~13만 웨이퍼에 이를 것으로 예상되며, 이 중 NVIDIA가 60%라는 압도적인 점유율을 차지한다. 또한, SK하이닉스 및 마이크론과 같은 메모리 공급업체에 핵심 HBM(고대역폭 메모리) 모듈을 크게 의존하고 있어, 단 하나의 병목 현상으로도 즉각 매출이 타격을 입을 수 있는 복잡하고 다층적인 공급망을 형성하고 있다.

경쟁 구도는 범용 반도체 라이벌과 하이퍼스케일러의 자체 엔지니어링이라는 두 가지 축으로 심화되고 있다. AMD는 MI350 및 차기 MI400 시리즈 아키텍처를 출시하며 가장 눈에 띄는 범용 반도체 경쟁자로 남아 있다. 그러나 훨씬 더 실존적인 위협은 NVIDIA의 최대 고객사들로부터 온다. 알파벳의 독자적인 TPU v6e Trillium 및 TPU v7 Ironwood 도입과 아마존의 Trainium 2는 NVIDIA의 마진을 우회하기 위한 신뢰할 수 있고 막대한 자본이 투입된 노력들이다. 클라우드 제공업체들이 총소유비용(TCO)을 최적화하고 특정 공급업체에 대한 절대적 의존도를 줄이려 함에 따라, 자체 실리콘 프로그램에는 사실상 무제한의 자본이 투입되고 있다.

시장 점유율과 CUDA의 요새

경쟁 심화에도 불구하고, 2026년 데이터 센터 가속기 시장 분석에 따르면 NVIDIA는 매출 기준 전 세계 시장 점유율 약 80%를 유지하고 있다. AMD의 Instinct 포트폴리오는 견고하지만 미미한 입지를 구축하며 시장의 약 5~7%를 점유하고 있다. 이러한 지속적인 시장 지배력은 단순히 산술적인 처리량 때문만이 아니라, NVIDIA의 CUDA(Compute Unified Device Architecture) 소프트웨어 플랫폼에 의해 강력하게 보호받고 있다. 지난 20년 가까이 이 생태계는 병렬 컴퓨팅 및 AI 개발의 결정적인 '링구아 프랑카(공용어)'가 되었다.

경쟁사들은 메모리 대역폭이나 초당 테라플롭스(TFLOPS)와 같은 하드웨어 사양에서 NVIDIA와 대등하거나 이론적으로 능가할 수 있다. 그러나 NVIDIA를 대체하려면 기업 개발자들이 매우 성숙하고 문서화가 잘 된 소프트웨어 생태계를 버리고 초기 단계의 대안을 선택하도록 설득해야 한다. 더욱이 시장 점유율은 네트워킹 지배력에 의해 더욱 공고해지고 있다. AI 모델이 수조 개의 파라미터 규모로 확장됨에 따라, 이를 학습시키기 위해서는 수만 개의 프로세서를 완벽하게 동기화해야 한다. 처리 장치, 스위치, DPU를 매끄럽게 통합하여 랙(rack) 단위의 전체 아키텍처를 판매하는 NVIDIA의 능력은 파편화된 경쟁사들이 복제하기 어려운 통합 성능 표준을 창출한다. 이러한 깊은 구조적 고착화는 진입 장벽을 극도로 높게 유지한다.

세대별 전망: Blackwell과 Rubin

하드웨어 제품 주기는 향후 매출 가속화의 핵심 촉매제다. Hopper 아키텍처가 생성형 컴퓨팅 붐의 토대를 마련했다면, 현재는 Blackwell 세대의 본격적인 양산이 2026년 초 인프라 구축을 주도하고 있다. 그러나 NVIDIA는 이미 2026년 하반기 클라우드 대규모 도입이 예정된 'Vera Rubin' 플랫폼을 통해 다음 세대 교체를 준비했다. Rubin 제품군은 심오한 아키텍처적 도약을 상징한다.

Rubin 플랫폼의 핵심인 R100 유닛은 3nm 공정을 활용하며 이전 세대보다 대폭 확장된 3,360억 개의 트랜지스터를 통합한다. 이는 업계를 차세대 HBM4 메모리로 전환시키며, 칩당 288GB의 메모리 용량과 50 PFLOPS의 FP4 연산 능력을 제공한다. 더욱 중요한 점은 Rubin 세대가 NVIDIA의 독자적인 Vera CPU를 데이터 센터로 적극적으로 밀어 넣고 있다는 것이다. 핵심 가속기와 ARM 기반 프로세서를 결합함으로써 NVIDIA는 범용 서버 시장을 직접 공략하며 2,000억 달러 규모의 새로운 전체 시장(TAM)을 열고 있다. 경영진은 Rubin 플랫폼이 규모의 경제에서 추론 토큰 비용을 최대 10배 절감하여, 도입의 단위 경제성을 완전히 재설정하고 업계의 강제적인 업그레이드 주기를 유도할 것이라고 주장한다.

산업 역학 및 파괴적 신규 진입자

데이터 센터 인프라 시장은 범용 컴퓨팅 중심의 자본 지출에서 특화된 '지능형 공장'으로 구조적으로 변화했다. 주요 기회는 에이전트 프레임워크와 로컬 엣지 컴퓨팅의 확산에 있다. 실시간 음성, 영상, 자율 추론이 가능한 애플리케이션으로 인해 추론 수요가 기하급수적으로 증가함에 따라, 로컬 컴퓨팅 인스턴스에 대한 요구가 전통적인 하이퍼스케일 시설을 넘어 전체 시장을 확대하고 있다. 또한, 국가들이 로컬 인프라 구축을 위해 수십억 달러를 투자하는 '소버린 AI(Sovereign AI)'의 등장은 매우 지속적이고 상관관계가 낮은 새로운 수요층을 형성하고 있다.

반면, 업계는 심각한 물리적 및 열역학적 제약에 직면해 있다. 지속적인 배포에 대한 가장 큰 위협은 자본의 가용성이 아니라 전력과 열 밀도다. 경쟁의 척도는 절대 성능에서 '메가와트당 토큰(tokens per megawatt)'으로 빠르게 이동하고 있다. 이러한 역학 관계는 저전력, 고처리량 추론 워크로드를 겨냥한 파괴적인 신규 진입자들에게 기회의 창을 열어주고 있다. Cerebras와 Groq 같은 기업들은 투기적인 벤처 단계를 넘어 독특한 웨이퍼 스케일 통합 및 로컬 SRAM 아키텍처를 활용해 고대역폭 메모리 병목 현상을 완전히 우회하며 의미 있는 상업적 계약을 확보하고 있다. 이들이 거대 모델 학습 분야에서 NVIDIA의 철옹성을 위협하지는 못하더라도, 향후 추론 매출 풀에 대해서는 신뢰할 수 있고 매우 구체적인 위협이 되고 있다.

경영진의 성과

젠슨 황(Jensen Huang)의 리더십 아래 경영진은 기술 예측과 공급망 실행에서 타의 추종을 불허하는 기록을 보여주었다. 지난 3년간 경영진은 가속 컴퓨팅으로의 아키텍처 전환을 정확히 포착했고, 시장이 임박한 수요의 규모를 이해하기 훨씬 전부터 선제적으로 웨이퍼 생산 능력을 확보했다. 수십억 달러 규모의 취소 불가능한 구매 의무를 감수하려는 이러한 의지는 NVIDIA가 인프라 붐의 초기 단계를 사실상 독점할 수 있게 했다.

경영진의 자본 배분 체계는 영업현금흐름과 함께 성숙해졌다. 과거에는 변동성이 큰 성장주로 간주되었으나, NVIDIA는 이제 구조적인 현금 환원 기업으로 빠르게 변모했다. 2027 회계연도 1분기에만 회사는 약 200억 달러의 주주 환원을 실행했고, 분기 배당금을 25배 인상했으며, 800억 달러 규모의 추가 자사주 매입 프로그램을 승인했다. Hopper 아키텍처에서 Blackwell로, 그리고 Rubin으로 이어지는 전환 과정에서 당분기 매출 잠식이나 치명적인 재고 상각 없이 관리해 낸 운영 정밀도는 산업적 역량의 정점에 서 있는 경영진의 면모를 보여준다.

종합 평가

NVIDIA는 타의 추종을 불허하는 하드웨어 엔지니어링과 깊게 뿌리 내린 소프트웨어 해자(moat)를 결합하여 현대 컴퓨팅 시대의 결정적인 인프라 제공업체로 자리매김했다. 816억 달러의 분기 매출과 74.9%의 독보적인 매출총이익률로 증명된 재무적 실행력은 이 비즈니스 모델이 기존 반도체 산업의 경기 순환으로부터 완전히 자유로워졌음을 보여준다. 풀 랙 스케일 시스템, 독점 네트워킹 장비, 그리고 곧 출시될 Vera Rubin 플랫폼을 통한 CPU 시장 진출이라는 전략적 확장은 중기적으로 전 세계 데이터 센터 자본 지출의 더 큰 비중을 NVIDIA가 가져갈 것임을 사실상 보장한다.

절대 독점에서 지배적인 시장 리더로의 전환은 이미 완전히 진행 중이다. 하이퍼스케일러의 자체 실리콘 성숙과 직접적인 범용 반도체 경쟁사 및 특화된 추론 아키텍처를 겨냥한 신규 진입자들의 지속적인 하드웨어 혁신은 필연적으로 회사의 과거 마진율을 압박할 것이다. 물리적 패키징 제약과 업계 전반의 전력 병목 현상이 단기적인 물량 확대를 제한하고는 있지만, 회사의 가격 결정력과 생태계 고착력은 여전히 절대적이다. 클라우드와 기업 간의 균형 잡힌 매출 비중과 소프트웨어 정의 생태계로의 선제적 변신을 바탕으로, 핵심 비즈니스 모델은 심오한 구조적 내구성을 유지하고 있다.

면책 조항: 본 기사는 정보 제공의 목적으로만 작성되었으며, 투자 조언이나 유가증권의 매수, 매도, 보유를 권장하는 내용이 아닙니다. 당사의 애널리스트는 기업 이벤트에 대해 자세한 내용을 다루지만 실수가 있을 수 있으므로 항상 본인의 판단 하에 실사(Due Diligence)를 수행하시기 바랍니다. 표현된 견해와 의견은 DruckFin의 입장과 반드시 일치하는 것은 아닙니다. 본문에 사용된 모든 정보를 독립적으로 검증하지 않았으며, 오류나 누락이 포함될 수 있습니다. 투자 결정을 내리기 전에 자격을 갖춘 재무 고문과 상담하십시오. DruckFin 및 그 계열사는 본 콘텐츠를 신뢰하여 발생하는 어떠한 손실에 대해서도 책임을 지지 않습니다. 전체 약관은 당사의 이용약관을 참조하십시오.