Intel Computex 2026: 에이전트 AI가 GPU/CPU 비율을 뒤집다 — Intel이 증명한 랙 솔루션
6월 2일 Computex에서 열린 립부 탄(Lip-Bu Tan)의 기조연설은 에이전트 AI가 데이터 센터 실리콘 수요를 Intel에 유리한 방향으로 구조적으로 재편하고 있음을 보여주는 가장 명확한 신호탄이 되었다
더 이상 조연이 아닌 CPU
Intel의 Computex 2026 기조연설에서 얻을 수 있는 가장 중요한 메시지는 신제품 출시가 아니다. 그것은 데이터 센터 구축 방식을 지배하는 컴퓨팅 비율의 근본적인 변화다. 수년간 GPU는 AI 인프라 경제를 지배해 왔으며, CPU는 단순히 그 주변의 트래픽을 조정하는 역할에 그쳤다. Intel은 화요일 라이브 시연을 통해 단순히 프롬프트에 응답하는 것을 넘어 계획, 실행, 반복하고 하위 에이전트를 생성하는 '에이전트 AI'가 이러한 비율을 거의 완전히 뒤집는다는 점을 입증했다.
기존 AI 추론 파이프라인에서 CPU 대 GPU의 작업 부하 비율은 대략 7대 1로 GPU가 압도적이다. 하지만 Intel의 Xeon 6 프로세서를 사용한 실시간 시연에서 에이전트 시스템은 이 비율이 거의 대등한 수준으로 바뀌며 오히려 CPU 중심적으로 기울었다. Intel의 데이터 센터 임원은 무대에서 "에이전트 AI는 작동 과정에서 도구를 사용하고, 파일을 읽고 쓰며, 규칙을 확인합니다. 각 단계마다 필요한 기본 컴퓨팅 요구 사항이 매우 다릅니다"라고 설명했다. 이어 "이것이 CPU 수요가 급증하는 주된 이유입니다. 에이전트 AI의 시대에는 CPU가 주도권을 쥡니다"라고 강조했다.
상업적 해석은 명확하다. 에이전트 AI가 지배적인 추론 패러다임이 된다면(기업들의 AI 도입 추세로 볼 때 이는 확실시된다), GPU 중심 아키텍처에 과도하게 치중된 현재의 인프라 구축 방식은 CPU의 가치를 심각하게 저평가하고 있는 셈이다. 프로세서당 288개의 코어와 576MB의 L3 캐시를 탑재한 Xeon 6+를 앞세운 Intel은 이러한 재조정 국면을 선점할 위치에 있다. Intel은 Xeon 6+ 효율 코어 기반의 랙 하나가 32유닛의 컴퓨팅 공간에서 최대 15만 개의 에이전트를 구동할 수 있다고 밝혔다. 이는 독립적인 검증이 필요하겠지만, 에이전트 인프라 비용을 평가하는 CIO들에게는 중요한 이정표가 될 전망이다.
SambaNova 시연으로 구체화된 이종 컴퓨팅(Heterogeneous Computing)
기조연설에서 가장 기술적으로 날카로웠던 순간은 SambaNova의 CEO 로드리고 리앙(Rodrigo Liang)과 함께 진행한 라이브 시연이었다. 이들은 SambaNova의 재구성 가능한 데이터 흐름 장치(RDU)와 Intel Xeon CPU, Nvidia GPU를 동시에 사용하는 분산형 추론(disaggregated inference)을 선보였다. 이 아키텍처는 각 칩의 특성에 맞춰 역할을 배분한다. Xeon 프로세서는 도구 실행을, SambaNova RDU는 토큰 디코딩 및 생성을, GPU는 프롬프트 캐싱 및 프리필(prefill) 작업을 담당한다.
리앙 CEO는 "세 가지 칩이 함께 작동하면 엔드투엔드 지연 시간이 획기적으로 줄어듭니다. 에이전트에게는 속도가 생명입니다"라고 말했다. 또한 Artificial Analysis의 독립적인 테스트 결과, 이 분산형 스택이 동일한 모델과 프롬프트에서 GPU만 사용했을 때보다 2~3배 더 빨랐다고 덧붙였다. 올해 초 발표된 다년간의 협력 파트너십은 이제 물리적 제품으로 결실을 맺고 있다. 에이전트 작업 부하를 위해 설계된 랙 규모의 AI 인프라 시스템 'SambaNova Summer'는 올해 말 고객들에게 인도될 예정이다.
탄과 함께 무대에 오른 Vista Equity의 로버트 스미스(Robert Smith)는 수요 측면에서 힘을 실어주었다. Vista는 90개 이상의 포트폴리오 기업을 보유하고 있으며, 그중 절반 이상이 이미 에이전트 솔루션으로 전환했다. 이들은 약 7억 5,000만 명의 사용자를 서비스하며 스미스의 추산으로 100억 개 이상의 에이전트를 생성하고 있다. Vista는 분산형 추론을 위한 세계 최초의 상용 아키텍처인 'Vector Core Compute'를 출시했으며, 기존 데이터 센터를 추론 전용 데이터 센터로 전환하기 위해 미국 내 50곳 이상의 배치를 계획 중이다. 스미스는 "ForwardTogether AI가 첫 번째 상용 고객이며, 이 아키텍처를 서비스형으로 활용해 추론 작업 속도를 높이게 되어 기대가 크다"고 밝혔다.
Intel, 커스텀 실리콘 시장 공식 진출
이번 기조연설에서 전략적으로 가장 저평가된 발표는 Intel의 맞춤형 실리콘 시장 공식 진출일 것이다. 이는 그동안 Broadcom, Marvell 및 하이퍼스케일러들의 내부 실리콘 팀이 독점해 온 ASIC 및 커스텀 칩 시장을 의미한다.
Intel의 커스텀 실리콘 부문 리더는 두 곳의 대형 고객사 확보 사실을 공개했다. 첫째, Google과 협력하여 인프라 처리 장치(IPU)를 설계 및 배포했으며, 이는 로드맵 단계가 아닌 이미 생산 단계에 진입했다. 둘째, Ericsson이 자사의 글로벌 통신 네트워크 비즈니스를 위한 차세대 인프라 실리콘 공급업체로 Intel을 선정했다. 해당 임원은 "커스텀 실리콘이 핵심인 이곳 타이베이, Computex에서 Intel이 이 시장에 공식 진출했음을 알리는 것보다 더 좋은 자리는 없을 것"이라고 말했다.
탄은 바이오메디컬 엔지니어링, 산업 자동화, 에너지 등 다양한 산업 분야의 "선도 기업 및 가장 역동적인 스타트업"과 커스텀 실리콘을 구축하겠다는 야심을 명확히 했다. 주요 파트너십으로는 UCSF 신경외과 전문의이자 ACCO Neuro Technologies 공동 창업자인 에디 창(Eddie Chang)과 협력한 뇌 훈련 알고리즘 기반 음성 스트리밍, 스탠퍼드 심장학자 조셉 우(Joseph Wu)의 Greenstone Biosciences와 협력한 신약 개발용 AI 컴퓨팅, 지멘스(Siemens)의 설계부터 제조 및 제품 내 칩 적용 확대, 히타치(Hitachi)의 파운드리 툴 및 양자 컴퓨팅 시스템 등이 언급되었다.
Foxconn 랙 규모 파트너십과 오픈 표준 추진
Intel은 글로벌 하드웨어 공급망에서 가장 중요한 관계 중 하나인 Foxconn과 랙 규모 개발 파트너십을 체결했다고 발표했다. 양사는 다양한 AI 작업 부하를 위한 이종 아키텍처에 중점을 두고 차별화된 랙 규모 AI 인프라 솔루션을 공동 개발, 통합 및 상용화할 예정이다. 이번 파트너십은 특정 업체에 종속되는 것을 방지하기 위해 오픈 표준 기반의 참조 아키텍처를 구축하려는 Intel의 '랙 규모 청사진(rack-scale blueprint)' 이니셔티브를 확장하는 것이다.
이날 두 가지 참조 청사진이 공개되었다. 하나는 Xeon 6 성능 코어를 사용한 에이전트 성능 최적화 모델이고, 다른 하나는 Xeon 6 효율 코어를 사용한 에이전트 밀도 최적화 모델이다. 오픈 표준을 내세운 것은 GPU 중심의 AI 인프라 비용과 특정 업체에 대한 의존도에 우려를 표하는 기업 고객들을 겨냥한 전략적 경쟁 신호다.
Perplexity 파트너십, 온디바이스 AI의 새로운 지평
클라이언트 측면에서는 Perplexity의 공동 창업자이자 CEO인 아라빈드 스리니바스(Aravind Srinivas)가 Intel의 AT&A 공정 기술로 제작된 첫 제품인 'Core Ultra Series 3'에서 하이브리드 에이전트 추론을 시연했다. 시연 사례는 사모펀드 애널리스트가 기밀 LBO(차입매수) 분석을 수행하는 상황이었다. 민감한 딜룸 문서, NDA, 재무 모델은 장치 내에서 로컬로 처리되고, 민감하지 않은 연구 질의는 클라우드 모델로 라우팅된다. 스리니바스는 "로컬 모델이 어떤 작업이 매우 중요해서 서버로 보내지 말아야 할지 결정한다. 파일을 읽고 무엇이 민감한 정보인지 분류한다"고 설명했다.
그는 "하이브리드 에이전트 추론은 사용자당 와트당 토큰 가치를 극대화하는 방법"이라고 말했다. 이 아키텍처는 두 회사가 공감하는 상업적 현실을 반영한다. 즉, 개인정보 보호가 중요한 기업 워크플로우는 클라우드 추론으로 완전히 대체될 수 없으며, 온디바이스 모델의 성능이 향상됨에 따라 엣지에서의 추론 경제성도 개선될 것이라는 점이다. Intel의 AT&A 플랫폼은 현재 소비자 및 상업용 부문에서 300개 이상의 디자인에 적용되었으며, 4월에 출시된 Core Series 3 메인스트림 변형 제품이 이미 70개 이상의 디자인을 확보하면서 전체 라인업은 400개에 육박하고 있다.
Xeon 6+와 데이터 센터 효율성
Intel은 Computex에서 Xeon 6 제품군의 효율 코어 버전인 'Xeon 6+' 프로세서를 공개했다. 288개의 코어와 576MB의 L3 캐시를 탑재한 이 제품은 클라우드 및 네트워크 인프라를 위한 컴퓨팅 밀도와 전력 효율성을 강조한다. 이는 데이터 센터 운영자들이 직면한 전력 및 공간 제약 속에서 더 컴팩트한 서버 및 랙 구성을 가능하게 한다. 무대에서 발표된 전망에 따르면, 기초 데이터 센터 수요는 2030년까지 80GW에서 100GW로 증가할 것이며, AI 추론 작업이 전체 데이터 센터 전력 수요의 40%를 차지할 것으로 예상된다.
Xeon 6+는 이미 출시된 성능 코어 변형 제품과 함께 에이전트 파이프라인의 다양한 컴퓨팅 요구에 대응하는 Intel의 이원화된 전략을 보여준다. 2030년까지 설치되는 서버 10대 중 8대가 x86 기반일 것이라는 Intel의 주장은 Ampere, AWS Graviton 등 Arm 기반 대안들이 시장 점유율을 잠식하는 상황에서 아키텍처의 지속 가능성에 대한 자신감을 드러낸 것이다.
실행력에 대한 신뢰, 여전히 남은 과제
탄이 구축하고 있는 에이전트 AI, 이종 컴퓨팅, 커스텀 실리콘을 아우르는 지적 프레임워크는 논리적이며, 시장이 Intel의 예측대로 흘러간다면 회사 입장에서 매우 유리한 고지를 점할 수 있다. 하지만 Intel이 아직 해결하지 못한, 그리고 탄이 간접적으로 인정한 문제는 바로 '실행력에 대한 신뢰'다. 그는 "실행력은 항상 내 우선순위 목록의 최상단에 있었다"며, 여러 제품의 AT&A 대량 생산 체제 전환과 고급 패키징 이정표 달성이 취임 14개월 만에 이룬 실질적인 진전이라고 강조했다. 그러나 Intel의 과거 제조 지연, 파운드리 고객 이탈, 클라이언트 및 데이터 센터 시장 점유율 하락의 역사는 아키텍처에 대한 논리와 실제 매출 성과 사이의 간극이 여전히 넓음을 시사한다. 투자자들은 장기 추정치를 대폭 상향 조정하기 전에 단순한 시연이나 파트너십 발표 이상의 성과를 요구할 것이다.
Computex 2026이 증명한 것은 탄이 이끄는 Intel이 수년 만에 가장 명확하고 차별화된 전략적 서사를 갖게 되었다는 점이다. 에이전트 AI 컴퓨팅 비율 논리는 단순한 마케팅이 아니라 구조적으로 방어 가능한 테제다. Intel이 파악한 기회를 포착하기 위해 필요한 물량과 속도로 제조, 패키징 및 출하를 해낼 수 있을지는 별개의 더 어려운 문제다. 그 질문에 대한 답이 이번 기조연설이 변곡점이 될지, 아니면 긴 회복 과정의 또 다른 데이터 포인트에 머물지를 결정할 것이다.