DruckFin

Nebius: 추론, 에이전트, 그리고 마진을 위해 설계된 '네오클라우드' — 단순한 전력 공급 그 이상

뱅크오브아메리카(BofA) 2026 글로벌 기술 컨퍼런스, 2026년 6월 3일

Nebius Group의 최고비즈니스책임자(CBO) 로만 체르닌(Roman Chernin)은 뱅크오브아메리카의 2026 글로벌 기술 컨퍼런스에서 애널리스트 탈 리아니(Tal Liani)와 대담을 나누며, AI 인프라 시장이 단순 컴퓨팅에서 추론(inference) 및 에이전트 기반 워크로드로 진화함에 따라 Nebius가 왜 하이퍼스케일러와 여타 네오클라우드 기업들을 압도할 구조적 위치에 있는지 설명했다. 이번 대담에서는 투자자들에게 중요한 두 가지 새로운 통찰이 제시되었다. 첫째는 Nebius의 소프트웨어 스택이 어떻게 고객 기반을 확대하고 마진을 견인하는지에 대한 명확한 논리이며, 둘째는 최근 인수한 Eigen과 Clarifai가 시장에서 가장 강력한 추론용 엔지니어링 팀을 구축하기 위한 전략적 포석이라는 점이다.

'사막에서 물을 파는 것'이 아닌 '배관 시스템'을 파는 전략

리아니는 현재의 AI 인프라 붐을 "데이터 센터 용량을 파는 것은 뜨거운 사막에서 물을 파는 것과 같다"고 직설적으로 표현하며 대담을 시작했다. 이에 대한 체르닌의 반박은 전략적으로 매우 중요했다. "우리는 데이터 센터 용량을 파는 것이 아닙니다. 그 위에 구축된 제품을 파는 것이죠." 이러한 구분은 단순한 마케팅 용어가 아니라, Nebius가 서로 다른 추상화 수준에서 AI 인프라를 소비하는 고객 유형에 맞춰 설계한 의도적이고 계층화된 시장 진입 전략을 반영한다.

기반 계층에는 대규모 베어메탈 컴퓨팅을 원하는 하이퍼스케일러와 대형 프론티어 AI 연구소들이 있다. 그 위에는 체르닌이 'AI 네이티브 연구소(AI-Native Labs)' 또는 '네오랩(Neolabs)'이라 부르는 수백, 수천 개의 연구 중심 조직들이 있다. 이들은 자체적인 소프트웨어 스택을 운영하지 않고도 학습 작업에 집중할 수 있도록 관리형 인프라를 원한다. Nebius는 '멀티 테넌트 클라우드'를 통해 이들을 지원한다. 그 다음 계층은 코딩 분야의 Cursor, 법률 분야의 Harvey나 Legora, 콘텐츠 분야의 Gamma, CRM 분야의 Clay와 같이 수직적 AI 제품을 만드는 기업들이다. 이들에게 GPU 시간은 중요하지 않다. 이들은 모델을 서비스(MaaS) 형태로 소비하며, Nebius는 이들을 위해 'Nebius Token Factory'라는 관리형 추론 플랫폼을 구축했다. 그 너머에는 개발자들이 모델을 선택하거나 토큰 가격을 비교하지 않고 에이전트 실행의 결과물만 구매하는 '에이전트 계층'이 부상하고 있다.

체르닌은 "우리의 제품 전략은 그 지점에서 고객을 만나는 것"이라며, 특정 추상화 계층에 안주하지 않고 AI 소비의 각 물결을 따라가는 철학을 설명했다. 상업적 논리는 간단하다. 스택의 계층을 올라갈수록 Nebius가 서비스를 제공할 수 있는 범위는 소수의 하이퍼스케일러에서 수천, 나아가 수십만 명의 개발자와 빌더들로 확장된다.

이미 실적으로 증명되는 추론 시장 — 자본지출(CapEx) 효율성 개선

체르닌은 추론이 이미 Nebius 매출 구성에서 가장 빠르게 성장하는 부문이며, 미래가 아닌 현재 사업에 "상당하고 긍정적인 영향"을 미치고 있다고 확인했다. 이는 회사의 단기 궤적을 모델링하는 투자자들에게 중요한 대목이다. 학습 계약은 고객이 원하는 GPU 클러스터와 기간을 명확히 알고 들어오는 일회성 인프라 중심 판매인 경우가 많다. 반면 추론은 구조적으로 다르다. 반복적 수익이 발생하고 고객의 성장과 궤를 같이하며, Nebius는 하드웨어 제공을 넘어 소프트웨어 최적화를 통해 가치를 창출할 수 있다.

체르닌은 자본지출(CapEx) 수명 주기에 대해 특히 유용한 점을 짚었다. 새로운 칩이 출시되어 대형 고객들이 프론티어 학습 워크로드를 최신 하드웨어로 이전할 때, 기존 클러스터는 방치되는 자산이 아니라 추론 워크로드로 재배치된다. 그는 Anthropic과 SpaceX의 사례를 들며, SpaceX가 학습 작업을 더 새로운 클러스터로 옮기면서 기존 하드웨어는 추론용으로 계속 생산성을 유지하는 역동성을 설명했다. Nebius와 같이 자본 집약적인 기업에게 GPU 클러스터의 수익 창출 수명을 연장하는 것은 투자 자본 수익률(ROIC)을 직접적으로 개선하는 길이다.

Eigen과 Clarifai 인수: 추론 엔진 구축

Nebius가 최근 단행한 두 건의 인수, 즉 샌프란시스코의 Eigen과 동부의 Clarifai는 'Token Factory' 추론 플랫폼을 강화하기 위한 것이며, 그 논리는 매우 기술적으로 정교하다.

MIT 박사들이 설립한 Eigen은 모델 수준의 추론 최적화, 즉 단일 GPU에서 더 많은 토큰 처리량을 추출하는 연구 중심 팀이다. Clarifai의 핵심 역량은 시스템으로서의 추론이다. 캐싱 전략, 수요 급증 시 노드 확장, 트래픽 감소 시 빠른 축소 등 수천 개의 GPU를 효율적으로 운영하는 기술이다. 체르닌은 "이들을 우리의 사내 엔지니어링 역량과 결합함으로써, 이제 추론을 거대한 시스템으로 구축할 수 있는 가장 강력한 팀 중 하나를 갖추게 되었다고 확신한다"고 말했다. 경제적 의미는 명확하다. 추론 시스템 성능 향상은 고객에게는 더 나은 토큰 경제성을, Nebius에게는 더 높은 가동률을, 그리고 가격 대비 성능 면에서 더 강력한 경쟁 우위를 제공한다.

직접 수익화하지 않아도 소프트웨어가 마진의 핵심인 이유

리아니는 소프트웨어와 풀스택 집중이 실제로 더 높은 마진으로 이어지는지 질문했다. 체르닌의 답변은 유닛 이코노미에 대한 네오클라우드 특유의 모호함을 걷어냈다. 핵심 논리는 '수요 측면의 선택권'이다. 1만 명의 고객을 수용할 수 있는 플랫폼이 10명만 수용하는 플랫폼보다 항상 더 나은 가격 결정력을 갖는다. 디지털 광고 분야의 경험을 언급하며 그는 "선택지가 많을수록 가격 결정권도 많아진다"고 말했다. 하드웨어를 고객으로부터 추상화하여, 특정 추론 워크로드를 어떤 GPU 클러스터가 처리할지 구매자가 아닌 Nebius가 결정하게 함으로써 양측 모두에게 이익이 되는 최적화 레버를 생성한다.

그는 소프트웨어가 반드시 독립적인 제품으로 수익화되는 것은 아니라고 분명히 했다. "소프트웨어를 직접 수익화할 필요는 없습니다. 대신 새로운 사용 사례를 열고 고객과 우리 자신을 위해 더 많은 최적화 레버를 제공하기 위해 소프트웨어를 구축하는 것입니다." 이는 별도의 소프트웨어 매출 항목을 찾는 투자자들에게 중요한 뉘앙스다. 마진 혜택은 가동률, 가격 결정력, 그리고 동일한 인프라 기반에서 더 다양하고 가치 높은 워크로드를 처리할 수 있는 능력에 내재되어 있다.

하이퍼스케일러 계약이 본 사업의 자금줄

고객 구성에 대해 체르닌은 대형 하이퍼스케일러 계약이 Nebius의 더 큰 야망을 뒷받침하는 역할을 한다고 솔직하게 밝혔다. Microsoft나 Meta와 같은 고객과의 협업이 최종적인 전략적 목적지는 아니다. Nebius의 목표는 AI 네이티브 기업, 성장 단계의 스타트업, 그리고 기존 대기업들로 이루어진 다각화된 포트폴리오를 구축하는 것이다. 그러나 대규모 도매 계약은 인프라를 더 빠르게 확충하고 나머지 사업에 공격적으로 자금을 조달할 수 있게 해준다. 현재 Nebius는 GPU 하나당 3~4개의 고객이 경쟁하고 있으며, 체르닌은 이를 수요 측면의 가격 결정력을 보여주는 직접적인 지표라고 설명했다.

다각화는 고객 유형을 넘어 계약 구조로도 확장된다. Nebius는 장기 계약, 단기 계약, 그리고 즉각적인 가용성에 대해 프리미엄을 받을 수 있는 스팟(spot) 용량을 혼합하여 보유하고 있다. 이러한 포트폴리오 접근 방식은 순수 베어메탈 사업자가 갖지 못한 상업적 유연성을 제공한다.

공급망: 2026년 하반기 이후의 핵심은 자체 구축 데이터 센터

Nebius를 포함한 모든 네오클라우드 기업의 제약 요소는 수요에 맞춰 전력이 공급되고 연결된 데이터 센터 공간을 얼마나 빨리 확보하느냐에 달려 있다. 체르닌은 2026년 말부터 가동되는 새로운 용량의 상당 부분이 제3자 시설을 임대하는 것이 아니라 Nebius가 직접 그린필드(greenfield) 방식으로 구축한 데이터 센터에서 나올 것이라고 밝혔다. 자체 구축 데이터 센터는 비용 구조를 개선하고 일정에 대한 통제력을 높이며 외부 임대주에 대한 의존도를 낮춘다. 여러 지역에서 약 12개의 데이터 센터 프로젝트를 병행하는 것은 리스크 분산 효과도 있다. 포트폴리오가 의도적으로 초과 수요 상태로 관리되기 때문에 특정 프로젝트가 지연되어도 전체 공급 위기로 이어지지 않는다. 추론 워크로드의 분산된 특성 또한 이를 뒷받침한다. 단일 위치에 집중된 컴퓨팅을 요구하는 대규모 학습 클러스터와 달리, 추론은 지리적으로 분산된 시설에서 처리할 수 있어 일정 관리의 유연성이 더 높다.

원자재 및 칩 가격 리스크에 대해 체르닌은 신중하면서도 자신감을 보였다. 대형 계약들은 이미 공급 물량을 확보했으며, 현재 시장 환경에서는 부품의 원가 상승보다 가격에 대한 수요 압력이 훨씬 더 강력한 힘으로 작용하고 있다는 것이다.

면책 조항: 본 기사는 정보 제공의 목적으로만 작성되었으며, 투자 조언이나 유가증권의 매수, 매도, 보유를 권장하는 내용이 아닙니다. 당사의 애널리스트는 기업 이벤트에 대해 자세한 내용을 다루지만 실수가 있을 수 있으므로 항상 본인의 판단 하에 실사(Due Diligence)를 수행하시기 바랍니다. 표현된 견해와 의견은 DruckFin의 입장과 반드시 일치하는 것은 아닙니다. 본문에 사용된 모든 정보를 독립적으로 검증하지 않았으며, 오류나 누락이 포함될 수 있습니다. 투자 결정을 내리기 전에 자격을 갖춘 재무 고문과 상담하십시오. DruckFin 및 그 계열사는 본 콘텐츠를 신뢰하여 발생하는 어떠한 손실에 대해서도 책임을 지지 않습니다. 전체 약관은 당사의 이용약관을 참조하십시오.