Cerebras Systems 인터뷰: CEO가 밝히는 250억 달러 규모의 AI 수주 잔고와 'AI 거품론'이 허구인 이유

2026년 6월 4일 - 블룸버그 테크 2026, 샌프란시스코

최대 규모의 반도체 IPO와 75년 된 칩 난제 해결

Tom Giles: Andrew, 불과 2주 전 큰 행사가 있었죠.

Andrew Feldman: 네. 올해 들어 가장 큰 규모의 IPO였습니다.

Tom Giles: 반도체 업계 사상 최대 규모의 IPO였죠. 제 기억이 맞다면 당신은 이 업계에서 아주 오랫동안 활동해 오셨습니다. 저 역시 이 분야를 아주 오랫동안 지켜봐 왔고요. 칩 관련 스타트업이 IPO까지 가는 경우는 매우 드뭅니다. AI가 어떻게 이런 변화를 만들어냈나요?

Andrew Feldman: 우선, 칩을 만드는 건 정말 어려운 일입니다. 그래서 우리 같은 사람들은 대부분 나이가 들었거나 이미 세상을 떠났죠. 저희에게는 이게 그리 비싼 작업이 아닙니다. 여기 있는 이것이 바로 우리가 만든 제품입니다. [Andrew Feldman이 청중에게 거대한 Cerebras Wafer-Scale Engine 칩을 들어 보이며] 사상 최대 크기의 칩입니다. 감사합니다. 큰 칩에 박수를 보내주시네요. 정말 놀라운 변화입니다. 이 칩을 완성하기까지 5억 달러의 비용과 제 인생의 10년이 소요되었습니다. 그 결과물로 세상에서 가장 빠른 AI 프로세서를 만들었습니다. 우리는 컴퓨터 업계에서 75년 동안 풀리지 않았던 숙제인 '대형 칩을 어떻게 만들 것인가'라는 문제를 해결했습니다. 우리는 제품을 성공적으로 출시했고, 매우 자랑스러웠습니다. 2019년 8월에 이를 발표했지만, 당시에는 아무도 관심을 갖지 않았습니다. 정말 아무도요. 세상이 따라잡기까지는 시간이 좀 걸렸습니다.

Andrew Feldman: 2025년부터 AI 모델이 충분히 똑똑해지면서 사람들이 AI를 본격적으로 사용하기 시작했습니다. 사람들이 AI를 쓰기 시작하니 이제 '속도'가 중요해졌죠. 우리가 AI를 사용하는 방식은 바로 '추론(inference)'입니다. 우리는 세계에서 가장 빠른 추론 속도를 제공합니다. 단순히 조금 빠른 정도가 아니라 15배 이상 빠릅니다. 바로 그 점이 2주 전 우리가 상장이라는 특별한 위치에 오르게 된 이유입니다.

추론의 분해와 AWS 파트너십

Tom Giles: 상장 과정에서 AWS를 포함해 매우 중요한 고객사들을 확보하며 기술력을 입증했습니다. 저는 이 관계가 매우 흥미로운데, 귀사가 추론을 처리하고 프로세스를 '분해(disintegrate)'하는 방식을 잘 보여주기 때문입니다. AWS의 Trainium이 한 부분을 담당하고, 귀사가 추론 중 디코딩(decode) 단계를 맡는 식이죠. 이 모델에 대해, 그리고 이것이 다른 하이퍼스케일러(hyperscaler)들과의 협업을 위한 청사진이 될 수 있는지 말씀해 주시죠.

Andrew Feldman: 지난 90일은 정말 훌륭했습니다. OpenAI와 200억 달러가 넘는 규모의 '테이크 오어 페이(take-or-pay)' 계약을 체결했고, 45일 뒤에는 AWS와 대형 계약을 맺었습니다. 컴퓨터 아키텍트로서 저는 항상 문제를 바라보고 어떤 기계가 가장 적합한지를 고민합니다. 직접 설계해야 할지, 아니면 남의 기계를 써야 할지 말이죠. 2015년과 2016년, 우리는 새로운 워크로드가 부상하는 것을 목격했습니다. 이 새로운 AI는 엄청난 양의 연산 능력을 소비할 것이라 판단했죠. 당시 우리는 두 가지 역발상적 베팅을 했습니다. 첫째는 전용 실리콘을 직접 만들겠다는 것이었고, 둘째는 GPU와는 완전히 다른, 백지상태에서 시작하는 설계를 하겠다는 것이었습니다.

Andrew Feldman: 당시 사람들은 우리가 미쳤다고 생각했지만, 결과적으로 우리는 살아남았습니다. 이제 10년이 지난 지금, 2025년부터 AI가 중요한 일을 수행할 만큼 똑똑해지면서 추론에 대한 수요가 폭발했습니다. 우리는 다시 워크로드를 분석했습니다. 추론 문제의 본질은 무엇일까요? 바로 '프롬프트 처리(processing the prompt)'와 '답변 생성(generating the answer)'이라는 두 부분입니다. 우리는 전자를 '프리필(pre-fill)', 후자를 '디코딩(decode)'이라 부릅니다.

Andrew Feldman: 이 두 과정은 연산 특성이 매우 다릅니다. 그래서 우리는 프리필 작업에는 우리보다 더 나은 기계가 있을 수 있다고 생각했습니다. 프리필은 병렬 처리가 가능한 문제인 반면, 디코딩은 엄격하게 순차적인 문제이기 때문입니다. 우리는 이 관찰을 바탕으로 AWS에 제안했습니다. "당신의 Trainium으로 프리필을 처리하고, 우리의 대형 칩으로 디코딩을 처리하자"고요. 그렇게 해서 아주 뛰어난 솔루션이 탄생했습니다. 반응은 매우 좋았습니다. 이제 우리는 Nvidia를 제외한 모든 하이퍼스케일러 커뮤니티와 함께, 문제의 일부는 타사의 부품을 사용하고 나머지는 우리의 칩을 사용하는 협업 과정을 진행하고 있습니다.

전문 칩과 범용 칩의 대결

Tom Giles: 잠시 그 이야기로 돌아가 보죠. '분해'에 대해 말씀하셨지만, 칩 제조 분야에서 결국 범용성이 승리하고 분해된 방식에서 벗어나는 것이 필연적이지 않을까요? 만약 그렇다면 어떻게 되는 건가요?

Andrew Feldman: 그렇지 않습니다. 전문 칩과 범용 칩의 대결은 매우 흥미로운 싸움입니다. 아프리카 사바나에서든, 대기업과 맞서는 소규모 기업 간의 경쟁에서든, 승패를 결정짓는 것은 '자원 환경의 형태'입니다. 전문 칩이 타겟팅하는 자원 영역이 매우 크다면 전문 칩이 압도적으로 승리합니다. 반면 자원 환경이 작고 파편화되어 있다면 범용 칩이 승리하죠.

Andrew Feldman: x86은 어디서 승리했나요? 수많은 다양한 사용 사례가 있는 환경에서 승리했습니다. GPU는 어디서 승리했나요? 개별 그래픽이라는 단일 워크로드에서 승리했습니다. x86은 어디서나 승리했죠. 왜 휴대폰에서는 승리하지 못했을까요? ARM이 배터리 효율과 저전력에 100% 집중한 제품을 만들었기 때문입니다. 이 두 사례는 전문 칩이 범용 칩을 완전히 압도한 경우입니다. 반대로 자원 환경이 충분하지 않았던 경우도 있습니다. 저를 포함해 많은 업계 관계자들이 전문 칩을 만들려 했지만, 먹을거리가 부족해 굶주려야 했습니다. 2015년 우리가 목격한 것은 AI의 부상이 전문 칩으로 해결해야 할 엄청난 연산 수요를 창출할 것이라는 사실이었고, 그것이 바로 승리할 수 있었던 관찰 결과였습니다.

AI는 거품인가? 250억 달러의 수주 잔고

Tom Giles: 언급하신 또 다른 대형 고객인 OpenAI는 구조가 독특합니다. OpenAI와 다른 LLM 기업들은 엄청난 수요 때문에 귀사와 같은 곳과 컴퓨팅 계약을 맺는 데 점점 더 창의적인 재무 방식을 동원하고 있습니다. 수천억 달러가 지출되고 있죠. 이들이 수익을 창출하고 의무를 이행할 자금을 조달할 수 있을지 우려되지는 않나요? 다르게 묻자면, AI 거품이 있다고 보십니까? 성장이 지속 가능할까요? 사용자 수요가 충분히 빨리 실현될까요?

Andrew Feldman: 우리 둘 다 이 업계를 오래 봐왔죠. 이번이 처음이 아닙니다. 젊지 않다는 것의 몇 안 되는 장점 중 하나는 '이번이 처음이 아니다'라는 점입니다. 역사적으로 거품은 '만들면 올 것이다(if you build it, they will come)'라는 관념으로 특징지어졌습니다. 90년대 후반 데이터 네트워킹 장비를 구축할 때, 사람들이 수요를 가정하고 엄청난 양의 광케이블을 깔았던 것을 기억합니다. 경제학자들은 1870년대 철도 산업을 예로 들곤 하죠. 거기도 마찬가지였습니다.

Andrew Feldman: 하지만 지금 AI의 독특한 점은, 공급자가 수요를 전혀 따라가지 못하고 있다는 것입니다. 우리는 250억 달러가 넘는 수주 잔고를 가지고 있습니다. 우리뿐만 아니라 AMD, Nvidia 그 누구도 최종 사용자가 요구하는 수요를 감당하지 못하고 있습니다. 이는 거품과는 정반대 상황입니다. 우리는 고객을 쫓아가고 있고, 그들의 고객은 소프트웨어의 속도로 움직이는데 우리는 데이터 센터라는 부동산의 속도로 움직이고 있습니다. 우리가 뒤처져 있는 것이죠.

데이터 센터 제약과 커뮤니티 관계

Tom Giles: 그 부분에 대해 더 말씀해 주시죠. 블룸버그 인텔리전스 동료와의 팟캐스트에서 현재 가장 큰 제약이 데이터 센터 접근성이라고 하셨죠. 특히 선거철인 올해, 미국 전역에서 '내 뒷마당에는 안 된다(NIMBY)'는 반발이 거셉니다. 어떻게 대처하고 계신가요?

Andrew Feldman: 두 가지 다른 문제입니다. 첫째, 우리 모두 데이터 센터에 제약받고 있습니다. 클라우드 사업을 하는 우리도, 데이터 센터 배포 단계에 있는 AWS도 마찬가지입니다. 둘째는 '왜 세상이 우리에게 화가 났는가' 하는 점입니다. 우리는 바보 같았습니다. 우리 업계는 지역 사회에 다가가 좋은 이웃이 될 수 있었습니다. 지역 정부의 절차를 따르고 주민들의 동의를 얻어낼 수 있었죠. 우리는 좋은 이웃이 될 수 있었고, 데이터 센터 개발 비용을 충분히 지불해 지역 사회에 부담을 주지 않을 수도 있었습니다.

Andrew Feldman: 150~200메가와트 규모의 데이터 센터가 건설 기간 동안 수천 개의 일자리를 창출한다는 점을 공유할 수도 있었습니다. 예를 들어, 거대 데이터 센터가 작은 식당보다 물을 적게 쓴다는 사실을 알릴 수도 있었죠. 미국 전체 데이터 센터가 사용하는 물은 캘리포니아의 아몬드 농가보다 적습니다. 5~7배나 적죠. 우리는 앞만 보고 달렸습니다. 아마 우리 업계가 사람보다 기계와 대화하는 데 더 능숙해서일지도 모르겠지만, 지역 사회에 대한 고려가 부족했습니다.

Andrew Feldman: Microsoft의 Brad Smith가 모두를 위한 행동 촉구에 나섰습니다. 상식적인 내용이었죠. 핵심은 '이웃처럼 대하라'는 것이었습니다. 지역 사회에 데이터 센터를 짓고 사랑받는 것은 충분히 가능합니다. 일자리가 창출되고 세수가 늘어나니까요. 우리가 지역 사회를 설득하는 데 실패했다는 점은 인정합니다.

Tom Giles: 무엇을 다르게 할 생각인가요?

Andrew Feldman: 저는 데이터 센터 건설업자가 아니라 구매자입니다. 우리는 데이터 센터가 있는 지역 사회와 소통하고, 지역 상공회의소와 협력하고 있습니다. 또한 우리는 인구 밀집 지역에서 멀리 떨어진 시골 지역을 선택했습니다. 미국에 전력이 부족하다는 말이 들리지만, 사실이 아닙니다. 전력은 충분합니다. 다만 중심지와 멀리 떨어져 있을 뿐이죠. 서부 텍사스, 유타 시골, 루이지애나, 나이아가라 등 전력이 있는 곳으로 가야 합니다. 결과물인 '토큰'은 광케이블로 전송하면 됩니다. 업계 전체가 지역 사회와 좋은 이웃이 되는 법을 배워야 합니다.

G42 및 OpenAI와의 고객 집중도와 확장

Tom Giles: 고객 다변화가 필요해 보입니다. G42와의 관계에서 시작해 Meta, AWS까지 확장했죠. 다음 대형 고객은 어디가 될까요?

Andrew Feldman: 매우 흥미로운 점은, 사적인 자리에서는 아무도 "고객이 너무 한 곳에 집중되어 있다"고 비판하지 않는다는 것입니다. 2023년 말, 우리는 UAE의 AI 챔피언인 G42와 10억 달러 규모의 계약을 맺었습니다. 사람들이 "고객이 하나뿐"이라고 할 때, 우리는 OpenAI와 200억 달러 이상의 계약을 맺었습니다. 그랬더니 "이제는 20배 더 큰 고객이 하나 생겼다"고 하더군요. 이것은 실리콘밸리 역사상 가장 큰 계약 중 하나입니다. 그리고 AWS를 확보했죠.

Andrew Feldman: 진실은 이렇습니다. 이 업계에는 매우 큰 고객들이 존재할 것입니다. Nvidia의 지난 분기 매출 680억 달러 중 절반이 단 4개 고객사에서 나왔습니다. 이것이 우리가 활동하는 시장입니다. G42는 UAE 생태계의 클라우드로서 아부다비의 대학, 두바이의 석유 기업 등 수백 개의 사용자를 집계하는 하나의 창구입니다. OpenAI 역시 마찬가지입니다. 우리는 수십억 명의 개인 사용자에게 컴퓨팅 파워를 판매하고 있는 셈입니다.

속도라는 해자(Moat)와 토큰 경제의 코스트코 시대

Tom Giles: OpenAI가 Cerebras 기반 모델을 도입했습니다. 초기 성과나 토큰당 처리 속도 같은 지표를 공유해주실 수 있나요?

Andrew Feldman: 2009년 Google이 증명했듯, 답변을 받는 시간의 아주 작은 변화가 서비스 만족도에 큰 영향을 미칩니다. 밀리초 단위의 속도 차이가 사용자의 체류 시간과 사용 빈도를 결정합니다. 느린 인터넷을 쓰고 싶은 사람이 있을까요? AI도 마찬가지입니다. 아무도 느린 AI를 원하지 않습니다.

Andrew Feldman: AI가 일상에 깊숙이 자리 잡으면 속도는 근본적인 경쟁력이 됩니다. 우리 속도를 경험한 개발자들은 "토르의 망치를 든 것 같다"고 말합니다. 사용자는 더 생산적으로 변하고, 더 많은 일을 처리하게 됩니다. 그 이점은 시간이 갈수록 커집니다.

Tom Giles: 최근 시장에는 가격 민감도가 생겨나고 있습니다. '토큰 맥싱(token maxing)'에서 이제는 미터기(metering)와 제한을 이야기합니다. 이것이 실제 현상인가요? 채택 속도를 바꾸고 있나요?

Andrew Feldman: 제가 처음 코스트코가 팔로알토에 들어왔을 때를 기억합니다. 처음엔 사람들이 모든 통로를 다 돌며 쇼핑했죠. 하지만 몇 년 뒤에는 아무도 그렇게 쇼핑하지 않았습니다. 필요한 것만 골라 담는 법을 배웠죠. 지금 토큰 시장이 딱 그렇습니다.

Andrew Feldman: 처음에는 "마음껏 써라"였지만, Microsoft가 어느 날 "토큰은 비싸다, Anthropic을 무제한으로 쓰게 둘 순 없다"고 깨달았죠. 당연한 일입니다. 모든 문제에 GPT-4 같은 최고급 모델이 필요한 건 아닙니다. 슈퍼마켓에 갈 때 페라리를 탈 필요는 없죠. 저비용 오픈소스 모델을 쓰면 됩니다. 우리는 지금 '코스트코에서 쇼핑하는 법'을 배우고 있습니다. 자원을 어디에 배분할지, 어떤 모델을 어디에 쓸지 결정하는 법을 배우는 중입니다. 이 학습 과정은 매우 빠르게 진행되고 있습니다.

Cerebras Systems 심층 분석

웨이퍼 스케일 아키텍처와 물리적 해자

고성능 컴퓨팅 환경에서 인공지능(AI) 추론과 학습은 근본적으로 '메모리 벽(memory wall)'이라는 제약에 직면해 있습니다. 이는 메모리 뱅크와 연산 프로세서 간의 데이터 이동에 소요되는 시간과 에너지 문제를 의미합니다. 현재 시장을 주도하는 아키텍처는 고속 광 네트워크와 고대역폭 메모리로 분산된 그래픽처리장치(GPU)를 연결하는 방식으로 이 문제를 해결합니다. 반면 Cerebras Systems는 이러한 물리적 병목 현상을 완전히 우회합니다. 46,225제곱밀리미터 크기의 실리콘 웨이퍼 전체를 활용하는 '웨이퍼 스케일 엔진(Wafer-Scale Engine)'은 하나의 거대한 단일 프로세서로 작동합니다. 현재 모델인 WSE-3는 4조 개의 트랜지스터와 90만 개의 AI 최적화 코어를 탑재하고 있습니다. 그러나 이 아키텍처의 진정한 핵심은 44기가바이트(GB)에 달하는 온칩 SRAM(정적 램)입니다. 모델 가중치를 웨이퍼에 직접 저장함으로써 Cerebras는 초당 21페타바이트(PB)의 메모리 대역폭을 구현합니다. 기존 플래그십 프로세서와 비교했을 때 WSE-3는 훨씬 많은 연산 코어와 압도적인 메모리 대역폭을 자랑합니다. 이러한 구조적 차이 덕분에 칩 간 통신에 따른 지연 시간 없이 단일 시스템에서 대규모 파라미터 모델을 기본적으로 구동할 수 있으며, 이는 핵심 추론 작업에서 초당 토큰 처리량(tokens-per-second) 측면에서 상당한 우위를 제공합니다.

비즈니스 모델 및 수익 창출 전략

Cerebras는 자본 집약적인 하드웨어 판매에서 고마진 유틸리티 모델로 전환하는 하이브리드 수익 구조를 운영하고 있습니다. 과거에는 수익의 거의 전부가 국가 기관 및 국립 연구소에 대한 CS-3 슈퍼컴퓨팅 시스템 판매에서 발생했습니다. 현재는 상업 모델이 이원화되고 있습니다. 회사는 개별 하드웨어 배포를 통해 초기 자본을 확보하는 동시에, 일반적으로 초기 하드웨어 가격의 연 15~20% 수준인 유지보수 계약을 통해 반복적인 수익을 창출합니다. 나아가 Cerebras는 'AI Model Studio'를 통해 AI-as-a-Service(AI 서비스형) 모델로 공격적으로 전환하고 있습니다. 이 클라우드 기반 추론 및 학습 API를 통해 기업들은 막대한 초기 자본 지출 없이도 웨이퍼 스케일 컴퓨팅 자원을 활용할 수 있습니다. 동시에 자사의 독점 소프트웨어 스택을 독립적인 엔터프라이즈 제품으로 라이선스화하고 있습니다. 이러한 전략적 변화는 반도체 하드웨어 판매의 고질적인 주기성을 완화하고, 직접 하드웨어 판매에서 달성하는 40~45% 수준의 기본 매출 총이익률을 넘어 지속적인 수익성 확대를 견인하기 위한 것입니다.

고객 집중도와 수요 촉매제

Cerebras 분석에서 가장 중요한 변수는 극단적인 고객 집중도입니다. 상장 이전, 이 회사는 사실상 아랍에미리트(UAE)의 전용 하드웨어 공급업체로 운영되었습니다. G42와 모하메드 빈 자이드 인공지능 대학교(MBZUAI)가 과거 전체 매출의 최대 86%를 차지했으며, 이러한 의존도는 심각한 지정학적 및 규제적 취약성을 야기했습니다. 그러나 2025년 말, OpenAI와 200억 달러 규모의 다년도 컴퓨팅 계약을 체결하고 10억 달러의 운전 자본 대출을 확보하면서 상업적 구도는 본질적으로 변화했습니다. 이 거래는 세계에서 가장 까다로운 파운데이션 모델 개발사로부터 기술적 검증을 받았다는 점에서 회사의 궤적을 완전히 바꿔놓았습니다. 또한 Amazon Web Services(AWS)가 2026년 하반기까지 자사 데이터 센터에 Cerebras 하드웨어를 도입하기로 결정했습니다. 계약된 수주 잔고는 독보적인 매출 가시성을 제공하지만, 이는 사실상 국가 집중도를 기업 집중도로 대체한 것에 불과합니다. 만약 핵심 고객사가 컴퓨팅 전략을 변경하거나, 추론 작업을 내재화하거나, 기존 GPU로 회귀할 경우 Cerebras는 심각한 매출 타격을 입을 수 있습니다.

공급망 구조와 파운드리 의존성

이러한 아키텍처적 차별화 이면에는 위태로운 공급망 의존성이 존재합니다. Cerebras는 순수 팹리스(fabless) 반도체 설계 기업으로, 웨이퍼 제조를 전적으로 Taiwan Semiconductor Manufacturing Company(TSMC)에 의존합니다. WSE-3는 5나노 공정에서 생산되며, 차세대 WSE-4는 3나노 공정으로 예정되어 있습니다. 막대한 구매력과 우선순위를 확보한 기존 기술 대기업들과 달리, Cerebras는 파운드리 전체 생산량에서 차지하는 비중이 미미합니다. 회사는 파운드리로부터 장기 공급이나 생산 능력 할당에 대한 공식적인 확약을 받지 못했습니다. 웨이퍼 할당 차질, 가격 조정, 또는 대만 내 지정학적 마찰 발생 시 회사는 막대한 상업적 수주 잔고를 이행할 능력을 즉각 상실하게 됩니다. 또한 웨이퍼 스케일 제조의 물리적 특성상 수율 확보에 상당한 어려움이 따릅니다. 실리콘 웨이퍼는 완벽하게 결함이 없을 수 없기에, Cerebras는 표면에 여분의 연산 코어를 배치하고 소프트웨어 라우팅을 통해 물리적 결함을 우회하는 방식으로 이를 해결합니다. 이 우아한 해결책은 수율 문제를 해결하지만, 고도로 전문화된 제조 및 패키징 기술을 요구하여 대체 공급처 확보를 극도로 어렵게 만듭니다.

경쟁 환경 및 생태계 역학

2026년 2,000억 달러를 넘어설 것으로 예상되는 AI 가속기 시장은 Nvidia의 절대적인 헤게모니 아래 있습니다. Nvidia는 데이터 센터 가속기 시장의 약 80%를 점유하고 있으며, 10년 넘게 구축한 독점 소프트웨어 플랫폼을 통한 개발자 락인(lock-in) 효과로 견고한 지위를 유지하고 있습니다. Advanced Micro Devices(AMD)는 Instinct 가속기 시리즈로 시장 점유율 5~7%를 확보하며 주요 상용 대안으로 자리 잡고 있습니다. 그러나 상용 실리콘에 대한 진정한 장기 위협은 하이퍼스케일러 자체에서 발생합니다. 구글의 TPU, 아마존의 Trainium, 그리고 Broadcom 및 Marvell과 협력해 설계한 독점 칩 등 자체 실리콘이 내부 워크로드를 대거 흡수하고 있습니다. 독립 스타트업 생태계 내에서는 2025년 12월 Nvidia가 Groq를 200억 달러에 인수하면서 구조적 재편이 일어났습니다. SRAM을 활용해 추론 속도를 극대화했던 Groq는 지연 시간에 민감한 워크로드에서 Cerebras와 직접 경쟁하던 관계였습니다. Groq가 지배적인 생태계에 흡수됨에 따라 Cerebras는 대규모 웨이퍼 스케일 아키텍처를 제공하는 가장 자본력이 뛰어난 독립 업체로 남았으나, SambaNova나 Tenstorrent와 같은 전문 하드웨어 도전자들의 지속적인 압박을 받고 있습니다.

신제품 동력과 향후 전망

향후 성장 동력은 WSE-4 아키텍처의 성공적인 도입에 달려 있습니다. 3나노 공정으로의 전환은 단일 웨이퍼에 더 많은 트랜지스터를 집적할 수 있게 하여, 토큰 생성당 전력 소비를 낮추고 연산 범위를 확장할 것입니다. 또한 회사는 전체 웨이퍼를 최대치로 가동할 때 발생하는 엄청난 열 밀도를 고려해 랙 수준의 직접 칩 액체 냉각 시스템을 적극적으로 통합하고 있습니다. 실리콘 하드웨어 실행력을 넘어 성장의 핵심 촉매제는 소프트웨어 레이어에 있습니다. 회사의 컴파일러 소프트웨어는 개발자가 코드베이스를 크게 수정할 필요 없이 오픈 소스 모델과 널리 사용되는 프레임워크를 원활하게 수용할 수 있음을 입증해야 합니다. 다가오는 AWS 도입 성공 여부가 이와 관련한 결정적인 시험대가 될 것입니다. 만약 엔터프라이즈 개발자들이 기존 클러스터에서처럼 쉽게 Cerebras 호스팅 인스턴스에 대규모 파라미터 모델을 배포할 수 있게 된다면, 타겟 시장은 엘리트 연구소에서 주류 기업으로 성공적으로 확장될 것입니다.

경영진 성과 및 평가

앤드류 펠드먼(Andrew Feldman) 최고경영자(CEO)와 션 리(Sean Lie) 최고기술책임자(CTO)가 이끄는 경영진은 반도체 아키텍처 분야에서 뛰어난 운영 이력을 보유하고 있습니다. 이들은 과거 서버 인프라 기업인 SeaMicro를 창업해 AMD에 매각하며 고성능 컴퓨팅 설계 분야에서 깊은 신뢰를 쌓았습니다. Cerebras에서의 재임 기간은 반도체 업계 전반이 물리적으로 불가능하다고 치부했던 엔지니어링 비전을 실현하는 과정으로 정의됩니다. 웨이퍼 스케일 칩의 열팽창, 전력 공급, 결함 라우팅을 성공적으로 관리한 것은 객관적으로 기념비적인 엔지니어링 성과입니다. 더욱이 경영진은 2025년 말 뛰어난 전략적 유연성을 발휘했습니다. 상장을 앞두고 중동 지역 매출 의존도와 관련한 실존적 규제 장벽에 직면하자, OpenAI와의 혁신적인 계약을 체결하여 2026년 기업공개(IPO)의 리스크를 성공적으로 제거했습니다. 그러나 상장 기업으로서의 운영은 완전히 새로운 차원의 요구를 수반합니다. 순수 R&D에서 대규모 글로벌 배포, 복잡한 공급망 관리, 분기별 재무 성과 달성으로의 전환은 경영진의 운영 역량을 엄격하게 시험할 것입니다.

종합 평가

Cerebras Systems는 AI 실리콘 분야에서 가장 대담한 아키텍처적 일탈을 보여줍니다. 메모리 벽이라는 난제에 정면으로 맞선 웨이퍼 스케일 패러다임은 업계에서 가장 까다로운 추론 워크로드에 대해 입증 가능한 처리량 및 지연 시간 이점을 제공합니다. 선도적인 파운데이션 모델 개발사와의 대규모 다년도 수주 잔고 확보는 근본 기술에 대한 독보적인 검증을 의미하며, 향후 수년간 비약적인 매출 성장을 위한 명확한 경로를 뒷받침합니다.

반면, 이러한 성장 프로필에 수반되는 구조적 위험은 심각합니다. 상업적 기반은 국가 의존도를 기업 집중도로 교체했을 뿐이며, 여전히 단일 핵심 고객의 전략적 변심에 취약합니다. 여기에 외부 파운드리 할당에 대한 무방비한 의존성, 아직 발전 중인 소프트웨어 생태계, 그리고 사실상 무한한 자본과 최근 추론 경쟁사를 인수한 지배적 경쟁자의 존재는 경영상 실수를 허용할 여지가 없음을 시사합니다. 회사는 현재의 시장 지위를 정당화하기 위해 틈새 하드웨어 공급업체에서 확장 가능한 엔터프라이즈 유틸리티 기업으로의 도약을 완벽하게 해내야 합니다.

다음으로 읽기

ERock 심층 분석: 초고속 성장 수주 잔고와 자본 집약적 과제, 그리고 거대 산업 공룡들과의 대결

2026-06-08

Forbright 심층 분석: 자산 경량화 수수료와 디지털 우선 예금 집적을 통한 상업은행 패러다임 재설계

2026-06-08

Parabilis Medicines 심층 분석: β-Catenin의 탁월한 효능과 정맥 주사제형의 한계, 그리고 지정학적 공급망 리스크

2026-06-08

Liftoff Mobile 심층 분석: 독립 앱 경제의 탈중앙화와 지배력

2026-06-08

NVIDIA 트랜스크립트: Vera Rubin AI 플랫폼 본격 양산 돌입, 에이전트가 컴퓨팅 경제를 재편하다

2026-06-06

블룸버그 라이브: 혹 탄 브로드컴 CEO "M&A는 이제 없다… OpenAI 칩 연내 생산 돌입"

2026-06-05

면책 조항: 본 기사는 정보 제공의 목적으로만 작성되었으며, 투자 조언이나 유가증권의 매수, 매도, 보유를 권장하는 내용이 아닙니다. 당사의 애널리스트는 기업 이벤트에 대해 자세한 내용을 다루지만 실수가 있을 수 있으므로 항상 본인의 판단 하에 실사(Due Diligence)를 수행하시기 바랍니다. 표현된 견해와 의견은 DruckFin의 입장과 반드시 일치하는 것은 아닙니다. 본문에 사용된 모든 정보를 독립적으로 검증하지 않았으며, 오류나 누락이 포함될 수 있습니다. 투자 결정을 내리기 전에 자격을 갖춘 재무 고문과 상담하십시오. DruckFin 및 그 계열사는 본 콘텐츠를 신뢰하여 발생하는 어떠한 손실에 대해서도 책임을 지지 않습니다. 전체 약관은 당사의 이용약관을 참조하십시오.