DruckFin

메모리 시맨틱 장벽의 종말: CXL 연결 플래시가 데이터센터 경제의 구조적 변화를 이끄는 이유

수십억 달러 규모의 '메모리 고립' 문제

현대 클라우드 인프라 시장은 서버 아키텍처의 구조적 결함, 즉 메모리 경제성 문제로 병목 현상을 겪고 있습니다. Microsoft의 'Azure Pond' 연구에 따르면, 현재 DRAM은 클라우드 서버 총비용의 최대 50%, 전체 랙 비용의 약 40%를 차지합니다. 막대한 자본 지출에도 불구하고 이 메모리의 상당 부분은 완전히 유휴 상태로 남아 있습니다. Microsoft의 연구는 CPU 할당량이 85%에 도달하면 메모리 고립(memory stranding) 비율이 10%를 넘어서고, 높은 사용률을 보이는 구간에서는 95분위수 기준 25%, 극단적인 경우 30%에 육박한다는 사실을 밝혀냈습니다. 업계 분석가들은 매년 출하되는 서버 메모리 중 최대 80억 달러 상당이 수명 주기의 상당 기간 동안 유휴 상태로 방치될 것으로 추산합니다.

클라우드 서비스 제공업체들은 단순히 메인보드에 DDR5 채널을 추가하는 방식으로는 이 문제를 해결할 수 없습니다. 현재의 물리적 한계를 넘어서면 신호 무결성이 심각하게 저하되고 서버의 전력 허용 범위를 초과하게 됩니다. 더욱이 고성능 DRAM의 기가바이트당 비용 곡선은 기업의 총소유비용(TCO) 모델을 근본적으로 무너뜨립니다. 업계는 전통적인 직접 연결 메모리 확장 방식의 물리적, 경제적 한계에 도달했으며, 이에 따라 메모리 분리(disaggregation) 및 풀링(pooling)에 대한 긴급한 요구가 제기되고 있습니다.

기술적 패러다임의 전환: 스토리지 드라이버 스택 우회

최근 기관 투자자들 사이에서 빠르게 주목받는 해결책은 CXL(Compute Express Link) 기반 플래시, 흔히 CXL-SSD 또는 CXL 연결 메모리로 불리는 기술입니다. 과거에는 블록 NVMe 스토리지 장치에 접근하기 위해 복잡하고 지연 시간이 긴 소프트웨어 계층을 거쳐야 했습니다. 운영체제(OS) 커널 인터럽트를 발생시키고, 스토리지 드라이버 스택을 통과하며, 4KB 페이지 블록을 로컬 DRAM 버퍼로 가져오기 위한 직접 메모리 접근(DMA) 연산을 수행해야 했습니다. 이러한 기존 I/O 경로는 수십 마이크로초의 지연 시간을 발생시키며, 일반적인 3D NAND의 경우 보통 40~100마이크로초가 소요됩니다. 이는 고처리량 AI 벡터 및 그래프 처리 워크로드에서 CPU 파이프라인을 심각하게 지연시키는 원인이 됩니다.

CXL은 이러한 아키텍처를 근본적으로 바꿉니다. 물리적 플래시 메모리 앞에 CXL 컨트롤러를 배치하고 PCIe Gen5 또는 Gen6 전송을 통해 연산을 직접 라우팅함으로써, 플래시 매체는 더 이상 주변 스토리지 장치로 작동하지 않습니다. CXL.mem 하위 프로토콜을 활용하여 해당 매체는 호스트 관리 장치 메모리(Host-managed Device Memory)로서 CPU의 일관된 메모리 공간에 직접 노출됩니다. 이제 CPU는 64바이트 캐시 라인 단위로 네이티브 로드 및 스토어 명령어를 사용하여 이 플래시 스토리지에 접근할 수 있습니다. 본질적으로 시스템은 더 이상 블록 I/O 요청을 발행하는 것이 아니라, 메모리 포인터를 역참조(dereferencing)하는 것입니다.

이를 가능하게 하는 핵심 실리콘 혁신은 CXL-SSD 컨트롤러 내부에 SRAM과 DRAM 버퍼를 통합하여, CPU가 요청하는 64바이트 접근 단위와 플래시 매체 고유의 더 큰 페이지 경계 사이의 불일치를 해소하는 것입니다. 버퍼 히트 시 시스템은 DRAM에 가까운 지연 시간을 달성하며, 미스 발생 시 플래시 매체의 원시 지연 시간에 의존합니다. 이는 수 테라바이트 규모의 거대언어모델(LLM) 임베딩 테이블과 같은 '웜 데이터(warm data)'를 위한 초고밀도 확장 계층으로 설계된 새로운 마이크로초급 메모리 티어를 창출합니다.

소프트웨어 성숙도: 기업 도입의 촉매제

역사적으로 하드웨어 혁신은 강력한 소프트웨어 지원 없이는 정체되기 마련이지만, CXL을 위한 소프트웨어 생태계는 이미 기업 수준의 준비를 마쳤습니다. 가장 큰 촉매제는 Meta의 'Transparent Page Placement' 기술로, 이 회사는 해당 기술을 오픈소스로 공개하고 메인 Linux 커널에 병합했습니다. Transparent Page Placement는 개발자가 애플리케이션을 재작성할 필요 없이 계층화된 메모리를 관리할 수 있는 자동화된 운영체제 수준의 메커니즘을 제공합니다.

이제 Linux 커널은 백그라운드에서 메모리 접근 패턴을 지속적으로 프로파일링합니다. 직접 캐시 할당이나 높은 대역폭 메모리가 필요한 행렬 곱셈 가중치와 같이 사용 빈도가 높은 '핫 페이지(hot pages)'는 속도가 빠른 CPU 연결 DDR5 또는 HBM 계층으로 자동 승격시킵니다. 반대로 접근 빈도가 낮은 '콜드(cold)' 또는 '웜(warm)' 페이지는 고용량 CXL 플래시 계층으로 사전에 강등시킵니다. 이 배치는 워크로드에 완전히 투명하게 이루어지며 과도한 컨텍스트 스위칭 없이 처리되기 때문에, Meta의 프로덕션 테스트에서 1% 미만의 성능 저하만으로 막대한 메모리 사용량 절감 효과를 입증했습니다. 이러한 업계 표준 통합은 하이퍼스케일러와 기업 데이터센터 모두에게 CXL 도입의 위험 요소를 완전히 제거해 줍니다.

주요 수혜자: 실리콘 컨트롤러 및 저지연 NAND 혁신 기업

CXL 연결 플래시로의 전환은 특정 반도체 설계 업체와 메모리 제조사에 매우 수익성 높은 기회를 제공합니다. 가장 직접적인 수혜자는 순수 연결성 및 CXL 컨트롤러 기업들입니다. Astera Labs는 이 분야에서 확실한 초기 승자로 부상했습니다. 이 회사는 현재 'Leo'라는 코드명의 3세대 CXL 메모리 컨트롤러를 배포하고 있는 반면, Marvell Technology, Microchip, Montage Technology와 같은 기존의 다각화된 경쟁사들은 여전히 1세대 제품을 상용화하는 단계에 머물러 있습니다. Astera Labs의 압도적인 선점 효과와 심층적인 소프트웨어 통합은 2025년 전체 매출 8억 5,250만 달러를 달성하는 원동력이 되었습니다. CXL 메모리 확장 시장이 2025년 13억 달러에서 2034년 118억 달러 규모로 성장할 것으로 전망됨에 따라, Astera Labs는 메모리 분리 시장의 핵심 실리콘 '통행료 징수자'로서 독보적인 마진을 확보할 것으로 보입니다.

메모리 제조 측면에서는 저지연 스토리지 클래스 메모리(SCM)를 선도하는 공급업체들이 이 아키텍처에 가장 적합한 위치를 점하고 있습니다. Kioxia는 단일 레벨 셀(SLC) XL-Flash 기술로 이 흐름을 주도하고 있습니다. Kioxia의 독자적인 XL-Flash는 3~5마이크로초의 읽기 지연 시간을 자랑하며, 멀티 레벨 셀 변형 모델도 10마이크로초 미만의 성능을 제공합니다. Kioxia는 이 초저지연 플래시를 최적화된 컨트롤러와 결합하여 전례 없는 1,000만 랜덤 IOPS를 구현하는 AI SSD를 시장에 선보이고 있습니다. 업계의 주요 마진 리더인 삼성전자와 SK하이닉스 역시 데이터센터 내 입지를 방어하고 스토리지 클래스 메모리와 관련된 프리미엄 가격을 확보하기 위해 CXL 네이티브 모듈로 자원을 빠르게 집중하고 있습니다.

기존 업체에 대한 위협: 범용 DRAM과 레거시 NVMe의 압박

AI 인프라 구축이 모든 메모리 형식에 세속적인 순풍을 제공하고 있지만, CXL 연결 플래시의 광범위한 배포는 기존 범용 DRAM의 물량 성장에는 결정적인 구조적 위협이 됩니다. Microsoft의 Azure Pond 연구 모델링에 따르면, 하이퍼스케일러가 CXL 풀링과 플래시 확장을 사용하여 기존 메모리 대비 1~5% 성능 차이 내에서 핵심 DRAM 비용을 7% 절감할 수 있다면, 이들은 모든 웜 데이터 계층에서 고가의 고밀도 DDR5 모듈을 저렴한 CXL 플래시 용량으로 공격적으로 대체할 것입니다. 이러한 대체 효과는 2027년 말까지 전통적인 서버 DRAM의 단위 성장률 상한선과 프리미엄 가격 결정력을 제한할 가능성이 높습니다.

나아가 표준 기업용 NVMe SSD 제조사들은 심각한 시장 점유율 하락 위험에 직면해 있습니다. CXL.mem 프로토콜을 통합하지 못하고 레거시 PCIe 블록 스토리지 인터페이스에만 의존하는 드라이브 제조사들의 제품은 차세대 AI 서버 랙에서 배제될 것입니다. 데이터센터는 용량 제약이 있는 워크로드를 위해 전통적인 블록 I/O 스토리지에서 적극적으로 벗어나고 있으며, 마이크로초급 플래시와 네이티브 CXL 호환성을 갖추지 못한 공급업체들은 저마진 콜드 스토리지 계층으로 밀려날 것입니다.

면책 조항: 본 기사는 정보 제공의 목적으로만 작성되었으며, 투자 조언이나 유가증권의 매수, 매도, 보유를 권장하는 내용이 아닙니다. 당사의 애널리스트는 기업 이벤트에 대해 자세한 내용을 다루지만 실수가 있을 수 있으므로 항상 본인의 판단 하에 실사(Due Diligence)를 수행하시기 바랍니다. 표현된 견해와 의견은 DruckFin의 입장과 반드시 일치하는 것은 아닙니다. 본문에 사용된 모든 정보를 독립적으로 검증하지 않았으며, 오류나 누락이 포함될 수 있습니다. 투자 결정을 내리기 전에 자격을 갖춘 재무 고문과 상담하십시오. DruckFin 및 그 계열사는 본 콘텐츠를 신뢰하여 발생하는 어떠한 손실에 대해서도 책임을 지지 않습니다. 전체 약관은 당사의 이용약관을 참조하십시오.