SKT, 블랙웰 1000장 규모 GPU 인프라 ‘해인’ 가동

SK텔레콤(대표 유영상)은 지난 1일 엔비디아 B200 GPU 기반의 소버린 ‘GPUaaS’를 출시했다고 밝혔다.

GPUaaS는 대규모 모델 학습 및 추론을 위해 설계된 GPU 클라우드 인프라 서비스다. SK텔레콤의 새로운 GPUaaS는 1000장 규모의 엔비디아 블랙웰 B200을 단일 클러스터로 구성해 제공한다. 작년 12월 출시한 H100 기반 GPUaaS를 한층 발전시켰다.

SK텔레콤은 가산 AI 데이터센터(이하 AI DC) 내에 H100에 이은 최신 B200 GPU 클러스터 조성을 통해 국내 GPU 부족 문제를 해소함과 동시에 AI DC 시장을 선도해 나갈 계획이라고 강조했다.

클러스터 구축은 SK텔레콤의 AI DC 경쟁력과 글로벌 AI 대표 주자들과의 긴밀한 협력 속에 이뤄졌다.

클러스터 명은 ‘해인(海印, Haein)’으로, 팔만대장경이 보관된 ‘해인사’에서 모티브를 가져왔다. SK텔레콤 B200 클러스터를 디지털 팔만대장경을 품는 K-소버린 AI인프라로 만들겠다는 의미를 담았다고 한다.

해인 클러스터의 GPUaaS는 과학기술정보통신부의 ‘AI-컴퓨팅 자원 활용 기반 강화(GPU 임차 지원) 사업’에 선정되며 글로벌 경쟁력을 갖춘 국가 AI 파운데이션 모델 개발에 적극적으로 활용될 예정이다. GPU 임차 지원 사업은 국내 AI 산업의 글로벌 경쟁력 확보와 국가 AI 생태계의 고도화를 위해 마련됐다. SK텔레콤은 이 사업을 통해 가산 AI DC를 국내 AI 산업 발전의 중추적 기반 인프라로 발전시켜 나갈 계획이다.

SK텔레콤은 새 GPUaaS 출시를 위해 美 AI DC 통합 솔루션 대표 회사인 펭귄 솔루션스와 전략적 협력을 추진해 왔다. 펭귄 솔루션스는 엔비디아 인증 10대 구축 파트너로서 25년 이상 HPC 솔루션 설계, 제공 및 관리에 주력하며 글로벌 시장에서 입지를 다져온 기업이다.

SK텔레콤은 지난 ‘24년 7월 펭귄 솔루션스와  자사 AI 투자 중 최대 규모인 2억 달러 규모의 투자 계획을 체결하고, 시너지 TF를 구성해 구체적인 상호 협력 방안을 논의하는 등 차별화된 GPUaaS 서비스를 준비해 왔다.

전략적 파트너사인 글로벌 AI 서버 제조사 슈퍼마이크로와 협력을 통해 단기간 내 GPU 서버를 빠르게 수급하여 적기 제공할 수 있었다.

SK텔레콤의 독자적 기술력도 다각도로 활용된다. 자체 가상화 솔루션인 ‘페타서스(Petasus) AI 클라우드’를 활용, GPU 클러스터를 고객 수요에 맞춰 즉시 분할하고 재구성해 가동률을 극대화 했다. 또 대규모 모델 개발 노하우가 축적된 AI옵스인 ‘AI클라우드매니저’를 함께 제공한다.

SK텔레콤의 B200 기반 GPUaaS 출시는 지난해 12월 글로벌 AI 클라우드 전문기업 람다 한국 리전 개소에 이은 또 하나의 실질적 성과다. SK텔레콤은 앞으로도 GPUaaS 사업을 지속적으로 확장, 국내 AI 사업이 세계 무대에서 경쟁력을 갖출 수 있도록 인프라 차원의 적극적 지원을 강화할 계획이다.

김명국 SK텔레콤 GPUaaS사업본부장은 “최신 GPU인 B200을 활용해 국내 최대 규모로 준비한 SK텔레콤 해인 클러스터의 GPUaaS는 고객 및 국가의 AI 경쟁력을 높이는 계기가 될 것”이라며 “AI 인프라 사업자로서 국가 AI 고속도로 구축에 힘을 쏟겠다”고 밝혔다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.