초거대 AI 요람 만든 NHN, ‘멀티 GPU 팜’ 시대 활짝

국가 AI 데이터센터 공개, 1000개 넘는 엔비디아 H100 적용

도무지 그 열기가 식지 않는 인공지능(AI) 기술 열풍. 생성AI가 놀라움을 안겼던 2023년을 넘어 올해는 더 다양한 AI 기술 개발의 원년이 될 전망이다. 스타트업을 비롯한 다양한 기업과 연구기관이 저마다 AI 개발에 박차를 가하는 상황이다. 역설적으로 이같은 흐름은 데이터센터의 몸값을 올렸다. 아무리 아이디어가 좋아도 이를 뒷받침할 인프라가 없으면 소용없는 일이기 때문이다.

NHN클라우드의 ‘국가 AI 데이터센터’가 베일을 벗었다. 대량의 그래픽처리장치(GPU)를 적용한 AI 특화 데이터센터다. 민간과 지방자치단체가 힘을 합쳐 초거대 AI 개발을 위한 요람을 만들었다.

국가 AI 데이터센터 관제실의 모습. (사진=NHN클라우드)

광주와 NHN클라우드의 합작품

NHN클라우드는 지난 2021년 과학기술정보통신부와 광주시가 추진하는 ‘AI 중심 산업융합 집적단지 조성사업’의 대상 사업자로 선정됐다. 국가 AI 데이터센터는 2년간의 준비를 거쳐 지난해 10월 문을 열었다. 광주시가 부지와 건물을 제공하고 NHN클라우드는 인프라 구축과 운영을 맡는 형태다.

NHN클라우드는 특히 초거대 AI 모델 개발의 핵심 인프라인 GPU 확보에 심혈을 기울였다. 1000개가 넘는 엔비디아의 H100을 적용했다. 지금까지 알려진 국내 데이터센터의 GPU 적용 사례 중 가장 큰 규모라는 게 회사의 설명이다.

엔비디아뿐만 아니다. 다양한 AI 칩을 심어 ‘멀티 AI GPU 팜’을 구축했다. 엔비디아 외에도 글로벌 AI칩 기업 그래프코어(GRAPHCORE)의 제품까지 합쳐 총 88.5페타플롭스(PF)의 연산 능력을 제공한다.

1PF는 1초당 1000조번 연산이 가능한 능력을 뜻하는데 88.5PF는 업무용 노트북 50만대의 연산량을 1초 만에 처리할 수 있는 성능이다. 향후에는 국내 사피온의 AI 칩을 추가 도입해 99.5PF까지 연산 능력을 높일 계획이다.

107페타파이트(PB)의 저장 용량도 눈에 띈다. 1테라 짜리 하드디스크 10만7000개의 용량에 해당한다. AI 모델 개발은 데이터의 수집부터 가공, 분석 과정이 필수다. 멀티 AI GPU 팜으로 높은 연산능력을 제공하고, 이를 뒷받침할 거대한 바구니까지 보유한 셈이다.

실제 데이터센터를 방문했을 때 관심을 끈 건 ‘소음’이었다. 전산실에서 나오는 높은 데시벨의 소리가 귀를 감쌌다. 1000개 이상의 H100을 비롯해 다양한 GPU가 힘차게 돌아가는 소리다. NHN클라우드 관계자는 “GPU는 연산 작업 수행시 중앙처리장치(CPU) 보다 더 큰 소음을 낸다”고 설명했다.

센터 옥상에 설치한 프리쿨링 공조장치의 모습.(사진=NHN클라우드)

서버 랙 수천대를 깔아놓은 데이터센터는 성능과 비례해 높은 열이 발생하고 필요한 전력량도 많다. NHN클라우드는 열은 내리고, 전력 효율은 높이는 데 집중했다. 판교 데이터센터를 10년 이상 운영한 경험을 바탕으로 고성능 설비를 구축했다.

자원 낭비를 줄이는 공랭 시스템을 구축했다. 외부 바람을 활용하는 프리쿨링(Freecooling) 공조장치가 주인공이다. 바깥에서 부는 바람으로 물을 식히고, 여기서 나오는 냉기로 전산실의 온도를 낮춘다.

식혔던 물이 미지근해져 전산실의 냉기가 약해지면 이 물을 다시 옥상의 공조장치로 올려 보낸다. 이 물을 또 다시 외부 바람으로 식힌 다음 전산실로 되돌려보내 냉기를 제공하는 구조다.

물을 재활용하고 외부 바람을 이용하기 때문에 물과 에너지 모두 절감할 수 있다. 외부 바람 온도가 5도(℃) 이하일 때는 100% 프리쿨링으로 가동해 일반 장비 대비 약 20% 에너지를 절감한다.

냉기를 불어넣는 방식도 개선했다. 전산실 양쪽에 WCU(Wall type Cooling Unit)이라는 시설을 설치했다. 양방향으로 냉기를 넣어더 빨리 열기를 식힐 수 있다. 수증기 형태의 냉기 입자가 증발하는 과정에서 또 한 번 전산실의 열을 빨아들이는 ‘증발잠열’ 방식도 도입했다.

UPS가 자리한 비상발전기실의 전경. NHN클라우드는 구축한 경유 탱크 용량을 기반으로 27시간 이상 비상발전기 가동이 가능하다고 설명했다.(사진=NHN클라우드)

고성능 GPU을 중단 없이 돌리기 위해 전력 공급 방식 또한 최적화했다. 랙당 전력밀도 15킬로와트(kw)를 구현했다. NHN클라우드에 따르면 이는 국내 데이터센터의 평균 전력밀도보다 3배 높은 수준이다. 1에 가까울수록 좋은 전력사용효율지수(PUE)는 1.3 달성이 목표다.

전력은 한국전력 전용선로를 통해 2개 변전소에서 전기를 받도록 설계했다. 특히 정전에 대비한 무정전 전력공급장치(UPS)는 경유탱크 용량을 바탕으로 최대 27시간까지 가동이 가능하다. 이 UPS 또한 전력 수요량을 모두 커버하는 4대에 더해 또 한 대를 예비로 구축함으로써 혹시 모를 비상사태에도 센터가 멈추지 않도록 했다.

자동 소화 시설을 설치하는 한편 인근 소방서와 핫라인을 뚫어 화재 시 빠른 출동이 가능한 체계를 만들었다. 낙뢰 방지 시스템과 함께 리히터 규모 7.0 규모까지 버틸 수 있는 내진 설계를 적용했다.

NHN클라우드 2.0 시대 개막, “AI 2.0 시대 이끌겠다”

현재 센터는 대학과 연구기관, 중소기업과 스타트업 등에 무료 이용혜택을 준다. 광주시의 지원과 함께 우리나라를 대표할 초거대 AI 기술 개발을 뒷받침하겠다는 취지다. 현재는 470여곳의 기업과 기관이 센터를 이용하고 있다.

NHN클라우드는 GPU 팜과 함께 서비스형인공지능(AIaaS) 솔루션을 비롯해 보안 솔루션 등 AI 개발에 필요한 인프라 환경을 제공한다. 머신러닝 모델의 쉬운 학습을 돕는 개발도구 ‘AI 이지메이커(EasyMaker)’도 지원한다.

김동훈 NHN클라우드 대표는 국가 AI 데이터센터 공개와 함께 회사의 AI 2.0 시대 대응 전략을 소개했다. (사진=NHN클라우드)

김동훈 NHN클라우드 대표는 이번 센터 건립을 통해 풀스택 AI 클라우드서비스제공사(CSP)로 자리매김하겠다고 강조했다. 기존 NHN클라우드의 공공·금융·게임 영역을 아우르는 ‘버티컬 서비스 역량’과 오픈스택 기반의 ‘클라우드 네이티브’를 바탕으로 AI 2.0 시대를 열겠다는 포부다.

내년에는 본격적으로 센터를 통한 수익도 나온다. 2025년터는 일정 분량의 상면을 일반 기업에 유상으로 판매할 수 있다. 회사는 연 500억원 이상의 매출이 나올 것으로 기대한다.

NHN클라우드는 기술 개발부터 운영, 서비스 제공 단계까지  모두 아우르는 ‘AI 생명주기’를 전방위적으로 지원하며 AI 인프라 사업에서 성과를 내겠다는 계획이다. 유럽의 CSP 지코어(GCORE)와의 협력을 통해 글로벌 얼라이언스도 구축할 계획이다.

김 대표는 “강력한 AI 데이터센터를 중심으로 AI 2.0 시대에 적극 대응하며 시장을 이끌어 가겠다”고 강조했다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다