“수천년 간 당신의 기록 견고하게”…네이버 ‘각’의 데이터 노하우
“수천년의 시간이 지나도 당신의 기록을 견고하게 지켜나가겠습니다.”
7400개 검색어 입력과 2500개의 메일. 네이버 포털이 1초에 처리하는 데이터의 일부다. 뿐만 아니다. 블로그, 카페, 지식iN 등 이용자가 만든 엄청난 양의 콘텐츠들도 한 시의 멈춤 없이 네이버에 오르내려야 한다.
네이버는 춘천 구봉산 자락에 데이터를 저장한다. 산골에 보관되는 IT 데이터. 언뜻 어울리지 않는 광경이지만 무중단·무사고·무재해로 센터가 운영된 건 되레 이 덕택이기도 하다.
2013년 네이버가 국내 최초로 세운 자체 데이터센터, ‘각(閣)’이야기다. 오픈 10년을 맞은 ‘각 춘천’은 축구장 7개 크기인 연면적 4만6850㎡ 크기의 부지에 세워져 10만대에 달하는 서버를 수용할 수 있다. 저장 가능한 데이터의 양으로 보면 장서 900만권을 소장한 국립중앙도서관 1만개 정도의 규모라는 게 네이버의 설명이다.
기록을 담는 곳인 만큼 이름은 고려시대 팔만대장경을 보관한 ‘장경각’의 정신을 잇기 위해 이처럼 지었다. 이를테면 디지털 대장경의 본산인 셈이다.
각 춘천은 7가지 미션을 기반으로 움직인다. ▲서버가 죽으면 안 되며 ▲안전해야 하고 ▲데이터가 유실되면 안 되고 ▲빨라야 하고 ▲유연해야 하고 ▲미리 준비해야 하고 ▲비용을 효율화해야 한다는 게 각 춘천을 관통하는 운영 철학이다.
노상민 네이버클라우드 데이터센터장은 “주요 서비스의 경우 장애 대처의 골든타임 이내에 복구해야 한다는 사명감을 가지고 있다“고 말했다.
그러면서 “계속해서 취약점을 발굴하고 있다”며 “실제 작업자나 점검 담당자 미팅을 통해 서비스 장애를 예측하고 백업 계획을 짠다“고 덧붙였다.
각 춘천은 친환경 데이터센터이기도 하다. 국제적으로 통용되는 친환경 인증제도 ‘LEED‘의 최상위 등급인 플래티넘 인증을 받았다.
서버를 냉각하는 데 진짜 산바람을 쓴다. 연중 기온이 수도권보다 2~3도가량 낮은 춘천의 자연 바람을 들여와 서버실의 열기를 식힌다. 공조 설비인 ‘NAMU(NAVER Air Membrane Unit)-II’는 안정적인 공기 흐름을 통해 전력 사용량을 절감했다.
겨울철 보행자나 서버를 실은 대형 화물차량이 길에서 미끄러지지 않도록 스노우멜팅 시스템을 운영하면서도 자원을 허투루 쓰지 않는다. 서버실에서 나오는 폐열을 회수기에 모으고, 이를 흡수시킨 부동액을 지면 아래의 특수 배관에 순환시켜 각 춘천 내 도로의 눈을 녹인다.
정전에도 70시간 전력 공급, 다중화 설계로 안전하게
네이버가 자체 데이터센터를 비수도권에 세운 것은 위기관리 차원이다. 한 곳에 시설이 밀집된 지역은 재난에 취약할 수 있다. 지난해 판교 데이터센터 화재로 카카오가 먹통을 겪었던 기억이 생생하지만 네이버는 이 같은 위기에서 한 발짝 떨어져 있다고 강조한다.
정전이 발생하는 경우에 대비해 다이내믹 전원공급장치(UPS)를 사용한다. 만에 하나 전력 공급이 끊기면 ‘인덕션 커플링’이라는 발전 회전체의 회전 에너지를 전기 에너지로 바꿔 5~7초간 전원을 공급한다. 이와 함께 일체형으로 설계한 비상용 경유 발전기가 자동으로 가동돼 비상 전력을 공급해준다. 발전기는 지하에 묻힌 탱크에서 경유를 끌어온다. 각이 보유한 비상 경유는 약 60만리터로 약 70시간 동안 외부 전력 공급 없이 버틸 수 있는 양이다.
화재 대응에도 집중한다. 열화상 카메라에 발열이 감지되면 화재 감지 소프트웨어가 보안관제센터에 즉시 상황을 전달한다. 실제 화재가 일어났을 경우에는 서버관 건물에 설치한 방수총이 물을 분사해 화재 확산을 막는다.
고도화한 네트워크 아키텍처 설계와 서비스 특성에 따른 분산 배치 또한 중단 없는 서비스를 위한 필수 요소다. 이에 네이버는 네트워크 안정성을 위해 하나의 통신사업자가 아닌 다수의 통신사업자를 이용한다. 또 스케일 아웃(Scale-Out) 구조와 다중화 설계로 충분한 용량을 확보했다는 설명이다.
네이버 관계자는 “거미줄처럼 촘촘하게 구성된 네트워크 아키텍처 상에 서비스를 최적으로 분산 배치했다”며 “어느 한 곳에 이슈가 발생하더라도 다른 곳에서 서비스를 제공할 수 있어 중단되거나 데이터가 유실되는 사고를 방지한다”고 밝혔다.
빠른 복구를 위한 플랜은 기본이다. BCP(Business Continuity Plan)가 중단 없는 서비스를 돕는다. 폭설 같은 풍수재해나 테러, 전염병 등에 대한 조치 매뉴얼이 실렸고, 직무별 행동 요령이나 비상 연락망도 미리 준비했다. 네이버 관계자는 “BCP를 바탕으로 1년에 두 번 모의훈련을 진행하며 실제 재난 상황에서의 빠른 의사결정, 가용 자원 파악과 신속한 복구 등이 가능토록 했다”고 설명했다.
데이터센터는 핵심 시설인 만큼 각종 법적 사항 준수와 인증이 필요하다. 각 춘천 역시 개인정보보호법, 클라우드컴퓨팅서비스 정보보호에 관한 기준, 전자금융감독규정 등 다양한 규정을 준수하며 서비스 운영 현황을 정기적으로 검증 받는다.
각 춘천에서 일어나는 모든 일은 ‘그린에너지통제센터’와 ‘IT서비스통제센터’에서 관리한다. 그린에너지통제센터는 서버실을 최적의 상태로 유지하는 데 집중한다. 전력 흐름과 예비 전력 상황을 확인한다. 전류가 과도하게 흐르거나 발열이 허용치를 넘어서면 알림을 내리고 즉시 대응한다.
그린에너지통제센터가 설비를 관리한다면, IT서비스통제센터는 네이버의 600여개 웹·모바일 서비스 상태를 모니터링하는 공간이다. 자체 개발한 장애 감지·분석 툴로 서비스 장애에 신속하게 대응한다.
통제센터에는 국내 대표 포털 네이버의 데이터센터임을 확인할 수 있는 요소가 또 있다. 대형 모니터를 통해 24시간 TV 뉴스가 흘러나온다. 큰 뉴스가 나오면 이슈 검색 트래픽이 늘어날 수 있다. 트래픽이 몰리면 자연스레 서버에 부하가 걸리니 만큼 이에 대비하자는 취지다. 네이버 관계자는 “늘어나는 검색량에 따라 서비스 장애요소가 생길 지 등을 확인하고, 미리 대비할 수 있다”고 말했다.
하반기 ‘각 세종’ 오픈…자율주행셔틀도 도입
네이버는 각 춘천에 이어 올 하반기 새로운 각 시대를 연다. 오는 6월 세종특별시 첨단산업단지에 세워질 ‘각 세종’은 춘천의 6배인 29만3697㎡ 크기의 대지 위에 세워진다. 60만 유닛 이상의 서버를 수용해 빅데이터, 인공지능(AI), 로봇 등 팀 네이버의 기술을 모아 세계적인 인프라를 세우는 게 네이버의 목표다.
특히 각 세종은 로봇과 자율주행 등 첨단 기술을 대거 적용할 예정이다. 서버를 옮기는 로봇이나 자율주행셔틀 등을 통해 현장 생산성을 높이기로 했다. 향후 20년간 IT 서비스를 안정적으로 공급할 수 있도록 건축에서부터 에너지 효율을 고려해 설계했다.
향후 데이터센터 구축 노하우도 전파할 방침이다. 노상민 센터장은 “각 세종을 구축하면서 기술 문서를 작성하고 있다”며 “많은 사람이 확인할 수 있도록 설계부터 구축(노하우) 일부분을 오픈할 예정”이라고 말했다.
정수환 네이버 IT서비스본부장은 “로봇, AI, 클라우드 등 첨단 기술에 대한 아낌없는 투자를 바탕으로 서비스 안정성을 이어가겠다”며 “향후 클라우드 산업의 근간인 미래형 데이터센터를 통해 글로벌에서도 경쟁력 있는 클라우드 비즈니스를 전개해 나가겠다”고 강조했다.
이어 “각 세종은 최근 주목받고 있는 네이버의 초대규모 AI 하이퍼클로바가 성장하고 전세계로 뻗어나가는 근간이 될 것”이라고 덧붙였다.
글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network