카카오 복구 지연? “개발자 작업·운영도구 이중화 못한 탓”
이중화 못한 개발자 도구, 판교 IDC에 집중돼 있어
‘IDC 셧다운’ 상정하고 대비 못해
남궁훈, 홍은택 카카오 각자 대표가 19일 성남시 판교 카카오 사옥에서 긴급 기자회견을 열어 대국민 사과와 함께 서비스 장애 복구가 지연된 이유를 밝혔다. 두 대표는 “지난 10월 15일 발생한 판교 데이터센터 화재로 인한 서비스 장애로 불편을 겪으신 모든 이용자분들께 먼저 고개 숙여, 진심으로 사과드린다”며 말문을 열었다.
가장 관심이 쏠린 복구 지연 이유로는 ‘개발자 작업·운영도구 이중화 미비’를 꼽았다. SK C&C 판교 인터넷데이터센터(IDC)에 개발자 도구가 집중돼 있는 가운데 갑작스러운 화재 발생으로 IDC 셧다운 상황이 발생했고 대응이 늦어졌다는 설명이다.
홍 대표(비상대책위원장)는 “복구가 지연된 원인은 서비스의 주요 데이터와 서비스 응용프로그램에 대한 이중화 조치는 되어 있었으나 개발자들의 주요 작업 및 운영도구가 이중화되지 못한 데 있다”며 “이 도구들의 이중화는 판교데이터센터의 운영이 안정화되는대로 시작할 것”이라고 말했다. 이어서 “안정화 이후 2개월 안에 (작업도구 이중화로) 유사한 사고는 막을 수 있는 환경을 구축하겠다”고 덧붙였다.
이날 발표에 따르면, 카카오는 대량의 트래픽이 몰려 장애가 발생했을 때 ‘20분 내 복구’라는 지침을 가지고 수시 훈련을 해왔으나, ‘IDC 전원 셧다운’을 대비한 재해복구 훈련은 하지 않은 것으로 나타났다.
홍 대표는 “데이터센터가 셧다운된 경우는 아직까지 없어, 저희도 셧다운을 설정하지 않고 대응했다”며 “앞으로 데이터센터 두 곳이 셧다운되는 상황도 설정해서 대비하겠다”고 밝혔다.
남궁 대표는 “한 번에 전원이 나간 뒤 민감한 서버를 한꺼번에 전원을 올려버리면 이것도 또 잘못돼 장비가 고장날 수 있다. 그런 영향도 있었다”며 “지금은 배터리 연결 없이 한국전력에서 직렬로 전원을 두 개 준비해서 공급하는 중”이라고 알렸다. 홍 대표는 “한전 기간망과 바로 접속돼 있다”며 “전력이 지중화돼 있어 낙뢰 등 걱정은 안 해도 될 것”이라고 부연했다.
이날 홍 대표는 자체 데이터센터 완공 계획을 전했다. 그는 “현재 4600억원을 투입해 내년 중 안산에 자체 데이터센터를 완공할 예정”이라며 “시흥에서도 2024년 데이터센터의 착공을 목표하고 있다”고 말했다. 이어서 “자체 데이터센터는 이번 사고를 교훈 삼아 방화, 내진과 같은 방재시설을 더 안전하게 구축할 예정”이라고 강조했다.
글.바이라인네트워크
<이대호 기자> ldhdd@byline.network