과기정통부 “카카오 연속 장애, 3개월 이내 시정 결과 제출해야”
과학기술정보통신부(장관 이종호, 과기정통부)는 최근 3차례 발생한 카카오톡 서비스 장애의 원인 및 대응·복구현황에 대한 카카오의 통신재난 관리계획의 이행 여부에 관련해, 통신재난관리심의원회를 개최해 미흡사항에 대한 시정조치 요구사항을 심의 의결했다고 31일 밝혔다.
과기정통부는 카카오에게 1개월 이내 개선 조치계획을 수립해 제출하고, 3개월 이내에 시정결과를 제출하도록 할 계획이다.
점검 결과
<첫 번째 장애 : 5.13(월) 13:44~13:50(6분간)>
첫 번째 장애는 당시 카카오톡 이용자의 약 80%가 카카오톡 메시지 발신지연과 실패로 불편을 겪었을 것으로 추정했다. 장애 원인은 카카오톡 서비스가 운영되고 있는 데이터센터 서버의 파일을 업데이트하는 작업 중 기존 파일을 삭제하는 과정에서 오류가 발생했다.
<두 번째 장애 : 5.20(월) 14:52~14:58(6분간)>
두 번째 장애의 경우 당시 카카오톡 이용자의 약 80%가 메시지 수발신 실패로 불편을 겪었을 것으로 추정했다. 네트워크 부하 분산을 위한 내부 시스템 기능개선 작업 중 발생한 오류가 원인으로 파악됐다.
<세 번째 장애 : 5.21(화) 08:30~09:24(54분간)>
가장 길었던 5월 21일 장애는 당시 카카오톡 이용자의 약 8%에 영향을 미쳤을 것으로 추정했다. PC용 카카오톡 로그인 실패 및 모바일용 카카오톡 메시지 수발신 지연이 있었다. 서비스 이용률이 높은 아침 출근시간에 54분간 장애가 발생했다.
이번 장애는 두 번째 장애를 일으킨 서버의 오류를 미해결한 상태에서 동일 데이터센터에 있는 다른 서버에 자바(Java) 프로그램 업데이트를 진행한 것이 원인이었다. 점검결과, 카카오는 내부적으로 작업 통제를 하지 않아 전날 장애가 발생한 서버의 오류를 미해결한 상황에서 통제없이 새로운 작업을 진행하여 오류가 발생한 것으로 확인했다.
시정 요구사항
과기정통부는 이번 장애의 원인 및 대응·복구현황에 대한 카카오의2024년 통신재난관리계획의 이행여부를 점검하고 미흡사항에 대해 1개월 이내로 시정 요구사항에 대한 개선 계획을 마련해 제출하고, 3개월 이내에 시정한 결과를 제출하도록 했다.
▲주요 작업 전 사전테스트 체계 강화 ▲작업관리 통제 강화 ▲통신재난 관련 매뉴얼 및 지침 보완 ▲모니터링 시스템 고도화를 통한 장애 탐지 강화 ▲장애 원인분석, 사후관리 체계화 ▲장애 사실 이용자 고지 개선 등을 요청했다.
글. 바이라인네트워크
<이대호 기자>ldhdd@byline.network