정부24 사태 주범으로 지목된 ‘L4 스위치’…정말일까?

정부24 시스템 장애가 복구됐지만 후폭풍이 가시지 않고 있다. 대민 행정업무가 먹통이 되며 일어났던 혼란은 진화됐지만 아직 원인에 대해서는 명확한 이유를 찾지 못하고 있다. 일단 ‘L4 스위치’가 장애의 원인으로 지목됐다. 그렇지만 전문가들 사이에서 석연치 않다는 의견이 나온다. 정말 L4 스위치를 먹통의 원흉으로 봐도 되는 걸까.

정부24 먹통 사태 이후인 지난 19일 지방행정서비스 정상화 관련 브리핑에 나선 고기동 행안부 차관.

사태의 전말

사태의 시작은 지난 17일이다. 이날 오전 공무원들이 사용하는 전산망 ‘새올지방행정정보시스템’에 접속오류가 발생했다. 오후에는 정부24까지 멈추면서 주민등록초본이나 등본, 인감증명서 등의 민원서류 발급과 전입신고 등 온라인 대민업무가 중지됐다. 평일 막바지에 먹통 사태가 일어나면서 대혼란이 일어났다.

행정안전부에 따르면 사태는 네트워크 장비 오류 때문에 발생했다. 새올 접속 장애의 원인으로 정부공개키인프라(GPKI) 오류가 지목됐고 원인을 찾는 과정에서 네트워크단의 L4 스위치 문제를 확인했다.

하지만 해당 장비에 어떤 문제가 구체적으로 발생했는지는 밝혀지지 않았다. 긴급 브리핑을 연 행안부는 “L4 장비 안에 어떤 부분이 실제로 문제를 일으켰는지는 조금 더 면밀한 조사를 거쳐 확정할 수 있을 것 같다”고 밝혔다.

지난 17일 정부24 홈페이지 포털 검색 결과(사진 위). 아예 일시중단 안내를 넣어 클릭을 자제시켰다. 현재(사진 아래)는 일시중단 문구가 사라지고 접속도 원활하다.

진짜 L4가 문제?

정말 L4 스위치가 문제였을까. L4 스위치란 서버에 몰리는 트래픽을 우선 순위에 따라 배분해주는 로드밸런싱(RoadBalancing) 장비를 말한다. 쉽게 말해 이번 경우라면 정부24 민원발급 요청 트래픽을 분산시킴으로써 특정 서버에 부하가 몰리지 않도록 하는 역할을 한다. 네트워크 기본 이론인  OSI(Open System Interconnection) 7계층에 따르면 네트워크는 물리계층(L1)부터 시작해 ▲데이터 링크(L2) ▲네트워크(L3) ▲전송(L4) ▲세션(L5) ▲표현(L6) ▲응용(L7)으로 이뤄진다. 이중 L4는 전송 연결과 흐름제어를 맡는다.

해당 장비를 제공한 곳은 국내 기업 P사다. 이 회사에 따르면 16일 장비 운영체제 업데이트를 진행했고, 다음날인 17일 새올 시스템이 멈춰서자 업데이트를 취소하는 롤백 조치를 했다. 여기에 18일 오전 정부24 서비스가 정상화되기 이전인 새벽 시간에 해당 장비 자체를 교체했다.

흐름대로 보면 보면 정부 설명에 허점이 없지 않다. P사는 업데이트 이후 테스트 결과 이상 징후가 없었다고 주장한다. 만에 하나 업데이트가 문제였어도 롤백 이후에는 시스템이 제대로 돌았어야 한다. L4 또한 이중화를 해뒀지만 순차적으로 문제가 발생했고 다음날 오전까지 먹통이 계속됐다는 게 행안부의 설명이다. 행안부는 또 해당 L4 스위치의 노후화에는 선을 그으면서 “국가정보자원관리원에서 수십대의 동일한 장비를 운영하고 있다”고 밝혔다.

하지만 L4 스위치의 문제라면 오류 해결이 이렇게 오래 걸릴 일이 아니라고 전문가들은 의문을 품는다. L4 스위치만으로 이런 대란이 일어났다는 건 이해가 안 된다는 것이다. 장비 문제라면 다른 시스템에서도 문제가 터져 나왔어야 한다. 행안부의 설명처럼 노후화되지도 않았고 다른 곳에서는 정상적으로 돌고 있는 것과 같은 제품이다. 김승주 고려대 정보보호대학원 교수는 “문제가 생기면 로그 분석을 해보면 될 일”이라며 “ 왜 이렇게 원인 파악이 오래 걸리는 지 의문”이라고 말했다.

일각에서는 L4 스위치 다음에 있는 GPKI 서버 등과 함께 복합적인 오류가 났을 것이라는 추측을 내놓고 있다.

한 보안기업 대표 A씨는 “(만약 L4 스위치에 문제가 있었다면) 바로 로그를 확인할 수 있다”며 “바로 할 수 있는 작업”이라고 말했다. 그는 L4스위치뿐만 아니라 연결된 여러 작업이 엉키면서 혼란이 일어났다는 데 무게를 실었다. A씨는 “여러 영역에서 오류가 났다면 어디서 발생했는지 찾는 과정에서 시간을 많이 잡아먹을 수는 있다”고 말했다.

L4 스위치가 트래픽을 분배해 준 GPKI 부분에 문제가 있었을 수도 있다는 분석도 있다. A씨는 ”네트워크 다음단에 있는 인증(GPKI) 시스템이 키포인트일지도 모르겠다”고 추정했다.

행안부는 현재 태스크포스(TF)를 꾸려 대응하기로 한 상태다. 지난 21일 ‘지방행정전산서비스 개편 TF’ 첫 회의를 개최했다. 원인분석반과 대책수립반으로 나눠 각각 원인 파악과 향후 대책 수립에 나서기로 했다. 행안부는 첫 회의에서는 네트워크 장비 문제와 함께 원인분석반 운영방안을 중점 논의했다고 설명했다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다