온라인 개학, IT 인프라가 100배 확장된 이야기

지난 18일, 페이스북에 “온라인 개학. 국가의 일, 학생의 일”이라는 제목의 장문의 글이 게시됐다. 온라인 클래스 기술상황 실장을 맡은 김유열 EBS 부사장의 계정에 올라온 게시물이다. 온라인 클래스를 만들기 위해 클라우드 인프라 확장 작업을 한 EBS 임직원들과 IT업체들의 노고를 기록했다. 김 부사장은 “물줄기는 잡았지만 아직도 지류에서 물이 새고 있다”며 “그러나 전문가들과 함께 하기 때문에 두려움이 없다”는 소회도 함께 전했다.

전국 초·중·고등학교가 지난 9일부터 지난 16일까지 3단계에 거쳐 온라인 개학을 진행했다. 접속 오류부터 시스템 장애 등 여러 문제가 발생했으나, IT전문가들이 고군분투한 끝에 현재는 안정적으로 운영되고 있다.

코로나19로 당국의 온라인 개학이 결정되면서 EBS는 기존의 교육 플랫폼인 이솦을 반편성, 출석체크, 학습 진도율 체크가 가능한 원격수업 플랫폼인 ‘온라인 클래스’를 확대개편하기로 결정했다. 이솦은 클라우드 기반의 소프트웨어(SW) 플랫폼으로, 약 2000명 정도 수용할 수 있다. EBS는 이솦의 인프라를 확장하기 위해 지난 4월 14일 기술 전문가들을 중심으로 기술 상황실을 꾸렸다.

전국 초·중·고등학교 모두 원격수업을 해야 하는 만큼 핵심 미션은 동시 접속자 수를 늘리는 것이었다. 기존 2000명에서 300만명 이상을 수용하기 위해서는 클라우드 인프라를 확장해야 한다. 이솦의 클라우드 매니지먼트 서비스를 맡고 있는 베스핀글로벌은 온라인 클래스의 플랫폼 인프라 확장을 맡았다. 회사의 클라우드 전문 지원팀은 워룸(War Room)을 구성해 인프라부터 애플리케이션, 사용자 영역 등의 컨설팅을 수행했다.

베스핀글로벌은 대대적인 시스템 증설에 집중했다. 작업에 앞서 가장 우려된 것은 사용자 접속 폭주로 인한 접속장애였다. 베스핀글로벌은 동시접속으로 인한 사이트 로딩 지연을 방지하기 위해 각 시도별, 초·중·고등학생 별로 분산처리를 했다.

온라인개학 실무 총책임을 맡은 이학진 베스핀글로벌 팀장은 “트래픽 폭주로 홈페이지 접속이 지연되거나 로그인 시 로딩이 느려지는 것을 개선하기 위해 노력했다”며 “이를 중점으로 두고 아키텍처 튜닝 등의 작업을 했다”고 설명했다.

온라인개학 대응팀 상황실 모습 (사진=베스핀글로벌)

온라인개학이 3단계로 나눠지면서, 온라인 클래스의 대규모 인프라 증설도 세 번 이뤄졌다. 지난 1차 온라인 개학 때는 클라우드 인프라를 기존 대비 10배 증설해 약 30만명까지 동시접속을 가능하게 했다. 기술 상황실이 꾸려지고 나서는 작업에 속도가 붙었다.  덕분에 2차 온라인 개학 때는 약 100만명, 3차에는 300만명의 동시접속이 가능하도록 했다. 이를 위해 클라우드 인프라를 2차 때 기존 대비 50배, 3차 때 100배까지 증설했다.

결과적으로 현재 온라인 클래스의 웹, 웹 애플리케이션 서버(WAS), 데이터베이스관리시스템(DBMS), 콘텐츠전송네트워크(CDN) 클라우드 인프라는 기존 대비 100배 정도 늘어났다.

EBS의 요청으로 시스템통합(SI) 기업인 LG CNS도 기술 상황실을 꾸리기 전날인 지난 13일 긴급 투입됐다. LG CNS 아키텍처 최적화팀이 합류해 문제 파악과 해결을 위해 밤샘작업에 나섰다. LG CNS가 합류해 가장 먼저 발견한 것은 로그인 오류 원인이었다. ‘SQL인덱스’ 누락으로 인해 학생들의 로그인 정보를 목차로 만들어 놓는 인덱싱 작업이 되어있지 않은 것을 파악했다. EBS는 서둘러 네트워크 간 통신을 가능하게 하는 게이트웨이를 증설했다.

이솦이 단시간에 대규모 동시 접속자를 수용할 수 있는 온라인 클래스로 탈바꿈한 것은  ‘클라우드’ 덕분이라는 것이 전문가들의 의견이다. 온라인 클래스의 전신인 이솦의 인프라가 마이크로소프트(MS)의 애저로 이뤄져있어 대규모 인프라 증설이 가능했다.

이학진 베스핀글로벌 팀장은 “짧은 시간 안에 300만명의 동시접속을 가능하게 한 것은 기적과도 같은 일”이라며 “클라우드이기 때문에 빠르게 시스템 증설을 할 수 있었다”고 전했다. 이어 “만약 인프라가 온프레미스였다면 장비 수급부터 구축까지 최소 한 달이 걸리기 때문에 대응이 늦어졌을 것”이라고 말했다.

현재 두 업체 모두 인프라에서 발생하고 있는 문제 대응에 나서고 있다. 베스핀글로벌은 온라인 클래스 클라우드 인프라의 모니터링, 관제를 지속하고 있다. LG CNS도 아키텍처 최적화와 관련해 발생하고 있는 문제를 꾸준히 대응하고 있다.

김유열 EBS 부사장은 페이스북을 통해 “이제 두렵지는 않다. 국가의 일, 학생의 일을 우선시하는 한국인과 전문가가 함께하기 때문이다. 믿음이 없을 때 두렵다. 그러나 이제 믿는다”고 밝혔다.

글. 바이라인네트워크
<홍하나 기자>0626hhn@byline.network

관련 글

첫 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다