[구축사례] 카카오게임즈가 빅데이터 플랫폼을 바꾸는 이유
[무료 웨비나] 개발자를 위한 클라우드플레어를 소개합니다
◎ 일시 : 2025년 2월 6일 (목) 14:00 ~ 15:00
[무료 웨비나] 중동의 ICT 및 테크 기업 생태계 – 사우디 아라비아, UAE를 중심으로
◎ 일시 : 2025년 1월 23일 (목) 14:00 ~ 15:10
국내 대표 게임사인 카카오게임즈는 최근 차세대 데이터 분석 플랫폼으로 스노우플레이크를 선택했다. 이의 일환으로 최근 지표 분석 시스템을 스노우플레이크 기반으로 교체했다.
카카오게임즈 데이터 분석 랩 김수형 실장은 “새로운 시스템 구축 결과는 기대 이상이었다”면서 “구축 과정도 빨랐고 내용도 만족스러우며, 개인정보보호도 간단했다”고 말했다.
카카오게임즈의 데이터 분석 역사
카카오게임즈는 한국 스마트폰 게임 산업의 역사를 담고 있는 회사다. 애니팡과 같은 초기 모바일 게임이 카카오게임즈의 채널링 사업을 통해 세상에 알려졌다. 당시는 카카오게임즈라는 회사조차 존재하지 않았고, 카카오 본사가 직접 게임 관련 사업을 진행했다.
이 때문에 게임 서비스를 위한 별도의 분석 시스템이 존재하지 않았다. 카카오 본사의 분석 시스템을 게임 분석에도 사용했다. 게임 분석에 최적화된 시스템은 아니었다. 이 시대의 모바일 게임은 애니팡과 같은 캐주얼 게임이 대부분이어서 복잡한 게임 분석 플랫폼의 필요성은 크지 않았다.
그러나 언젠가부터 모바일 게임 시장이 바뀌었다. 비교적 간단한 캐주얼 게임보다 다중접속온라인역할수행게임(MMORPG)와 같은 복잡한 게임이 인기를 끌었고, 카카오 역시 이런 게임을 내놓기 시작했다. 현재 모바일 게임 인기 순위 10위 안에 올라있는 카카오게임즈 게임 3개(오딘, 아레스, 아케이지워)가 모두 MMORPG다.
이 과정에서 카카오의 게임 사업은 카카오게임즈라는 기업으로 독립했다. 모바일 게임의 규모가 커졌고, 게임 퍼블리싱으로 사업을 확대하기 위해서였다.
독립한 카카오게임즈는 더이상 카카오 본사의 분석 시스템을 이용할 수 없게 됐다. 게임에 맞는 분석 시스템의 필요성도 커진 상황이었다. 카카오게임즈가 처음에 독자적인 분석 플랫폼을 구축하게 된 이유다.
카카오게임즈의 첫 분석 시스템은 AWS 상에 구축된 전형적인 데이터웨어하우스(DW)였다. 이 사업의 1차적 목표는 클라우드 도입이었다. 게임은 변동성이 큰 서비스이기 때문에 고정된 인프라를 사용하는 것보다 유연한 클라우드 인프라를 활용하는 것이 훨씬 유리했기 때문이다. AWS에 구축된 DW 기반의 분석 시스템은 게임의 ‘표준 지표’를 수집하고 분석하는 데 특화돼 있었다.
표준 지표는 효율적이지만, 모든 게임을 똑같은 지표로 분석한다는 단점이 있었다. 회사가 서비스 하는 게임이 다양해지면서 모든 게임을 표준 지표로 분석한다는 점은 답답함으로 다가왔다. 게임마다 맞춤형 분석의 필요성이 대두됐고 성능도 개선해야 할 필요성이 커졌다. 카카오게임즈는 세번째 분석 시스템을 만들기로 했다.
김 실장은 “게임마다 다른 요구사항이 있는 그것들을 표준 시스템으로만 커버하기에는 버겁다는 생각이 들어서 스노우플레이크 기반의 새로운 시스템을 도입하게 됐다”고 말했다.
지표 분석 시스템의 마이그레이션과 성과
현재 카카오게임즈가 모든 분석 시스템을 스노우플레이크로 바꾼 건 아니다. 1차적으로 기존의 지표 분석 시스템을 마이그레이션 했다. 프로모션의 성과, 이용자의 잔존율 등을 분석하는 시스템이다. 김 실장은 “가장 개선이 시급한 시스템이 지표 분석 시스템이었고, 이 프로젝트를 통해 스노우플레이크가 기대만큼 잘 구동되는지 확인하려는 의도가 있었다”고 말했다.
결과는 대만족이었다. 김 실장은 “스노우플레이크로 바꾼 시스템도 있지만 기존 시스템도 여전히 존재했기 때문에 연동이 중요했는데 연동도 매끄러웠고 장애나 사이드이펙트(부작용)도 없었다”고 덧붙였다.
카카오게임즈는 이번 마이그레이션 프로젝트를 하기 전에 정한 방침이 있다. 새로운 분석 시스템을 위해 추가 비용을 들이지 않겠다는 방침이었다. 기존 분석 시스템의 운영비 안에서 프로젝트 구축비와 운영비를 모두 충당하겠다는 목표를 세웠다. 즉 새롭게 구축된 시스템의 운영비를 낮춰서, 구축비로 쓰겠다는 것이다.
다소 황당해 보이는 이 목표를 이뤄냈다고 김 실장은 설명했다. 비록 비용 통제 때문에 제한된 장비를 사용할 수밖에 없었지만, 최대 9배까지 성능을 개선했다고 한다. 김 실장은 “27분 걸리던 분석을 3분으로 줄였다”면서 “비용은 같은데 성능이 9배까지 좋아졌다”고 말했다.
김 실장은 “아직 우리가 스노우플레이크 시스템 자체를 잘 이해하고 충분히 활용하는 단계가 아닌데도 이런 압도적 성능의 우위를 보여준다는 것은 앞으로 더 잘 알게 되면 더 많은 기능을 효율적으로 사용할 수 있겠다는 기대감도 있다”고 덧붙였다.
정형 데이터를 넘어 AI까지
게임 서비스와 관련해서는 다양한 종류의 데이터가 존재한다. 상당수의 데이터는 인게임 로그 데이터다. 게임 안에서 유저들의 행동을 로그로 기록한 것이다. 비정형 데이터도 적지 않다. 게임에 대한 평가와 동향을 분석할 수 있는 각종 커뮤니티 데이터나 외부 사이트 순위 데이터 등은 비정형 데이터로 존재한다.
김 실장은 “게임 데이터에 대해서는 많이 활용해왔기 때문에 내부적으로 활용법을 어느 정도 알고 있지만, 그 외의 데이터는 데이터가 있음에도 충분히 사용을 못하고 있다”면서 “이번에 스노우플레이크를 통해 이런 비정형 데이터도 자동으로 정형화 해서 사용할 수 있는 있다는 것을 확인했다”고 설명했다.
그는 또 머신러닝 등 AI도 활용할 계획을 전하기도 했다. 그는 “최근 스노우플레이크가 챗GPT와 같은 LLM(거대언어모델)과 연계하는 그런 기능도 선보이고 있다”면서 “그런 것들을 잘 활용하게 되면 SQL을 몰라도 자연어로 필요한 데이터를 뽑아서 분석하는 것도 가능하질 것으로 기대하고 있다”고 말했다.
글. 바이라인네트워크
<심재석 기자>shimsky@byline.network