[광 to the 고] 바이라인네트워크가 주최하는 이벤트들, 참 좋은데...

제주라는 한정된 공간에서 100대의 차량으로 사업을 시작한 쏘카가 어떻게 전국 4000여 곳에서 1만2000대를 빌려주는 사업체로 성장할 수 있었을까?

카셰어링 업체 ‘쏘카’는 이용자들이 원하는 시간 만큼 자동차를 이용할 수 있게 빌려주는 일을 한다. 다시 말해, 언제 어느 곳에 이용자들이 몰려 있는지, 또 사람들이 차를 빌리는데 얼마까지 돈을 내려 할지 예측하는 만큼 이익을 남길 수 있다. 이들이 성장을 위해 찾은 해법은 ‘데이터’다. 쏘카의 데이터그룹은 지난 12일 저녁 밋업을 갖고 창업 후 8년간 쌓은 데이터를 어떻게 활용해 원하는 질문에 답을 찾아가고 있는지를 공유했다.

쏘카는  지난해 7월, 데이트 앱 ‘비트윈’으로 알려진 VCNC를 인수했다. VCNC는 쏘카에 합류, 곧 ‘타다’라는 서비스를 시작했다. VCNC의 개발진 중 일부는 쏘카에서 ‘데이터그룹’을 만들었는데, 김상우 데이터그룹장 역시 그중 한 명이다. VCNC의 공동창업자이기도 한 김 그룹장은 현재 쏘카의 데이터그룹을 이끌고 있다.

김상우 쏘카 데이터그룹장에 따르면 올해 쏘카는 실적 부문에서 괜찮은 성장을 이뤘다. 올 평수기 차량당 매출은 지난해 대비 10~15%가량 늘어 손익을 개선했다. 성수기의 매출은 더 큰 폭으로 뛰었다. 40%까지 늘었는데 차량당 매출 증가율은 25%다. 실적을 자랑하는 일과는 거리가 있을 것 같아 보이는 데이터 그룹에서 이러한 이야기를 한 것은, 쏘카가 데이터를 ‘비즈니스 성과와 연결되는 일’에 활용하기 때문이다.

김 그룹장은 “각 부문에서 1%씩만 개선을 이룬다고 하더라도, 확실한 1%의 개선을 열 개, 스무 개 분야에서 쌓을 수 있다면 산업 자체를 바꿀 수 있다”면서 “다양한 전공과 배경을 가진 사람들이 가격전략, 데이터사이언스 등의 일을 하고 있다”고 설명했다.

예컨대 쏘카 데이터그룹 내 가격전략팀은 수요공급을 예측해 비즈니스에 적용하는 일을 한다. 말 그대로 비즈니스의 최전선인데, 고착화된 사업을 데이터 관점에서 접근하는 방식으로 수익성을 개선하려 했다. 수요에 반응해 가격을 책정하는 ‘다이내믹 프라이싱’은 이론적으로는 쉬운 일일 수 있으나, 현실에서는 변수가 많아 적용이 까다로웠다. 쏘카도 처음에는 자동화된 가격 시스템을 적용했었다. 수요가 몰릴 것으로 예측되는 기간에 가격 할증을 하는 방식이다. 보유한 차량의 절반이 판매되고 나면 그때부터 구간별로 가격을 할증하는 시스템이었다.

그런데 데이터를 뜯어보니 수익 면에서 아쉬운 부분이 보였다. 차량의 50%가 판매되기를 기다리지 않고 아예 처음부터 수요를 예측해서 가격을 달리 책정하면 수익성을 개선하는 데 도움이 될 게 보였다. 고도화된 다이내믹 프라이싱의 필요성을 느낀 것이다. 그래서 차량과 지역 정보 등 3년 이상 모은 데이터를 밑천 삼아 머신러닝으로 최고의 수익이 나도록 실시간 최적 가격을 제시하는 모델을 만들었다. 자원이 놀지 않고 손해가 나지 않는 선에서, 고객이 지불할 의사가 있는 최고의 금액을 제시하면 더 많은 돈을 벌 수 있다는 계산이 섰다. 이 시스템이 올해 수익성이 개선된 데 기여한 공신이다.

배동욱 쏘카 데이터그룹 가격전략팀장은 “누구나 알고 있는 유니콘의 공통 문제는 혁신 서비스를 하면서 매출과 덩치가 커졌지만 손익이 좋지 않아 적자를 내는 것”이라면서 “쏘카는 데이터라는 힘을 손익개선에 집중해 사용했다”고 설명했다. 구체적으로는 “마케팅을 통해 전환율에 집중한다기보다 손익 개선에 집중해 문제를 해결하려 했다”고 덧붙였다.

이날 밋업은 쏘카 데이터그룹 팀의 노하우를 공유하는 자리로 마련됐다. 그러나 실상은, 전략 공유를 핑계 삼아 데이터 분석의 개발자를 구인, 아니 구애하기 위한 자리였다.

그렇다고 너무 큰 그림을 그리면 문제 해결에 시간과 노력이 많이 든다. 작은 주제로 심도 있는 분석에 집중하는 게 더 효율적이라고 판단했다. 쏘카는 대여요금과 보험료, 주행요금을 합산해 가격을 매기는데, 배 팀장은 이중 보험료를 개선하면 수익성에 도움이 될 거라 생각했다. 자칫 회사에 큰 손해를 끼치는 것이 바로 사고비용이기 때문이다.

렌터카 시장은 그동안 고정 보험료를 매겨왔다. 그래서 일반화 선형 모델(Generalized linear models, GLM)로 사고 비용을 예측해 정확도를 높여 봤더니 누군가는 차량을 이틀이나 빌려도 320원이면 충분할 것을 누군가는 50분 만에 1만2000원을 내야 한다는 결론이 나왔다. 이 이야기는 다시 말해서, 사고를 낼 사람과 내지 않을 사람을 예측해 보험료를 완전히 차등 청구해야 한다는 이야기다.

그러나 이 모델을 곧바로 현실에 적용할 순 없었다. 이 계산에 따르면, ‘보험’이라는 것 자체의 존재가 필요 없어지기 때문이다. 사고를 낸 사람이 사고 비용을 모두 물도록 책정되는 보험은 가입자에게 쓸모가 없다. 이 때문에 쏘카 가격전략팀은 머신러닝으로 사고 비용을 예측하되, 그 결과를 평균의 보험료 구간 안에서 차등 청구하는 방식을 택했다. 인공지능과 인간지능을 적절히 합친 셈이다.

또, 지역 기반 수요를 예측하는 데도 머신러닝을 활용했다. 기존에는 주차장으로만 보던 쏘카존을 세분화하고, ‘부름 서비스’에 응할 수 있도록 인근 지역을 하나의 클러스터로 묶어 수요에 민첩하게 반응할 수 있게 했다. 배 팀장은 “고객이 하나의 존만 사용하지는 않을 것이므로, 지역 클러스터링으로 수요 확인을 했다”며 “요일, 지역, 주중, 주말 등 실제 차량 가동 패턴에 따라 다른 가격 패턴을 제공하고 싶어서 연구하고 있다”고 말했다.

쏘카는 머신러닝을 통해 차량의 파손 등을 관리하기도 한다. 이는 쏘카 데이터그룹 데이터사이언스팀 송영인 매니저가 발표했는데 차량 이용 전, 이용 후 사진을 바탕으로 파손 정보를 파악하고 잘못이 누구에게 있는지 알기 위해서다. 평소에는 쏘카 앱을 통해 하루 7만~8만 장이, 성수기에는 11만 장의 사진이 올라오는 데 이를 사람이 모두 검수하기에는 리소스가 많이 들어가기 때문에 자동화 개발에 나선 것이다.

우선 딥러닝을 이용한 파손 여부 확인에 집중했다. 목표는 각 이미지에 차량이 파손됐는지를 확인하는 것과, 만약 파손으로 추정될 경우 차량의 어느 영역이 망가졌는지 그리고 어느 좌표에 손상이 존재하는지를 판별하는 것이었다. 쏘카 앱을 통해 업로드된 이미지 2000장을 대상으로 분석을 시작했다.

개발이 진행되면서 문제를 발견하고 고쳐가는 과정도 겪었다. 학습 데이터와 실제 사용자 데이터 간의 괴리가 한 예다. 촬영 가이드가 없어서, 이용자가 찍은 차량 사진이 제각각인 것이 문제였다. 어떤 사진은 차량보다 주차선이 더 크게 나왔다. 앱에 촬영 가이드를 주고, 올라온 사진에서는 차량 부분만 크롭해 계산하는 방식으로 문제를 풀었다. 방대한 계산 때문에 딥러닝 연산 속도가 저하되는 문제는 비교적 얕은 이미지 단위의 손상 여부만 판단하는 걸로 효율성을 높였다.

쏘카 데이터그룹팀이 역량을 집중하는 일은 회사의 구성원들이 요구하는 모든 것에 해당하지는 않는다. 그러기에는 인력도 부족하고, 효율도 떨어진다. 산발적인 요청에 응하는 대신 핵심 비즈니스에 집중하고, 뜬구름 잡는 추상적인 이야기보다는 즉각 액션이 가능한 일을 우선해 수익성을 개선하는 일에 집중한다는 계획이다.

[광 to the 고] 웃긴데 알찬 유튜브 채널 '스튜디오 바이라인'에 놀러오세요


김상우 그룹장은 “재미있는 데이터가 있고 흥미로운 일이 있다고 해서 ‘이거 해볼까?’ 하지는 않는다”면서 “불확실한 일 대신 ‘어떤 액션이 가능한가’ ‘즉각 실행이 가능한가’ ‘성과는 정량, 통계적으로 측정이 가능한가’ ‘실험이 올바르게 설정되었나’ 등을 본다”고 조언했다.

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network