[IT TMI] 카카오택시는 데이터를 품고 달린다

이 기사는 바이라인네트워크가 운영하는 팟캐스트  IT TMI의 9월 23일 방송 내용입니다.

남혜현: 안녕하세요. IT Too Much Information, IT TMI에 오신 걸 환영합니다. 저는 진행을 맡고 있는  바이라인네트워크 남혜현이고요,

심스키: 네 여러분 안녕하세요, 심스키입니다. 반갑습니다!

남혜현: 카카오모빌리티라고 아시죠?

심스키: 제가 지금 여기에 운전하고 오면서 카카오모빌리티 카카오티 앱을 열어서 카카오내비를 찍고 왔어요. 생활에서 가장 많이 실행하는 앱 중 하나예요.

남혜현: 저도 택시를 많이 타는 편이라서 카카오택시를 많이 이용하거든요, 이 카카오티 – 카카오택시를 운영하는 카카오모빌리티가요 일년에 한 번씩 ‘모빌리티 리포트’를 만들고 있거든요. 그래서 이걸 왜 만드는지, 만드는 분을 직접 모셔서 이야기를 들어보려고요. 오늘 김건우 카카오모빌리티 수석이코노미스트님 모셨습니다. 어서오세요.

김건우: 네, 안녕하세요

심스키: 직함이 너무 멋있는 거 아닙니까? 수석 데이터 이코노미스트인거죠?

김건우: 보통 수석이라고 부르시고요(웃음)

남혜현: 데이터 이코노미스트라고만 들으면 어떤 일을 하시는지 잘 모르니까 자기 소개를 먼저 좀 부탁드릴게요

김건우: 예, 안녕하세요? 저는 카카오모빌리티 디지털 경제연구소에서 일하고 있는 김건우라고 하고요. 현재 수석 이코노미스트를 맡고 있고, 여기에서는 모빌리티 데이터를 통해서 정책과 경제를 분석을 하고 연구하는 일을 맡고 있습니다.

심스키: 보통 데이터 이야기를 하면 애널리스트라는 표현을 쓰는데 이코노미스트라고 하는 게 특이한 것 같아요.

김건우: 데이터 이코노미스트는 아마 우리나라에서는 처음 만들어진 일자리가 아닐까 싶은데요, 보통 보면 데이터 사이언티스트, 엔지니어로 알고 계실텐데, 데이터 이코노미스트는 데이터 분석을 기본으로 하는데 아웃풋이 주로 정책이나 경제에 관련한 것이라고 보시면 될 것 같습니다. 그래서 경제 연구소에서 하는 일들에 데이터가 많이 접목되어 있다고 보시면 됩니다.

심스키: 카카오모빌리티 안에서 자동차 관련한 데이터를 가지고 경제를 보는 거군요?

김건우: 자동차 뿐만 아니라 여러 모빌리티 서비스를 하고 있는데 그런 것이 결국은 사회와 일상의 변화를 많이 잘 보여주는 데이터입니다. 국가적으로 봤을때는 통계청에서 분석하는 것처럼 저희는 모빌리티 데이터를 가지고 경제와 정치분석을 하고 있다고 보시면 될 것 같습니다.

남혜현: 이 모빌리티 데이터가 종국에는 카카오의 다른 계열사에서도 가져다 쓸 수도 있는 내용들이겠네요?

김건우: 아직까지는 제한적인 사항인데 궁극적으로는 카카오 뿐만 아니라 외부에서도 가져다 쓸 수 있는 길이 나오지 않을까… 특히 요즘에는 데이터3법 이후로 그런 논의를 하고 있는데요, 그런 것들이 자리를 잡으면 가능하지 않을까 생각합니다.

지난 9월 카카오모빌리티가 발간한 ‘카카오모빌리티 리포트 2020’.

남혜현: 리포트 때문에 오늘 모셨으니, 이 리포트에 주로 어떤 내용이 담기는지를 알려주시면 좋겠어요.

김건우: 저희가 리포트를 발간한지 2017년부터 해서 네번째 발간하고 있거든요. 올해는, 구글이나 애플 같은데서도 코로나19로 인한 모빌리티 데이터 분석을 내고 있기도 합니다. 이런 것들이 왜 되고 있느냐를 보면, 결국 현대 생활의 모든 것이 이동에 기반해서 – 대면이든, 물류로 사물 이동이든, 유튜브나 팟캐스트 등을 통한 정보의 이동이든 – 이뤄지고 있다고 볼 수 있을텐데 그중에서도 사람의 이동에 대한 데이터가 현대사회의 인사이트를 담고 있다고 볼 수 있습니다. 그 데이터로 인해 사회의 변화 모습, 일상의 변화, 기술의 변화를 보여주고자 하기 위해 매년 발간을 하고 있습니다.

심스키: 그러면 올해 발간된 리포트의 내용에 대해, 저 같은 사람의 입장에서는 작년과 뭐 달라질게 있겠어? 이동이라는게 비슷 할 것 같은데 매년 내놓나, 이런 생각을 할 수 있는데요. 올해 새로운 변화는 무엇이 있을까요?

김건우: 매년 준비를 하면서 고민을 합니다. 없던 것을 새롭게 찾아내는 게 분명히 필요한 일이기 때문에요.  그런데 올해는 특히나 준비를 하면서 과거와 다른 부분을 많이 담을 수 있었는데요, 대표적으로 이때까지는 핫플레이스, 서울에서 가장 많이 방문한 지역, 부산에서 방문한 식당 같은 걸 뽑아서 데이터를 많이 가공을 해드렸는데,

남혜현: 맛집 지도네요(웃음)

김건우: 예(웃음). 그런 식으로 볼 수 있는데요. 어디를 가면 좋을까, 관광지도 분석할 수 있고요. 그런데 그런 부분을 올해는 부록으로 처리해버렸습니다. 대신에  저희나 독자, 서비스 이용자, 정책가가 궁금해할 부분을 주제로 잡아서 서른가지 정도로 정리했습니다. 차차 말씀 드리겠지만, 여러 주제에 대해 데이터로 가설을 검증해 본거라고 보면 되시겠습니다.

남혜현: 올해 서른개 주제 중에서 가장 핵심이라고 볼 수있는게 뭐가 있을까요?

김건우: 관심사에 따라 다르겠지만, 대표적으로 뽑자면 외부 기관과의 공동 연구를 했습니다. 저희와 외부 데이터를 합쳐서 한 연구인데, 대표적으로 한국 교통 안전공단하고 ‘안전속도 5030’이라는 캠페인이 있습니다. 기존의 60km/h 속도제한이 있던 도로를 50km/h 로 제한을 시키고 대신에 신호 연동을 해서 통행 속도를 개선시키고자 하는 캠페인인데 실제 이것이 효과가 있었나를 데이터로 분석을 해봤는데,

남혜현: 어떤가요?

김건우: 재미있게 나오더라고요. 단순히 제한속도만 줄이는게 아니라 신호를 연동시키는게 묘미가 있었는데, 예를 들어 새벽에는 교통량이 없으니까 빨리 다니시는 분이 많지 않겠습니까? 시행전과 후를 보면 새벽 시간대에 속도가 확실히 많이 줄었거든요. 통행 속도가 줄었으니까 나쁜게 아닌가 할 수 있는데 반대로 보면 출퇴근 시간에는 통행 시간이 개선된 게 있더라고요. 왜그런가 보니 소위 ‘유령정체’라고 보는, 운전자가 가면서 차선을 바꾸거나 신호를 보고 잠시 멈칫 거릴 때 작은 지체가 쌓이면 교통정체가 일어나는데 그런 것을 많이 해소를 했다고 하더라고요. 그 결과로 출퇴근 시간의 통행속도는 개선되고 심야 시간대는 과속 차량이 줄게 되는 효과를 저희가 확인했던 것이 재미있었습니다.

심스키: 그런 정책들을 실현하기 위해서 이 신호는 몇분부터 몇초까지 가야 한다, 이런 걸 정할때 카카오모빌리티의 데이터가 활용되진 않나요?

김건우: 이번에는 결과를 검증하는 차원에서 협동연구를 한 거고요. 그 부분은 사전에 연구된 걸 가지고 구간마다 적용한 걸로 알고 있습니다.

심스키: 그런 데이터는 어떻게 얻는 건가요?

김건우: 이번에 5030으로 본거는 내비 데이터를 활용한건데요, 촘촘히 속도를 측정하고 있습니다. 일반적으로 속도를 측정한다고 봤을 때는 도로 위 설치된 센서를 통과한 속도를 측정하는데, 센서를 전국에 깔 수는 없는 문제이지 않습니까? 카카오내비를 이용하는 분들의 이용 데이터 결과가 실시간으로 누적되는 게 속도 검출하는 거라고 보면 될텐데 저희는 그걸 더 촘촘하게 누적을 하도록 바꿔서 실제로 세밀하게 속도 분석을 할 수 있는,

심스키: 그럼 제가 달리고 있는 동안의 속도를 카카오가 계속 수집을 한다는 거네요?

김건우: 저희 서비스의 결과로서 데이터가 쌓이는 것이기 때문에, 그 데이터를 통해 목적지까지 시간이 얼마나 남았다, 이런 결과를 표시하기 위해서는 데이터가 분석이 되어야 하는 거고요. 그런 차원으로 저희가 수집하는 데이터를 모아서 봤다고 보시면 될 것 같습니다.

남혜현: 개인 식별 분석은?

김건우: 그건 현재로서는 안 되는 겁니다.

남혜현: 올해 나온 보고서에서 가장 궁금한 것 중 하나가 코로나 이후에 변화된 상황이 있는지인데요. 그게 보고서의 핵심 중 하나라고 들었어요/

김건우: 올해 토픽이라고 하면 코로나를 이야기 안 할 수 없죠, 저희가 특집으로 다루긴 했습니다. 코로나 초반에 많이 분석된 결과를 보면 코로나 때문에 이동이 멈추었다, 이정도에서 멈추는 분석이 많았거든요. 저희는 분석 시작은 3월 이후로 했고 결과가 8월 이후로 나왔는데, 저희가 봤을 때 코로나가 짧은 기간이지만 기간 구분이 가능한 걸로 나오고 있더라고요.

코로나가 발생했음에도 불구하고 전년하고 별다른 차이가 없었던 기간, 이 기간을 1기라고 설정했습니다. 대구 지역 감염이 확대되기 전이라고 보시면 될 것 같은데요. 1월 20일 쯤 첫 확진자가 나왔고 이후 설날도 있었지만 코로나로 이동에 대한 변화는 없었습니다. 대구 사태 이후로 확실히 이동에도 영향을 미치기 시작했고요.

그래서 2월 말 3월 초에 급격하게 이동이 중지되는 모습을 봤습니다. 동시에 그 기간에는 빠르게 이동이 회복되는 시기이기도 했습니다. 4월 말 5월 초에 있던 어린이날, 노동절에는 전년보다 더 이동을 많이 하는 모습을 보였습니다. 그 이후에 물류센터라든지 이태원 발 감염이 터지면서 새로운 변화에 대해 많은 분들이 적응하지 않았나. 처음에는 코로나가 별 문제가 아니라고 생각했다가, 이게 큰 문제라고 반응했다가, 빠르게 회복했다가 이제는 새로운, 이게 빨리 끝나진 않겠다고 생각하시는.

앞서 말씀드린 변화가 없던 시기가 1기,  빠르게 변했던 시기가 2기, 그다음에 새로운 단계에 접어든게 3기라고 분석해봤습니다.

심스키: 그러면 3기라는 거는 전반적으로 과거보다 이동량은 줄었지만 크게 변화가 없는 상태인가요?

김건우: 오히려 3기가 재미있는게 저희가 내비게이션 데이터로 보게 되면, 저희 데이터는 아니지만 공공 데이터를 보면 대중교통은 굉장히 많이 줄었습니다. 지금까지 서울 지하철만 하더라도 9월까지 전년 대비 25% 줄어들었고요. 최대로 보면 거의 40~50% 이상 감소를 한 상황입니다. 회복한 것이 평균 26% (줄은 것으로) 나왔습니다.

남혜현: 기존에 대중교통을 이용한 사람  열명 중 두세명이 안 쓴다는 이야기잖아요.

김건우: 그렇죠. 굉장히 큰 거라고 볼 수 있을 것 같고. 반면에 자동차 이동 데이터로 포착할 수 있는 내비게이션 데이터를 보면 3기에 전년 대비 (사용량이) 꾸준히 초과를 했습니다. 최근에 광복절 이후 확진자가 많아졌을 때 (자동차 이용이) 급격하게 하락한 모습인데 전체적으로 봤을때는 전년 대비 오히려 더 이동을 많이 하는 모습입니다. 대중교통은 많이 기피하고 자차로 이동하는 분은 더 많아지지 않았나,

남혜현: 재택하거나 자차거나 이렇겠죠.

심스키: 그러면 카카오모빌리티같은 회사는 승차공유가 활달해야 비즈니스가 커지는 건데, 자차가 많아지면 비즈니스에 별로 안 좋겠네요?

김건우: 그런데 내비게이션 데이터를 보면, 단순히 자차 이용자 데이터만 수집되는 것이 아닙니다. 카카오의 모든 모빌리티 서비스가 저희 내비를 이용하고 있거든요. 카카오택시를 이용하실 때 경로가 카카오내비로 인해 카운팅이 되고 있고 대리나 주차, 카카오맵 같은 관련 회사들의 서비스도 저희 내비 데이터를 이용하므로 그런 서비스 데이터가 포함된다고 보시면 될 것 같습니다. 카카오택시만 하더라도 3기에 전년 대비 많이 이용을 하는 걸로.

심스키: 그래요? 요즘 보도를 보면 택시 기사님들이 많이 힘들다고 나오던데요.

김건우: 빠질 때는 확실히 빠졌었는데 전반적으로 언택트 트렌드이다보니 호출을 통해 자동결제를 하는 서비스를 많이 이용하시지 않는가 보고 있습니다.

심스키: 자동결제 이용자가 늘어난 거예요? 아니면 전체 택시 이용자가 늘어난 거예요?

김건우: 전체 택시 이용자는 배회까지 봐야 하므로, 서울시 데이터로 봤을때는 배회택시까지 보면 감소한 걸로 알고 있고요. 그부분은 정확하게 확인을 해봐야 할 것 같습니다.

남혜현: 이 모빌리티 데이터들이 카카오 서비스 기획에 직접 사용된 경우가 있나요?

김건우: 데이터를 안 쓰고는 기획과 운영이 안 된다고 보시면 될 것 같습니다. 모든 기획자나 개발자, 운영자가 기본적으로 데이터에 대한 리터러시 능력을 갖고 있습니다. (이분들이) 데이터 분석가나 과학자, 머신러닝 모델러들과 긴밀하게 협업을 하고 있습니다. 데이터 기반의 의사결정이 일반화되어 있다고 보시면 될 것 같고, 그렇게 나온 모델이 카카오대리에서 적용하는 AI추천요금제 같은 것이 있습니다. 그 경우에는 결국 데이터를 통해 가장 최적의 요금을 제시한 거죠.

심스키: 또 궁금한게 있다면, 카카오모빌리티가 우리나라 모든 데이터를 갖고 있는 건 아니잖아요. 어떤 기사님들은 상대적으로 젊은 사람들이 탄다, 상대적으로 술을 덜 마시는 사람이 탄다는 이유로 카카오대리를 선호한다고 하는데요(웃음). 그런데 이건 특정 계층이라는 뜻이잖아요. 이걸로 사회전체를 분석하거나 경제 전반을 분석하기에는 너무 한 계층이나 한 부분의 데이터가 아닐까 하는 생각이 들더라고요.

김건우: 저희가 전수 데이터는 아닐 수 있는데요, 통계청도 대부분 샘플로 만들어 데이터를 작업하고 추정하는데, 그런 측면에서 봤을 때 저희가 확보한 데이터가 샘플 측면에서는 넘치는 양이 될 거라고 보시면 될 거 같습니다.

심스키: 양은 넘치지만 계층이 편중되어 있지는 않을까요?

김건우: 그런 부분은 분석 시에 감안을 할 수 있는 문제고요. 그렇지만 저희 서비스가 지역별로 보편화가 되어 있는 상황이고 전반적으로 대리운전 시장의 흐름을 볼 때는 충분히 의미 있는 인사이트를 줄 수 있기 때문에 그런 부분이 크게 문제는 없다고 보시면 될 것 같습니다.

심스키: 예를 들어 티맵 이용자는 주로 SKT 유저가 많다는 차이가 있잖아요. 그런 차이에서 오는 다른게 있지 않을까, 하는 생각을 해봤거든요.

김건우: 네, 그런거는 분석을 좀 해볼 수 있지 않을까 싶습니다. 저희가 가진 데이터의 크기라는 것이 보면, 이번에 서울디지털재단하고 분석한 주차 데이터만 해도 기본적으로 1억건이 넘어가거든요. 그런식으로 본다면 우려했던 빠질 수 있는 데이터의 부분이 메꿔지고도 충분히 남을 수 있는 양인 경우가 많습니다(웃음). 단순히 서베이가 아니라 실시간으로 누적되어 만들어진 데이터다 보니까 모빌리티 데이터에서는 (편향성이) 많이 희석된다고 볼 수 있습니다.

심스키: 디지털경제연구소에서 만들어진 여러 보고서나 분석의 목적이 카카오모빌리티의 비즈니스를 위한 것이라고 보면 될까요?

김건우: 복합적이라고 보시면 될 것 같습니다. 데이터를 가지고 경제적으로 분석하는 곳이 별로 없지 않습니까. 이런거를 사회적 영향이나 정책 시사점을 특별히 뽑아낼 수 있다는 거는 저희가 가진 차별점이고요. 그런 부분들이 저희 내부의 협업을 통해 서비스 개선에도 반영될 여지도 충분히 있고요.

심스키: 최근에 이 보고서를 통해서 해결해야 할 문제라고 파악된 부분이 있을까요?

김건우: 단거리 승차거부 문제였습니다. 특히 피크 시간대- 출퇴근 시간이나 심야 시간대- 단거리는 수요가 많은데 기사님이 기피했는데요, 그런 부분이 굉장히 많이 개선된 걸로 나타납니다. 왜 그러나 보니까 단거리가 택시 이동에 많은 부분을 차지하는데, 기사님들 입장에서는 요금이나 이런 부분에서 기회가 한정적이므로 더 좋은 콜을 기대하는 환경이었던 거죠. 이런 부분을 해소하기 위해서 ‘스마트 호출’ 같은 서비스를 도입했고 ‘자동 배차’도 있고요. 스마트 호출은 단순히 가까운 기사님에게 콜이 가는게 아니라 서비스 이용료는 있지만 머신러닝 통해서 수락을 더 잘 할 것 같은 기사들과 매칭을 시켜주는 거죠.  예를 들어 이 기사님이 약간 떨어져 있더라도 평소에 종로에서 강남으로 자주 가는 분이라면 그쪽으로 콜이 가는 그런 구조죠.  자동배차도 기사님이 콜을 선택하는게 자동으로 배차가 되니까 승차거부가 줄어드는 부분이 있습니다.

심스키: 플랫폼 택시가 도입되면서, 각 타입 중 플랫폼 운송사업자 영역이 비어 있는데 데이터 분석을 하시면서 카카오가 이 사업을 하는게 가능성이 있다고 보시나요?

김건우: 이 부분은 모든 가능성은 열려 있다고 보시면 될 것 같고요. 그런 부분은 저희도 보면서 준비를 하고 있는 상황이고요. 타입1 말씀을 하셨지만, 그건 미국에 있는 TNC(transportation network company)랑 비슷한데요. 그런데 TNC랑 승차공유랑은 다른 부분이 많거든요. 상업용 차량만 이용한다는 제약도 분명히 있고요. 여러 차이가 있으므로 그런 걸 살피면서 보고 있고요. 아직 구체적으로 시행령이 정해지지 않았으므로 그런 것이 어떻게 결정되느냐에 따라 그 부분에 어떻게 할 건지 결정할 걸로 보입니다.

남혜현: 앞으로 국내 모빌리티 생태계의 변화에 대해 전망 부탁드립니다.

김건우: 일단 코로나가 변화를 만드는게 분명히 있는 것 같습니다. 대표적으로 승차 공유가 발달하는게  글로벌 차원으로 봤을 때, 미국이나 동남아가 대단히 주목을 많이 받고 있거든요. 사람의 이동이 줄어들고 불특정 다수가 만나야 하는 부분에 대한 우려가 많아서 승차공유보다는 배달쪽으로 집중하는 일들이 있지 않은가 싶습니다. 대표적으로 우버가 그 방향으로 가고 있고, 동남아의 그랩이라든지 중국의 디디추싱 같은 대부분 모빌리티 기업이 배달로 가는 방향이 하나 보이고요. 향후 승차공유의 돌파구로 볼 수 있는 자율주행이 상용화되기 전에는 배달 부분에 집중을 할 것 같고요.

반면에 국내는 승차공유가 활성화되지 않은 상황이고 (못 하도록) 제도가 짜여져 있어서. 코로나 이후 택시 이용은 회복을 많이 한 상황이고요. 해외랑은 다른 흐름이 나타날 수 있다고 보고, 조금 더 지켜봐야 할 것 같습니다.

또 하나의 변화라고 할 수 있는게 대중교통의 문제가 부각이 되지 않을까 싶습니다. 대중교통의 매출 부분에 타격이 있을텐데 방역비용이 발생을 할 거거든요. 지자체나 정부가 경제회복을 위해 재원을 우선순위에 투입하고 있는데, 대중교통은 공공지원을 많이 받았던 부분이ㅏㅓ고 부채도 많이 누적되어 있는데 이런 부분이, 우리나라 뿐만 아니라 미국 유럽도 다 마찬가지거든요. 그런 부분이 대중교통의 큰 변화를 요구하지 않을까.

대중교통은 많은 사람들을 한 번에 많이 이동시키는 걸로 주목 받았는데 지금의 코로나 시대와는 대척점에 있는 이도수단이라고 볼 수 있어서요. 코로나가 장기화된다면, 지자체나 정부가 이 부분에 대한 고민이 깊어지지 않을까. 이 문제를 해소할 대안을 고민하지 않을까 생각하고 있습니다.

남혜현: 네, 시간 내어 나와주셔서 고맙습니다.

김건우: 고맙습니다.

**  더 자세한 내용은 기사 상단의 링크를 클릭하거나 팟캐스트 채널인 팟빵과 오디오클립에서 ‘IT TMI’를 검색해 들어주세요! 고맙습니다.

첫 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다