우리나라에 카카오톡과 이를 기반으로 한 카카오페이가 있다면, 일본엔 라인과 라인월렛이 있다. 라인은 일본에서 총 6000만명의 사용자를 보유하고 있는 국민 메신저이자, 핀테크 서비스다.

라인 메신저에는 라인월렛 서비스가 있다. 라인페이 서비스와 함께 쿠폰, 마이카드(멤버십카드), 포인트, 지라시 서비스(모바일 전단지)를 제공한다. 라인은 월렛에 사용 확률이 높은 순서대로 서비스를 예상해 화면 상단에 보여주는 모듈을 적용했다.

그렇다면 사용 확률이 높은 서비스는 어떻게 고르는 것일까. 흔히 쓰이는 추천시스템인 행동기반 예측 알고리즘을 사용한다. 사용자들의 행동 로그를 모아 분석해 유사한 패턴 사용자들을 묶어 알고리즘에 입력한다. 따라서 과거 사용자들의 행동 로그를 바탕으로 다음엔 무엇을 할 것인지 예측하고 추천한다.

그러나 추천은 일반적인 머신러닝과 다른 기법이 필요하다. 데이터에는 언제나 비밀이 있다는 것이 회사 측의 이야기이다. 김경민 네이버 클로바부문 리더는 “데이터 자체로는 팩트가 되지 못한다. 데이터 속의 진실을 파악해야 한다”고 강조했다.

그에 따르면, 라인월렛 사용자들 50%는 상단에 위치한 첫 번째 서비스(모듈)를 클릭한다. 이 서비스가 쿠폰이든, 포인트든 상관없다. 하단으로 갈수록 클릭률(사용률)은 줄어든다. 단지 상단에 있어 접근성이 좋다는 이유만으로 클릭을 한다는 것이다. 이때 하단의 서비스는 사용자 로그의 양이 비교적 적다.

따라서 이 상태에서 머신러닝 모델을 학습하면 첫 번째 서비스의 사용자 로그가 훨씬 많기 때문에 “사용자들이 첫번째 서비스 OO를 가장 좋아한다”는 잘못된 결과가 나올 수 있다.

김경민 리더는 “추천시스템뿐만 아니라 이미지인식, 챗봇 등의 머신러닝 모델은 이러한 패턴을 결과로 보여주는 경향이 있다”며 “위치에 따른 이점을 보정하지 않으면, 더 나은 서비스 배치(모듈) 순서를 놓치게 된다”고 전했다.

이를 해결하기 위한 라인의 조치는 간단했다. 사용자의 행동로그 중에서도 노출 대비 클릭률에 더 높은 점수를 줬다. 라인은 클릭률을 사용자가 관심을 가지고 의도적으로 콘텐츠를 보는 진짜 데이터라고 판단한 것이다. 따라서 클릭률에 부가점수를 주는 방식으로 알고리즘을 입력, 클릭률이 높은 데이터를 중심으로 살펴볼 수 있다.

김 리더는 “단지 이 방법 하나만 사용했음에도 불구하고, 성능이 많이 달라졌다”고 말했다. 그에 따르면, 올해 1월 대비 5월 기준으로 라인월렛 모듈 클릭률이 이전(22%)보다 약 3배 올랐다.

실제로 적용해보니…코로나19 여파 해결

라인월렛 서비스 가운데 사용자들은 할인쿠폰을 가장 많이 사용한다. 그러나 올해 3월 쿠폰, 마이카드 사용자의 수가 눈에 띄게 줄었다. 라인이 분석한 결과 주로 오프라인에서 사용하는 두 서비스 특성상, 코로나19의 여파로 사람들이 외출을 하지 않게 되면서 사용이 줄어든 것이다.

반면, 포인트 서비스 사용률은 늘었다. 온라인에서 사용할 수 있어 집에 있는 사람들이 늘어나면서 사용자 수가 급격히 증가하게 된 것이다. 머신러닝 분석을 통해 라인은 상단에 포인트 서비스를 두고, 하단에는 주로 오프라인에서 사용하는 쿠폰, 마이카드, 지라시 서비스를 순서대로 배치했다.

라인은 이러한 방식의 추천 영역을 확장하고 있다. 라인 타일랜드, 라인 타이완, 라인 파이낸셜, 라인 봇 쿠폰 등 7개 서비스에 확대해 적용할 계획이다.

글. 바이라인네트워크
<홍하나 기자>0626hhn@byline.network