당근의 추천시스템은 LLM 안 부럽다

혹시 5년 전 당근마켓(현재 당근)을 기억하는 분들, 계신가요? 그 당시 당근을 열면 방금 등록된 중고품이 가장 먼저 노출됐습니다. 당연히 내가 관심이 없는 물건이 많았죠.

하지만 지금의 당근은 다릅니다. 제가 관심을 가진 것들을 위주로 보여줍니다. 저의 당근 앱을 열면 매일 같이 훔쳐보던 식물이 나오거나, 개인적으로 해보고 싶었던 동네 강아지 산책 알바를 보여줍니다. 당근이 지난 5년 동안 추천 시스템을 크게 고도화했기 때문입니다.

‘추천 시스템’은 당근의 핵심이라고 볼 수 있습니다. 이용자의 위치와 취향을 파악해서 원하는 콘텐츠를 제시해야 합니다. 단순히 이용자가 관심 있을 법한 중고상품만 보여주는 것도 아니죠. 중고뿐 아니라 동네 모임, 아르바이트, 심지어 쇼츠같은 동영상까지 다양한 콘텐츠를 분석해서 이용자에게 보여줘야 합니다. 하나의 추천 시스템으로 이런 다양한 서비스를 모두 대응해야 한다는 건 쉽지 않은 일일 것입니다.

당근의 추천시스템은 이런 요구에 부응하기 위해 단계적으로 진화해왔습니다. 클릭을 많이 한 것들을 기준으로 하는 일반 추천 시스템에서 거대언어모델(LLM)처럼 진화하고 있습니다.

‘동네’라는 제약, 추천을 더 어렵게 만든다

당근은 매우 빠르게 발전한 서비스입니다. 2020년 3월 당근의 월간 활성 이용자수(MAU)는 600만명대였는데, 1년 후에는 1500만명을 돌파했을 정도입니다. 당근 입장에서 사용자가 폭발적으로 늘어나는 건 좋은 일이지만, 이용자 입장에서 보면 쏟아지는 중고상품 중에서 원하는 걸 찾아내는 일은 어려워졌습니다.

누군가는 아이의 장난감을, 또 다른 누군가는 집에서 기를 식물을 찾고 싶은데, 내 당근 앱 화면에는 보이지 않았죠. 굳이 검색이라는 과정을 거쳐야 원하는 중고품이 있는지 알 수 있었습니다. 다른 모든 플랫폼과 마찬가지로 당근도 추천 시스템에 대한 고민을 시작했습니다.

당근의 문제는 타 플랫폼에 비해 추천 시스템 만들기가 조금 더 까다롭다는 점입니다. ‘당신의 근처’라는 이름처럼, 당근 서비스의 핵심은 ‘동네’, 즉 로컬이기 때문입니다. 마냥 전국에 있는 상품을 모두 끌어다가 이용자 개인에게 맞춘다면 오히려 쉬웠겠지만, 5km 등 이용자를 기준으로 한 좁은 범위 내에 있는 상품을 모아 정교한 추천을 하는 건 난이도가 높아집니다.

또 당근이 ‘중고거래’ 뿐만 아니라 다양한 서비스를 하나의 앱에서 운영한다는 점도 한몫 합니다. 이미 2021년에 단기·생활 알바 중심의 구인구직 서비스부터 커뮤니티, 부동산 등 다양한 도메인 서비스를 운영하고 있지요. 사실상 여러 서비스의 추천 시스템을 한 번에 구축하고 운영하려 한다는 점에서 단일 도메인 서비스보다 손이 많이 가는 상황이 되었습니다.

5년간의 진화: 클릭률 모델에서 파운데이션 모델까지

당근 내부의 자체 평가에 따르면, 당근의 추천 시스템은 지난 5년간 대학생 수준에서 글로벌 빅테크 시스템 수준까지 단계적으로 진화했습니다.

2021년 9월 첫 시도 당시, 당근의 추천 시스템은 클릭률 하나만을 기준으로 콘텐츠를 정렬하는 방식이었습니다. 다만 전체 적용은 아니었고, 홈피드 내 일부 최신 영역에만 제한적으로 적용해 가능성을 살펴보았습니다.

2022년 하반기부터는 본격적으로 추천 모델의 골격을 빚어나갔습니다. 그해 8월에는 멀티 스테이지 추천 시스템을 도입해 추천의 단계를 나눠 후보를 점점 좁혀 나가는 방식으로 비용을 조절했습니다. 또 이어진 10월에는 유저와 글을 각각 벡터로 임베딩한 뒤, 인공지능 모델이 비슷한 데이터끼리는 가깝게, 다른 데이터끼리는 멀게 배치하는 ‘대조 학습’ 방식으로 콘텐츠 기반 후보 모델을 추가했고요. 12월에는 하나의 소스 코드로 여러 서비스의 랭킹을 손쉽게 설정할 수 있는 랭킹 파이프라인까지 갖춥니다.

2023년부터는 ‘클릭률 하나만으로 충분할까’라는 고민이 본격화됩니다. 클릭률만 높이려고 하면, 자극적이지만 정작 거래로는 이어지지 않는 콘텐츠가 상위에 올라올 수 있거든요.

당시 당근은 글의 최신성, 관심도, 채팅 발생 여부, 체류 시간 등을 종합적으로 반영하는 ‘밸류 펑션(value function)’을 고민하기 시작했습니다. 부정 피드백을 받은 콘텐츠는 자연스럽게 우선순위에서 밀려나도록 설계하고요. 추천 후보를 뽑는 방식도 콘텐츠 기반에 더해 인구통계학·활동 내역 기반 등으로 다각화됐습니다.

2024년부터는 중고거래의 추천 시스템을 당근 내 모든 버티컬 서비스로 확장하는 작업을 진행했습니다. 어떤 서비스에 들어가더라도 최적화된 추천 경험을 누릴 수 있도록 범용성을 확보한 시기입니다.

또 지난해에는 단순한 콘텐츠 매칭을 넘어 ‘지역(Local)’ 그 자체를 데이터로 이해하는 추천 시스템 고도화에 주력해왔고요.

올해의 미션은 크게 두 가지입니다. 먼저 세렌디피티, 즉 우연한 발견 경험을 함께 한 추천 시스템을 완성할 계획이고요. 다른 하나는 서비스 전반을 아우르는 파운데이션 모델 개발입니다.

파운데이션 모델로의 전환, 무엇이 달라지나

당근의 추천 시스템의 미래 목표는 거대 파운데이션 추천 모델입니다. 추천 시스템의 핵심 모델을 LLM처럼 크게 키워 모델 기능과 추천 품질을 고도화하는 방식입니다.

미래 전략에 맞춰 변화도 준비하고 있습니다. 지금은 이용자가 들어오는 순간 연산해, 실시간 체계로 추천하고 있습니다. 하지만 파운데이션 거대 모델로의 전환을 위해서는 모델의 규모를 고려해 연산 효율을 최적화야 합니다. 최대한 실시간에 가까운 ‘준실시간 서빙’이 가능하도록 아키텍처를 변경할 계획입니다. 모델 규모로 인해 실시간성에는 조정이 필요하지만, 기존보다 방대한 정보와 패턴을 학습할 수 있다는 점에서 모델 성능과 추천의 품질을 보다 높이는 방향성을 택했습니다.

당근은 조직 측면에서도 운영 방식의 효율화를 추구하고 있습니다. 먼저 공통 프레임워크와 ML 플랫폼 구축입니다. 여러 서비스를 운영하고 있는 만큼, 인력을 각 서비스에 분산 배치하기보다 하나의 플랫폼 위에서 인프라 효율을 높여 전체 서비스의 커버리지를 확보하는 구조를 확보했습니다.

또 장기 검증 중심의 문화도 운영하고 있습니다. 단기 지표보다는 장기 실험을 통해 이용자의 행동 변화와 서비스 개선 등을 여러 방법론으로 검증하는 방식입니다. 정교함이 요구되는 서비스 등에서도 고도의 설계 과정 자체가 빠른 이터레이션(Iteration)을 통해 이루어질 수 있도록 환경을 구축하고 있습니다. 자원 측면에서도 GPU·TPU 등 대규모 연산 하드웨어와 최신 AI 도구·플랫폼을 제약 없이 활용할 수 있도록 하고 있지요.

물론 추천 모델에도 LLM을 다방면으로 씁니다. 추천 모델 학습에 쓰여질 재료를 만들거나 추천 알고리즘 자체로도 일부 활용하고, 추천 개선을 위한 이터레이션에도 쓰고 있습니다.

최근 당근 ML팀이 로컬 특수성을 살려 이용자 경험 가능 범위 내 학습데이터를 모델링한 내용을 담은 연구논문은 정보검색 분야에서 권위가 최상위권인 ‘SIGIR 2026’에 제출, 최종 채택된 상황이기도 합니다. 거대 파운데이션 추천 모델을 개발하기 위한 시도이기도 합니다.

당근은 향후 파운데이션 모델과 에이전트(Agent) 기반 자동화 기술을 적재적소에 활용해 한정된 인원으로도 글로벌 빅테크 수준의 추천 시스템을 구축할 계획입니다. 특히 에이전트 자동화는 단순한 태스크 자동화에 그치지 않고, 추천 시스템 개선 작업을 스스로 반복 수행하면서 실제 비즈니스 효과를 창출해 내는 것을 목표로 합니다.

클릭률 하나로 시작했던 당근의 추천 시스템은, 5년 만에 ‘동네’라는 제약을 강점으로 바꾸는 단계까지 올라섰습니다. 파운데이션 모델로의 전환이 성공한다면, 당근은 로컬이라는 좁은 반경 안에서 가장 정교한 발견 경험을 만들어내는 플랫폼이 될지도 모릅니다. 올해를 마무리할 때, 당근의 추천 시스템은 어떻게 바뀌어있을까요?

글. 바이라인네트워크
<성아인 기자> aing8@byline.network