배달의민족이 GPT를 활용하는 방법

‘챗GPT 같은 생성AI 기술, 우리 회사에서도 활용할 방안이 있을까?’

현대의 많은 기업들은 생성AI 활용법에 대해 고민을 하고 있다. 보통은 해결하고 싶은 문제가 있을 때 그 방안으로 특정 기술이 활용되는데, 생성AI 기술은 문제를 정의하기 전에 어디에 사용하면 좋을지 고민하게 되는 것이다. 챗GPT 등장 이후 세상이 들썩거리다 보니 벌어지는 현상이다. 가능성은 무긍무진하다는 평가를 받지만 기업들은 아직 딱히 생성AI 활용처를 알지 못하는 상황이다. 이 때문에 많은 기업이 이 기술로 무엇을 할 수 있을지 고민하면서 여러가지 실험을 해보고 있다.

배달의민족을 운영하는 우아한형제들(이하 배민)도 마찬가지다. 배민 역시 생성AI로 자사의 서비스를 혁신할 방안에 대한 실험을 하고 있다.

15일 서울 삼성동 그랜드인터콘티넨탈 호텔 파르나스에서 열린 배민의 개발자 커퍼런스 ‘우아콘 2023’에서는 그 실험의 첫번째 결과물이 소개됐다.

배민의 첫 생성AI 실험은 AI가 이용자의 상황(Context)에 맞는 메뉴와 가게를 추천하도록 하는 것이다. 메뉴와 음식점을 정하지 않고 배달앱을 켜는 이용자들이 많다는 사실에 착안했다. 배달앱 이용자들은 자신에게 좋은 메뉴와 품질 좋은 음식점을 찾고 싶어 한다. 기존에는 내부 직원이 정해 놓은 규칙에 따라 메뉴가 추천됐었는데, 생성AI가 이를 대신할 수 있는지 평가하는 것이 배민의 첫번째 실험이다.

또 명확한 음식종류나 가게명을 입력하지 않고 상황만 넣어도 AI가 적당한 음식을 추천해주는 검색도 만들었다. 예를 들어 배민 검색창에 ‘여행’ ‘비오는 날’ ‘퇴근 후’ 정도만 입력해도 여행에 어울리는 음식, 비오는 날 어울리는 음식, 퇴근 후 먹기 좋은 음식 등을 추천하는 식이다.

중요한 건 각 상황에 어울리는 음식과 음식점이  무엇인지 판별하는 기준이다. “퇴근 후 먹기 좋은 음식”이라는 판단은 어떤 기준으로 할 수 있을까?

배민은 이 판단을 위해 리뷰 데이터를 활용했다. 이용자는 리뷰를 작성할 때 단순히 “맛있어요” “맛없어요” 정도만 입력하는 것이 아니라 자신의 상황을 함께 남기는 경우가 많기 때문이다. 예를 들어 “퇴근길에 스트레스 받아서 떡볶이 시켰어요. 스트레스 확 풀리네요.”라는 식이다. 이런 데이터를 학습해서 이용자의 상황에 맞는 메뉴와 가게를 추천해줄 수 있다.

배민은 이를 위해 오픈AI의 GPT-4를 활용했다. 마이크로소프트 애저가 제공하는 GPT-4 API를 활용한 것이다. 처음에는 GPT-3.5 이용했는데, 그때는 아무리 파인튜닝을 열심히 해도 원하는 결과가 나오지 않았다고 한다. 그러나 GPT-4 API가 공개되면서 문제가 해결됐다고 한다.

서비스 특성상 풀어야할 난관도 있었다. 배민의 경우 표시광고법을 위반하면 안되는데 GPT가 자꾸 없는 사실을 만들어내는 경우가 있었다. 예를 들어 ‘국내산 소고기’라는 표현이 아무런 근거 없이 생성되는 경우가 있는 것이다. 심지어 배민 서비스에 “요기요 이용자가 사랑하는”이라는 표현이 들어가기도 했다고 한다.

배민 측은 이런 문제를 없애기 위해 10차례에 걸친 프롬프트 엔지니어링을 진행했고, 그 결과를 3개 팀이 4차에 걸쳐 다시 검수를 했다. 그 결과 이제는 사람이 쓰는 것과 크게 차이나지 않는 수준의 UX 글쓰기를 할 수 있게 됐다고 회사 측은 평가했다.

다만 극복하지 못한 한계도 있다. GPT가 생산하는 문장이 번역투에 가까워서 이용자들에게 약간의 거부감을 일으켰다. 이 때문에 배민은 네이버의 하이퍼클로버X 등 다른 파운데이션 모델도 함께 검토해갈 방침이라고 전했다.

이 프로젝트를 진행한 오혜진 우아한형제들 GPT서비스팀 팀장은 “생성AI 기반의 서비스가 안정정적으로 안전하게 돌아가도록 하기 위해 많은 고민이 필요했다”면서 “생성AI의 인풋과 아웃풋에 가드레일을 설치해 두고 법률위반은 없는지, 환각현상은 없는지 고민을 계속하며 생성AI 활용방법을 연구하고 있다”고 말했다.

배민의 생성AI 추천은 지난 10월부터 서울 송파구에서 실제 이용자들을 대상으로 시범 운영 중이다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

관련 글

2 댓글

  1. Gpt와 자주 연관되는 Ai 쪽 개발자로서 이런 솔직한기사 감사합니다.
    솔직히 맨날 다된다 개쩐다 식의 기사만 남발 되다 보니 고객들이 왜 다된다면서 안되요 당신들이 모르는거 아니냐 식의 말을 듣게되는데
    솔직히 3.5 때 테스트 하려해도 프롬프트가 안잡혀서 욕나올 때 많았다

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다