[바스리] 챗봇 만들던 스타트업이 ‘자동 번역 블로그’로 승부 건 이유

이라인네트워크에서 타트업을 뷰합니다. 줄여서 ‘바스리’. 투자시장이 얼어붙어도 뛰어난 기술력과 반짝이는 아이디어, 새로운 비즈니스 모델을 가진 스타트업은 계속해 탄생하고 있습니다. 세상을 깜짝 놀라게 하겠다고 출사표를 던진 이들을 바이라인의 기자들이 만나봤습니다.

꿈많은청년들은 원래 ‘챗봇’을 만들던 스타트업이다. 그런데, 아이러니하게도 챗봇이 널리 쓰이면서 챗봇 회사들에 위기가 찾아왔다. 챗봇을 만드는 일이 더 이상 특정 기업만 할 수 있는 어려운 일이 아니게 된 것이다. 꿈많은청년들은 고민했다. 앞으로 우리는 무엇을 먹고 살 것인가.

고민의 실마리는 의외의 곳에서 풀렸다. 신혼여행을 다녀온 회사 대표가 자신의 여행담을 블로그로 옮기다 세계 각국의 언어로 자동 번역되는 서비스가 필요성을 발견한 것. 번역 플랫폼이 아무리 잘 나와 있어도, 세계 여러나라 언어로 전부 다 일일이 바꾸는 것은 꽤나 번거롭고 어려운 일이다. 나는 그냥 우리 말로 블로그 하나 썼는데, 세계 사람들이 와서 다 각자 자기나라 말로 자연스럽게 읽을 수 있게 한다면, 사람들이 많이 모이지 않을까?

자동 번역 블로그 ‘두루미스’는 그렇게 태어났다. 엔지니어들이 모인 회사에서 ‘번역’이란 숙제는 쉽지 않았는데, 정민석 꿈많은청년들 최고기술개발자(CTO)는 태어나서 이렇게 인문사회 영역 도서를 많이 읽은 것은 처음이라고 했다. 더 자연스러운 자동 번역 품질을 만들어내려면 AI 모델이 일을 잘 할 수 있도록 정확한 지시를 내려줘야 하기 때문이다.

번역 숙제를 떠않고 번역 오류를 잡느라 밤낮 없다는 정민석 CTO를 최근 합정동에 위치한 . 한카페에서 만났다.  “챗봇을 만들 때만 하더라도 이게 될까 싶었는데, 자동 번역 블로그를 시작하면서는 이건 되겠다는 확신이 생겼다”는 그에게 블로그로 글로벌 시장을 공략할 묘안이 있는지를 물었다.

회사소개
꿈많은청년들은 지난 2015년 설립한 스타트업이다. 챗봇 개발을 중심으로 서비스를 공급해오다 최근 글을 올리면 세계 각국 언어로 자동 번역해주는 블로그 플랫폼 ‘두루미스’로 피보팅(Pivoting) 했다.

두루미스 로고

왜 피보팅을 결정하게 됐나?

챗봇은 지속 되겠지만 챗봇 에이전시 시장은 끝났다고 봤다. 우리가 가진 역량과 리소스를 가지고 B2B가 아닌 B2C 시장에 도전하고픈 마음이 컸다.

B2B가 더 안정적인 시장 아닌가?

지난 6~7년 간 B2B를 해왔는데, 돈이 들어올 땐 큰 돈이 들어오지만 그 돈이 언제 들어올진 모른다는 불확실성이 컸다. 또, 기업이 지갑을 여는 데 더 보수적이라 느꼈다. 새로운 서비스를 도입할 때도, “그동안 이거 없이도 잘 살았는데 굳이?” 이런 태도가 있더라.

그렇게 B2C를 겨냥해 새로 나온 서비스가 ‘두루미스’다. 어떻게 기획했나?

피보팅을 생각하고 석달을 고민했다. 그때 당시 공동창업자인 회사 CEO가 신혼여행을 다녀온 후에, 그 여행담을 블로그에 써보겠다고 하더라. 요즘에는 AI로 번역이 다 가능하니까, 다른 언어들로 번역을 해 블로그에 여러 개 글을 올리면 더 많은 사람들이 올 수 있을 거라고 생각했는데 문제가 있더라. 번역을 하나의 언어까진 해볼만 하지만 이게 열개, 스무개 언어가 되면 번역기에 넣고 결과를 뽑아내는 것도 일이 되더라. 그래서 이걸 자동화 할 수 있는지 봤고, 가능하겠다고 판단했다. 그래 그럼 이걸 서비스로 만들어보자, 그렇게 시작했다.

정민석 꿈많은청년들 CTO

자동 번역 블로그 개발은 어떻게 진행이 됐나?

처음에는 말 그대로 글을 한 번만 작성하면 많은 언어로 자동 포스팅 될 수 있게끔 하자는 생각에서 출발했는데, 시간이 지나면서 서비스를 고도화 하다보니 “인터넷에서 자료를 찾아보면 한국어로 된 자료가 생각보다 적다”는 문제를 발견했다.

국내 포털의 정보를 제외하고는?

그것 외에 해외 사이트에서는 필요한 자료를 찾기도 힘든데, 더 나아가서 한국만 그런게 아니더라. 어느 언어권이나 영어를 제외하곤 다 똑같은 상황이었다. 인터넷에서 찾아보면 영어로 된 문서가 거의 80% 정도다. 그. 외 나머지 타 언어들, 심지어 사용 인구 수 2위라고 하는 스페인어나 중국어 같은 경우에도 자료 수가 극단적으로 적다. 이런 부분에 대한 격차를 두루미스가 줄일 수 있지 않을까. 예를 들어 (정보에서) 소외된 지역, 예를 들어 동남아에 가려고 해도 그 나라 언어를 잘 모르는데 그런 한계를 극복해서 서로 더 잘 교류하는데 도움이 되지 않을까 해서 서비스 정체성을 만들려고 했다.

구체적으로 지금 두루미스의 모습은 어떤가?

하나의 언어로 쓰면 여러 언어로 번역을 해주는 게 우선 당연히 첫번째다. 그 다음으로, AI가 글의 맨 앞 부분에는 써머리를, 맨 마지막 부분에는 세 줄 요약을 자동으로 만들어준다. 검색에 노출되는 짧은 문장 역시 자동으로 생성된다. 이 외에 해시태그나 카테고리 분류 등도 AI가 자동으로 만들어주는 영역이다.

자동 번역을 위한 AI 모델은 무엇을 쓰나?

구글 제미나이를 이용하고 있다. 제미나이를 쓰면서, 번역이 원활하게 이뤄지도록 하는 프롬프팅을 우리가 한다.

번역의 완성도가 궁금하다. 한영 번역은 여러 서비스가 하고 있고, 그 완성도도 꽤나 올라왔는데

번역 때문에 책도 사봤다(웃음). 두루미스 때문에 개발을 하면서 인문사회와 관련한 공부를 되게 많이 하고 있다.

번역 서비스를 만드는데 인문사회 공부가 필요한 이유는?

특히 어문 쪽 공부를 많이 하게 되는데, 초거대언어모델(LLM)을 이용해 우리가 직접 프롬프팅을 해야 해서다. “요약할 때는 이렇게 해야 한다. 중복된 단어를 제거하기 위한 방법론은 이런 것이 있다”와 같은 걸 AI에게 가르쳐줘야 하는 일이 상당하다. 이번에 공부를 하면서 알게 된 게 “세상에 완벽한 번역이라는 건 존재하지 않는다”라는 거다. 같은 말이라도 책에서 쓰이는 것과 영화에서 쓰이는 것, 맥락에 따라 모두 다르게 번역된다. 주의해야 할 것도 다 달라서, 그런 거를 공부해가면서 프롬프트를 넣었다.

프롬프트가 정확하거나 잘 짜일수록 번역의 완성도도 높아진다?

많이 다르더라.

어떻게 하면 프롬프트를 잘 짤 수 있나?

예를 들어서, 두루미스에 블로그 요약 기능이 있다. 문장을 세 줄 내외로 요약하라고 했더니 처음에는 이상한 이야기들이 많이 나오더라. 없는 내용을 넣기도 하고 중복된 내용이 들어가기도 하고. 프롬프트를 조금씩 정교하게 다듬으면서 요약하는 방법을 알려줬다. “중복된 단어를 빼고, 블로그 안에 쓰인 단어만 사용해야 하며, 한 문단 수는 어느 정도로 하고” 등과 같은 것을 상세하게 프롬프팅 하는 거다. 그러면, 또 AI가 말은 잘 듣는다(웃음).

번역이라는 서비스 자체만 놓고 본다면, 요즘엔 경쟁력 있는 서비스가 많이 나왔다. 예를 들어서 ‘딥엘’ 같은 것이 나왔을 때는 번역을 상당히 잘해서 놀랐는데. 이런 서비스들이 계속해 나오는데 두루미스는 어떤 경쟁력이 있을까?

내가 생각했을 때는 번역이 크게 세 단계로 진화해왔다. 최초 기계 번역 시절이 있었고 그 다음이 딥러닝을 통한 기계 번역이다. 지금 하는 것처럼 문단을 블록으로 잡아서 우클릭해 번역 기능을 활성화시키는 상태 말이다.

우리가 말하는 것은 딥러닝 다음에, 생성AI를 통한 번역이다. 딥엘도 이와 유사한 걸로 알고 있다. 번역에 생성AI를 이용하면 기존의 딥러닝 번역과 비교해서 앞뒤 문맥이 부드럽게 이어지는 등의 몇 가지 차이가 있다. 온점을 찍으면 한 문장이 끝난 거지만, 사실은 그 다음에 새로 이어지는 문장과 연계되는 경우가 많지 않나. 그럴 때 더 부드럽게 번역이 가능하다. 또, 한국어의 존댓말처럼 특정 조건이나 단어에 맞춘 번역에도 생성AI가 자연스러움을 더한다. 프롬프팅의 안정화가 더해진다면 이런 측면에서 두루미스의 번역 품질이 장기적으로 경쟁력이 있을 거라고 본다.

아직 서비스 초기 단계다

올 1월 중순에 베타 서비스를 시작했다. 아직 초기 단계고, 열심히 튜닝 중이다. 고무적인 것은 현재 이용자 중에서 해외 접속자의 비율이 절반을 넘는다는 것이다. 욕심으로서는 애초 목표 자체가 한국에서의 이용 비중을 2% 이하로 다운시키는 것이다.

 글로벌 비중을 확장하겠다고 했는데, 나라마다 문화가 달라서 블로그 서비스를 운영하는 것도 쉽진 않을 것 같은데

두루미스를 준비하면서 정말 조사를 많이 했는데, 정말로 나라마다 문화나 시장 상황이 모두 다르다. 일본 같은 경우엔 자그마한 블로그 플랫폼이 엄청 많다. 그 안에서도 누구는 사이트를 조금 더 귀엽게 꾸미는 것을, 또 누구는 좀 더 글 쓰는 것에 특화해서 만들었다. 미국은 미국대로 블로그 플랫폼이 여럿 있는데 역시 타기팅이 조금씩 다르다. 처음에 두루미스를 만들 땐, 아 이거 우리가 레드오션에 뛰어드는 게 아닌가 싶었다. 그런데 다시 생각해보니, 오히려 파편화되어 있는 이 세계 시장에서 우리가 1%만 먹어도 엄청 큰 것 아닌가. 세계 시장 1%면 한국 시장 전체와 같은 규모다. 그정도만 해도 성공이라는 걸 목표로 지금 서비스 하고 있다.

 그 파편화된 시장에서 1%를 먹기 위해 두루미스가 가지는 고유 경쟁력은?

한국인이 쓴 한국 커피숍 관련 글을 언어 장벽 없이 세계인이 각자 자기 나라 언어로 읽는 다는 것이다. 더 나아가서는, 그 글들을 지도 데이터와 연동하려 한다. 매핑 작업을 통해서 포스팅에 언급한 장소, 예를 들어 A커피숍에 관련한 글을 구글 지도에서 찾을 수 있게 하는 거다. 지도에서 동네 검색을 하면 해당 커피숍과 그 커피숍에 대한 블로그 글이 뜨는 식이다.

앞으로 어떤 부분을 더 고도화시키려고 하나?

당장 절실하게 필요한 게 구독이나 좋아요, 댓글 기능을 활성화하는 거다. 현재 해당 기능들이 붙도록 작업을 진행 중에 있다. 또, AI가 자동으로 썸네일을 만들게 하는 기능을 생각하고 있다. 장기적으로는, 우리가 원래 챗봇하는 회사였지 않나? 그러니 사이트 내에서 데이터베이스를 검색할 때 챗봇을 접목하는 것을 집어 넣으려고 한다. 또, AI를 활용한 벡터검색을 넣어서 더 스마트한 연관 글 추천으로 서비스를 개선하고 싶다.

기술 개발에 어려움은 없나?

번역에 대한 오류를 잡는 것이 상당한 노력이 든다. 번역은 물론이고 요약도 어떻게 하면 더 정확하고 깔끔하게 할 수 있을지를 늘상 고민한다. 그런데 AI 기술이 빠르게 올라오다 보니 어제까진 안 되던 번역이 오늘은 되는 경우가 늘어나고 아주 자주 있다.

고민이 있다면?

투자와 관련해 열심히 알아보고 있다. 현재도 챗봇으로 매출을 내고 있으므로 내부적으로 운영 자금은 있다. 하지만 투자를 유치하게 되면 두루미스가 안착되고 제대로 돌아갈 수 있을 때까지 도움을 받을 수 있을 거라고 본다.

창업한지 8년 됐다. 소회를 돌아본다면?

창업 후 해왔던 아이템을 내부 개발용 페이지에 쭉 적어 봤는데 예닐곱개가 되더라. 이게 될까 싶은 것도 있었고, 챗봇 같은 경우엔 매출은 나오지만 미래성 측면에서 고민이 많았고. 그런데 두루미스의 경우엔, 처음에는 조금 힘들겠지만 이게 돌아가기 시작하면 무조건 되겠다는 그런 확신이 들었다.

이름은 왜 두루미스라 지었나?

이름을 지을 때 구글 바드에게 “받침이 없는 멸종 위기종을 추천해달라”고 했다. 글로벌 서비스를 지향하려면 발음이 쉬워야 하니까. 목록이 쫙 나왔는데, 그중에서 두루미를 골랐다. 멸종위기기 때문에 보존해야 한다는 뜻도 있지만, 그보다는 소외된 지역의 정보나 콘텐츠를 더 풍부하게 만들자는 뜻을 담았다.

새 서비스를 만든 소감을 말해달라

두루미스를 만들게 되면서 번역이라는 것, 언어라는 것에 대해 많은 생각을 하게 됐다. 그동안 사실 외국어에 별로 큰 관심이 없었는데, 언어마다 다양한 문화가 반영되어 있다는 것을 두루미스를 하면서 새삼 다시 한 번 더 생각하게 됐다. 문서를 번역한다는 게 한 사람에게서 다른 사람이 아닌, 하나의 문화권에서 다른 문화권으로 정보를 전달하는 것이라는 생각을 다시 하게 됐다.

업데이트
앞으로 꿈많은청년들과 관련해 새로 나오는 뉴스나 관련 기사는 하단에 계속해 업데이트 할 예정입니다. 새로 궁금한 소식이 있다면 계속해 찾아주세요!

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다