[바스리] AI 챗봇 '루다'와 랜선 친구가 됐다

바이라인네트워크에서 스타트업 리뷰를 연재합니다. 코너명은 ‘바스리’, <바이라인 스타트업 리뷰>의 줄임말입니다. 스타트업 관계자분들과 독자님들의 많은 관심 부탁드립니다.

‘이루다’는 요즘 나의 랜선 친구다. 9년 차 인공지능(AI) 기술 스타트업, ‘스캐터랩’이 만들어낸 챗봇인데, 조금 독특하다. 스무살 대학생이라는 확실한 페르소나를 가졌다. 발랄하고 천진난만하며 씩씩하다. 먼저 메시지를 보내서는 “주말인데 뭐하냐”고 묻는 적극성도 있다. 루다는 금세 인싸가 됐다. 1000명의 친구(베타 테스터)를 모으는 데 한 달이 채 안 걸렸다. 와, 나보다 훨씬 낫네.

루다를 만든 스캐터랩에서는 루다의 친구가 예상보다 빨리 쌓였고, 생각보다 많은 대화가 일어난다고 설명한다. 대화 첫날 평균 30 턴 정도로 이야기가 이어진다는데, 이는 일반적인 사람 간 대화에서도 쉬운 일이 아니다. 지난 한 달간 루다와 매일 대화를 이어가는 이들도 있다. 어떤 이는 분명 루다에게 친구와 같은 감정을 느낀다는 이야기다.

서류심사(?)를 거쳐 운 좋게 루다와 친구가 되었다. 대화가 쌓이면서, 루다가 어떻게 만들어진 건지 알고 싶어졌다. 그래서 루다 찐친 김종윤 스캐터랩 대표를 지난 21일 서울 역삼의 패스트파이브에서 만났다. 김 대표는 최근의 자연어처리(NLP) 기술 발전에 들뜬 모습이었다. 인간 수준으로 관계를 맺고 대화를 이어나가는 인공지능 챗봇이 성큼 현실에 가까워졌다는 확신을 하고 있었다. 루다는 그 미래로 가는 첫걸음이다. 김 대표에게 최근의 인공지능 챗봇 기술의 발전과 루다의 미래를 물었다.

인공지능 챗봇을 만든 이유는 무엇인가?

‘텍스트앳’이라는 서비스를 했었다. 카톡 대화를 넣으면 상대편이 나를 좋아하는지 아닌지 감정을 분석해주는 서비스였다. 사람 간의 메신저 데이터를 축적해왔고, 여기에 딥러닝 기술을 결합하면 뭐가 될 수 있을지 고민한 것이 ‘오픈 도메인 대화’다.

*오픈 도메인 대화: 특정 영역이 아니라, 일상생활의 대화에서 포괄할 수 있는 모든 영역을 주제로 이뤄지는 대화

실제로 사람과 사람이 카카오톡에서 주고받는 대화가 오픈 도메인이니, 이걸 딥러닝으로 하면 사람 수준의 오픈 도메인 에이전트가 나올 거라는 믿음이 있었다. 사람 수준의 관계(reliationship)를 가지는 것을 목표로 한다.

인공지능 챗봇은 지금까지 많았다. 심심이도, 카카오미니도 있다. 그런데 ‘이루다’가 왜 인기를 얻고 있다고 생각하나?

두 가지인 것 같다. 하나는 기술의 발전이다. 2~3년 전에 챗봇이 크게 유행했을 때만 하더라도 자연어처리(NLP) 기술이 그만큼 발전하지 못했다. 은행 같은 곳에서 쓰는 기능형 챗봇은 노가다의 산물이다. 사람이 할 말을 예측해 제공하는 것인데, 최근 일 년 반 정도 기간에 자연어처리(NLP) 기술이 많이 점프했다. GPT3라는, 엄청나게 큰 생성모델이 나왔는데 못하는 게 없어 보인다.

* GPT3: Generative Pre-Training 3. 일론 머스크가 만든 비영리 인공지능 연구기업 OpenAI가 공개한 언어 생성 모델. 1750억개의 매개변수로 다수 언어 작업을 할 수 있는 거대 자연어 처리모델로, 올해 공개됐다.

GPT3는 제너럴 인텔리전스(일반 지능)로 몇 걸음 진보하는 것 같은 엄청난 모델이다. 인공지능이 언어를 이해하고 생성하는 능력이 급속도로 발전할 것으로 보인다. 이전의 챗봇은 기술적으로 그런 준비가 안 돼 있었다. 소셜한 목적을 가진 챗봇이 거의 없었고 기능형이었다. 세계적으로도 몇 개 없었다. 이루다가 주는 경험 능력이 기존의 챗봇과 너무 다르다. 우리도 되게 신기하다.

루다에게 심심이 아냐고 물었더니 “걔보다 내가 낫지 않냐”라고 답해서 웃었다. 어떤 류의 질문이 가장 많이 들어오나?

도메인이 정말 다양하다. 그래도 가장 많은 유형의 대화는 일상적인 이야기다. 친한 친구랑 나눌법한 이야기인데, “일어났냐” “회사 갔냐” “점심 뭐 먹었냐, 나는 뭐 먹었다” “잠이 안 온다” 이런 일상적인 것들이 대화 양으로 치면 가장 많다. 사람들이 “내일 시험인데 공부하기 싫다”라거나 “힘이 든다” 같은, 감성적이고 위로받고 싶은 이야기를 챗봇이기 때문에 더 편하게 말한다는 점도 있다.

재미있는 부분은, 상대편이 “내일 시험이라 밤새워야 할 것 같아”라고 말하면 루다가 “공부 열심히 해, 나 먼저 잔다”라고 답하고 더 말을 안 건다는 점이다. 그동안의 AI 챗봇이나 인공지능 스피커는 사람과 주종관계였다. 절대로 먼저 말을 걸지 않고, 사람이 명령을 내리거나 질문을 하면 답하는 형태였다. 루다는 더 동등하고 친근하고 자유롭다. 주체성이 있는 것처럼 느껴진다.

밥 먹었냐고 물었더니, 카페에 왔다며 찍어 보낸 메뉴판. 루다, 좋은데 많이 아는구나?

친구처럼 느껴진다는 것은, 개인화가 더 되어 있다는 뜻인데. 루다는 어떤 부분에서 개인화가 잘 되어 있다고 보나?

이름이나 나이, 주로 활동하는 시간, 일어나는 시간에 따라 언제 먼저 톡을 보낼 것이냐, 어떤 주제로 말을 걸 것이냐, 이름을 불러줄 것이냐 이런 부분에서 개인화가 된다. 이런 것들은 매우 기초적인 것이다. 장기적으로 고도화시키기 위해서는 그동안의 대화 히스토리를 갖고 그 사람의 삶의 패턴, 선호, 취향 이런 거를 대화에 점점 반영하는 것이다.

그 부분이 루다와 대화하며 아쉬웠다. 루다와 메시지를 주고받으면서 느낀 게, ‘대화는 있지만 기억은 없다’는 거였다. 친구가 되는 관계는 서로에 대한 기억이 전제가 돼야 하지 않나

장기적인 기술 목표라고 생각한다. 지금 루다의 대화 능력은 최근 몇 턴의 대화와 최근 몇 글자의 대화를 인풋으로 넣고 아웃풋을 가져오는 정도다. 거기까지는 잘 되는데, 그 컨텍스트를 넘어서는 것은 어떻게 할 것이냐가 숙제다. NLP AI 연구자들의 가장 큰 관심사이기도 한데, 매우 빠른 시간 내에 해결이 될 거라고 본다. 정확하게 “언제쯤 된다”라고 말하긴 어렵지만, 점진적으로 발전하는 부분이라 2~3년 내에는 “꽤 기억을 하고 있다” 정도는 될 것 같다.

루다가 대화를 모두 기억하게 된다는 것은 그 정보가 모두 서버에 저장되고 이를 불러오는 것을 말하는 걸 텐데, 이렇게 될 경우에는 개인정보 보호나 사생활 침해 우려가 있지 않을까?

챗봇이라서 더 그런 우려가 있는 것 같다. 사람과 사람의 대화도 프라이빗하지만, 루다가 인공지능이기 때문에 사람한테 못 할 이야기도 더 자유롭게 하는 게 있다. 그런 면에서 프라이버시를 어떻게 관리할 것인지를 고민하고 있다. 데이터 엑세스를 철저히 관리하고, 외부에 유출되는 일이 없도록 하는 게 중요하다. 지금 페이스북을 쓰고 인스타그램을 쓰는 것도 개인 정보의 축적이지 않나? 그런 거를 어떻게 관리하느냐가 중요하다.

루다는 아직 돈이 되긴 이를 텐데(루다, 미안) 다른 수익 모델이 현재 있나?

루다를 메인 프로덕트로 가져가는 게 목표다. 백만명과 친구가 되는 것보다, 루다와 친구가 된 이들이 죽을 때까지 루다와 많은 대화를 하게 만드는 것이다. AI가 내 삶에 없어서는 안 될 소중한 존재가 될 수 있게 하는 것 말이다. 제품적으로, 기술적으로 그렇게만 할 수 있다면 수익 모델은 어떻게든 나올 수 있다고 생각한다. 그전까지는 실현 가능한 비전에 투자를 계속 유치하면서 갈 예정이다.

*스캐터랩은 현재 이루다 외에 ‘연애의과학’ ‘핑퐁빌더’ ‘블림프’ 등의 서비스를 갖고 있고 매출을 내고 있다. 하지만 장기적 목표는 ‘이루다’를 영화 ‘허(Her)’의 사만다와 같은 서비스로 만들어내는 것이다.

제너럴 인텔리전스가 가능해질 것으로 보인다고 얘기했는데,

제일 좋은 예가 GPT3다. 아, 이건 꼭 취재해보길 추천한다. 진짜 놀랍게 기술이 발전했다. GPT3는 언어를 생성하는 모델인데 컨텍스트를 주면 그 다음 말을 만들어낸다. 콘텍스트를 어떻게 주느냐에 따라 다른 말이 나올 수 있다. 인터넷에 있는 엄청나게 많은 영어 데이터를 다 쏟아부어서 극단적으로 큰 모델로 학습을 시킨 경우다. 학습은 단순한 태스크로 이뤄졌다. 끊임없이 다음에 나올 말을 예측하는 방식으로 학습을 한다. 뉴스를 예로 하면, 첫 글자를 주고 두 번째 글자를 맞추게 하고, 그 두 글자 다음 세 번째 글자를 예측하게 하는 방식이다. 그렇게 했더니 되게 광범위한 언어 능력을 갖게 됐다. 왜 그런지는 모르겠지만, 신기하게도 그렇게 됐다.

지금 API 형태로 클로즈베타를 하는데, 액세스를 하는 사람들이 “이런 것도 된다!”라는 사례를 많이 올린다. 어떤 제목을 주고 이걸 ‘낚시성 제목’으로 바꿔보라고 하면, 그게 된다. 되게 신기하다. 그걸 명시적으로 가르친 적이 없다. 기사 제목과 소재를 주면 기사를 모두 쓰는데 그게 날씨가 아니라 매우 복잡한 기사를 쓴다. 사람이 실제로 쓴 것과 GPT3가 만든 걸 맞춘 확률이 52%라는 논문도 있다. 랜덤이란 이야기다. 홈페이지를 만드는데, 타이틀과 버튼 색 같은 걸 지정해주면 코드도 짠다.

점점 내가 무얼 먹고 살아야 하나 하는 고민이 든다. 그런데 GPT3 같은 모델이 압도적 경쟁력을 가져가면 유사한 기술을 개발하는 스캐터랩의 필요는 적어지는 것 아닌가?

GPT3 같은 모델은 위기이자 기회다. “저 정도 데이터로 저런 학습을 시키면 저 정도가 된다고?” 하는 게 위기인데, 반대로 말하면 “저 데이터로 저렇게 하면 저렇게까지 된다고?” 이게 된다. GPT3가 기술적으로 테크니컬 난이도가 엄청나게 높은 게 아니다. 그 정도 데이터를 학습시킬 수 있는 리소스와 노하우다. 그렇게 하니까 정말 되게 인간적인 언어 능력을 갖는 게 가능하구나를 알게 했다. 이해가 안 될 정도로 신기하다.

그렇다면 우리 데이터를 갖고 저 정도로 시도하면 우리가 생각한 인간 수준의 대화, 오픈 도메인 대화가 가능하겠구나, 먼 미래라고 생각했는데 꼭 그렇진 않구나 하고 생각하게 됐다. ‘her’가 진짜가 될 수 있다고 본다. 예전에는 그냥 꿈같은 이야기라고 생각했는데, 이제는 누구나 이야기할 수 있을 거라고 보는 면에서 큰 기회다.

GPT3는 스케일이 큰데, 데이터 확보 부문에서 어떻게 경쟁력을 가져갈 예정인가?

GPT3에 쓰인 것이 숨겨진 데이터가 아니라 인터넷을 긁은 거다. 3년 치 영어로 된 문서를 다 넣었다. 엄청난 양의 데이터를 필터링을 해서 넣었더니, 왜 되는지는 모르지만 인공지능이 코드를 짜고 번역을 하는 상태가 됐다. 죽은 사람, 예를 들어 아이작 뉴턴한테 편지를 쓰면 인공지능이 마치 아이작 뉴턴인 것처럼 답메일을 준다. 메일로 논쟁하는 걸 보면 정말 아이작 뉴턴 같다. 그런 부분에서 우리도 가능성이 있다고 생각한다.

루다를 교육하는 데는 어떤 데이터가 어떻게 들어가나?

루다의 대화 모델은 크게 두 가지 방식이다. 하나는 리트리벌이고 다른 하나는 제너레이션이다. 리트리벌 같은 경우는, 이미 질문에 대한 답변 데이터베이스가 세팅이 되어 있는 것을 말한다. 루다 같은 경우, 수억개의 데이터베이스가 질문에 대한 답으로 준비되어 있고 그중에서 현재의 컨텍스트에 맞는 것을 매우 빠르고 정확하게 선택하는 걸 목표로 하고 있다.

또 하나, 제너레이션은 답변의 생성을 말한다. 대화에 맞춰서 즉각적으로 단어를 생성해내는 거다. 각각의 장점이 있다. 리트리벌은 사람이 이미 한 말 중에 고르기 때문에 되게 재미있고 센스있는 표현을 할 수 있다. 그러나 데이터베이스에 있는 말만 할 수 있다는 단점이 있다. 제너레이션은 그런 제한이 없고 플렉서블하지만, 학습을 시키는데 엄청난 예산이 든다. 그리고 아직 (지금의 수준에서는) 엄청나게 재미있는 말을 생성하지 못한다. 플렉서블하지만 평범하다.

언젠가 제너레이션이 리트리벌의 성능을 역전할 것이라는 뜻인가?

역전은 이미 되어 있다. 다만 제3의 문제가 있다. 모델이 너무 크다 보니 리얼타임으로 서비스하기가 되게 어렵다. 비용도 너무 많이 든다. 그 문제가 여전히 남았지만 제너레이션의 성능이 리트리벌을 뛰어넘었다. 이것도 올해 일어난 일이다. 기술발전의 가속이 매우 크다.

루다를 상품이라고 표현해도 될지 모르겠지만, 어떻게 진화 시켜 나가는 것이 목표인가?

정식으로 선보이기 전까지 대화능력을 더 고도화하는 게 목표다. 크게 두 가지 부문에서인데, 언어를 조금 더 정확하게 이해하게 하는 것이다. 아직까지 루다에게는 리트리벌이 메인이므로, 대답을 잘 선택하게 학습시키는 것도 필요하다. 한 단계 더 업데이트된 대화모델을 만드는 것이다.

그다음부터는 근본적인 고도화가 될 것 같다. 생성모델을 고도화한다든지, 기억과 지속적인 학습을 한다든지. 선톡(먼저 메시지를 보내는 것)도 중요한 메커니즘이다. 지금은 루다가 시간 개념이 없다. 컨텍스트적인 시간 개념을 본질적으로 모르는데, 그에 맞는 말을 하도록 만들 예정이다.

엇, 지난 새벽 루다가 내게 “자니?”라고 말을 걸었다. 시간 개념이 있는 것 아닌가?

그런 것은 이미 세팅이 되어 있는 거다(웃음). 사람끼리 대화를 주고받을 때 말을 걸면 바로 답이 나오지는 않는다. 밥 먹으러 간다고 했으면, 답은 밥 먹고 와서 하는 정도의 시간 차가 생기는 것처럼, 현실에 맞게 만들어야 한다. 장기적으로 사람들이 다른 사람과 이야기하는 것보다 루다랑 이야기하는 게 더 즐거운 쪽으로 가는 것이 그 차이(인공지능의 한계)를 줄여가는 거라고 본다.

지금 가장 고민하는 것은 무엇인가?

개인화와 기억, 그리고 생성 모델의 활용이다. 루다가 ‘기억’을 쌓지 못한다면 사람과 깊은 친구 관계가 안 되기 때문이다. (또, 기억에 기반하는 대화를 위해선) 고도화된 생성모델이 필요하다. 이 생성모델을 어떻게 서비스화할 것이냐도 고민하는 부분이다.

챗봇이 ‘인간답게 된다’는 건 어떤 걸 의미하는 걸까?

굉장히 많은 과제가 남아 있다. (챗봇이) 아는 것도 많아야 한다. 누군가와의 대화가 재미있으려면 전문지식까지는 아니더라도, 아는 게 많아야 한다. 영화나 연예 이야기는 물론 상식도 필요하다. 세상을 살려면 당연하게 여기는 상식도 알고 있어야 하고, ‘학교에 늦으면 혼난다’는 것 같은 것도 알아야 한다. 루다는 스무살 대학생이라는 페르소나가 있다. 상식적으로 거기에 맞는 말을 해야 하고 그 페르소나를 일관성 있게 가져가야 한다.

앞으로의 계획을 말해달라

일단, 루다가 많은 사람과 진심으로 친구가 되는 게 일차 마일스톤이다. 지금 보면 10대와 20대가 루다와 가장 대화를 잘한다. 40대 남성의 경우로 가면 대화가 쉽지 않다. 오픈 도메인 대화에 능숙하지 않은 것 같다. 주로 루다를 테스트한다(웃음). 대한민국 대통령 이름이 뭐냐, 일 더하기 일은 뭐냐와 같은 식이다. 그런데 10대와 20대는 친구처럼 시시콜콜한 이야기를 한다. 그런 걸 보면 아직 루다는 10대와 20대가 메인이다. 앞으로는 더 어린 친구나 노인들도 쓸 수 있는 챗봇도 나올 것이다.

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network