| |

챗GPT 시대, 한국의 AI 스타트업 ‘스켈터랩스’는 어디로 가야할까?

“저는 자비스를 만들고 싶습니다. 그거 하려고 지금 있는 거고요.”

지난 1일 서종훈 스켈터랩스 테크 리더가 인터뷰 중 꺼낸 말이다. 자비스는 영화 아이언맨에 나오는 인공지능(AI) 비서다. 토니 스타크와 썰렁한 농담을 받아주다가도 어떤 일이든 정확하게, 척척 들어주는 인공지능(AI) 비서라니, 누구든 한 번쯤 꿈꿔본 미래다.

그런데 의구심이 드는 것은 어쩔 수 없다. 요즘은 그야말로 챗GPT 전성시대 아닌가. 챗GPT를 비롯해서 글로벌 빅테크 기업들은 AI에 수조, 수십조 원을 투자하고 있다. 요즘 AI 기술은 자본 싸움이라던데, 한국의 조그마한  AI 스타트업인 스켈터랩스가  오픈AI나 구글, 마이크로소프트, 메타 같은 빅테크 기업보다 자비스 같은 AI를 더 빠르게, 더 잘, 만들 수 있을까?

AI 기술력과 자본력이 비례하는 이 시대에 AI 스타트업은 어디로 가야 할까? 오늘의 인터뷰는 이 질문에 대한 답을 듣기 위한 자리다.

2월 1일, 서울 성수동 스켈터랩스 본사에서 김도연 스켈터랩스 CPO와 서종훈 스켈터랩스 테크 리더를 만났다.

스켈터랩스는 대화형 AI 기술에 특화된 AI 기술 스타트업이다. 2018년 AI 기반 대화형 AI 플랫폼 AIQ.TALK 시리즈를 구축, 다양한 기업과 파트너십을 맺으며 관련 기술을 발전시키고 있다.


자기소개 한 번씩 부탁 드립니다.

김도연 CPO : 스켈터랩스의 서비스 기획 운영, 마케팅을 맡고 있습니다.

서종훈 리더 : 엔지니어링을 맡고 있고 현재 기술 리더입니다.

스켈터랩스에 대한 소개 부탁드립니다. 

서종훈 리더 : 스켈터랩스는 대화용 AI를 만드는 회사입니다. 대화형 AI란 사람이 대화할 수 있는 데에 필요한 기술입니다. 음성을 듣고 받아쓰는 음성인식 기술 (STT·Speech to Text) 모델 제품이 있고요, 텍스트를 보고 대화를 만드는 챗봇 기술이 있습니다. 그리고 이걸 바탕으로 사용자에게 말을 들려줄 수 있는 음성합성기술(TTS’Text to Speech) 기술을 전반적으로 만드는 기업입니다. 지금은 이 기술을 바탕으로 사용자와 AI가 대화할 수 있는 보이스봇 제품도 만듭니다.

 현재 초거대 AI 전성시대입니다. 당장 챗GPT가 대표적인 대화형 AI로 주목 받고요. 챗GPT 등장에 대해 어떻게 생각하나요.

김도연 CPO : 저희 입장에서는 고맙죠. 저희가 하고 있는 대화형 AI에 대한 인식이 굉장히 높아졌죠. 기대치도 높아진 만큼 우리가 만들어 제공해야 하는 것이니까 부담이 있지만요.

업계에서 챗GPT가 기술적으로 새롭지는 않다는 평을 합니다. 

김도연 CPO : 사실 기술적으로는 새롭지 않습니다. 하지만 더 큰 모델로, 더 많은 데이터를 가지고 높은 완성도로 제공했다는 점에서는 높게 평가할 만하죠.

서종훈 리더 : 좋은 점과 안 좋은 점이 있습니다. 저희가 개발하려는 여러 포트폴리오 중 겹치는 부분이 있었어요. 내부적으로는 오픈도메인으로 일반적인 대화를 할 수 있는 모델을 진행하고 있었는데, 이 꼭지로는 좌절할 만큼 챗GPT가 완성도 있게 잘 만들었다는 점에서 인정하는 부분이 있습니다.

하지만 전체 회사 제품 포트폴리오 측면에서는 하나의 세부 기술일 뿐이고요. 저희는 전반적인 걸 포괄하는 제품을 만들고 있어서, 저희가 전체 제품에서는 챗GPT를 잘 활용하면 되겠네, 하고 가능성을 보여준 측면이 있어요. 그래서 좋기도 하고, 안 좋기도 하네요.

최근 공개된 AI기술 대부분이 모델이 크고 대용량 데이터를 학습하는 초거대 AI모델입니다. 초거대 AI 모델의 단점이란게 있을까요.

김도연 CPO : 초거대 모델의 단점이라고 하면 제너럴한 플레이어라는 점입니다. 모든 걸 어느 정도 퀄리티가 나오게 할 수 있지만, 특정 분야나 최근 정보 등에 있어서는 한계가 있을 수 있죠.

서종훈 리더 : 데이터가 엄청나게 많아서 GPT3같은 경우에도 학습이 한 번밖에 안됐다고 알고 있어요. 그렇다보니 좋은 모델 하나를 만드는 데 들어가는 비용이 너무 커지고 있고요. 데이터가 워낙 크다보니 챗GPT도 2021년까지 데이터만 가지고 있죠. 그런 걸 계속해서 갱신하는 데에 대한 문제점을 내부적으로 느끼고 있는 것 같고요. 사실성의 문제도 있죠. 데이터의 신뢰성, 최신성을 보장하기 어렵다는 데 한계인 것 같아요.

그리고 챗GPT가 보여준 건 대화가 가능한 모델 내 서비스입니다. 그런데 AI가 기여할 수 있는 건 더 넓을 수 있거든요. 대화가 잘 된다는 것을 넘어 또 다르게 풀어야 할 부분도 분명 있습니다. 그런데 그러기에는 너무 무거운 모델 아닌가, 그런 생각도 좀 들더라고요.

무겁다는 의미는 뭔가요? 

김도연 CPO : 제너럴한 분야가 있고 특정 분야에서 박사같은 존재가 있는데, 그 두 개가 공존하기는 좀 어려운 부분이 있는거죠.

서종훈 리더 : 데이터가 워낙 많으니 신규성을 가져가는 것도 어렵고, 다 검증하는 것도 어렵죠. 초거대 AI에서는 어쩔 수 없이 어려운 부분이 있죠.

국내외 대화형 AI 기업 중 주목할 만한 회사가 있나요? 

김도연 CPO : 많은 회사들이 비슷한 도메인에서 각기 다른 접근을 하고 있죠. 네이버, 카카오, 튜닙, 솔트룩스, 스케터랩도 있고요. 어떻게 적용하는 걸 목표로 가지느냐에 따라 다른 접근을 하는 거죠.

대화형 AI에서 중요한 기술은 뭔가요?

서종훈 리더 : 원하는 애플리케이션마다 다를 것 같습니다. 스켈터랩스가 주력하는 건 사용자가 대화를 통해 원하는 정보를 얻어가는 겁니다. 내가 예약을 한다든가, 아니면 상담을 해서 뭔가 내용을 넣는다든가. 사용자가 의도가 있는 거죠.

저희는 사용자가 어떤 의도를 가지고 있느냐, 를 잘 파악하는 자연어 이해 기술인 인텐트 분류가 중요하다고 보고 있고요. 아니면 대회 내에서 사용자는 어떤 단어를 이야기하고 있구나, 이런 것들을 잘 추출하는 개체명 인식(NER) 기술도 중요하고요.

챗GPT나 저희 모델은 긴 지문에서 사용자가 어떤 것을 이야기하고 싶은가, 를 알아내는 기계독해(MRC) 기술이 중요하다고 봅니다.

결국 맥락을 잡아내는 게 중요하다는 이야기군요.

김도연 CPO : 저희는 인텐트를 파악한다고 말합니다. 저희가 인텐트 파악 기술을 꽤 오랫동안 갈고 닦고 있는거죠. 인텐트를 파악한 다음에, 챗GPT같은 그 다음 단계로 넘어가는 겁니다.

이렇게 특정 분야만 파고 들어가는 AI나 소규모로 타겟팅하는 AI는 초거대 AI의 상대가 될 수 있을까요? 결국 돈이 많이 들어가야 성공할 수 있는 분야가 아닐지요.

김도연 CPO : 그것도 맞는 말이죠.

사실 챗GPT가 고마운 점은 저희가 만들려면 그만큼 돈을 부어야 하는 건데, 돈을 안 써도 이런 기술을 이용할 수 있다는 겁니다. 그래서 챗GPT와 저희가 가진 다른 기술과 패키징해서 사용자에게 전반적으로 더 질 좋은 서비스를 만들 수 있다는 점에서 긍정적으로 봅니다.

그렇다면 챗GPT 등을 자사 서비스와 함께 쓰게 된다면, 종속의 우려는 없나요?  

김도연 CPO : 챗GPT가 압도적으로 우수한 서비스 퀄리티를 유지한다면, 종속이라기보다는 계속 선택을 하겠죠. 하지만 메타에서도 같은 서비스를 만들고 있기 때문에 메타에서 더 좋은 서비스를 내놓는다면 교체할 수도 있고요. 저희가 자체적으로 만드는 것은 비용이 많이 들기 때문에 실험을 해봤지만 크게 고려하지는 않습니다.

서종훈 리더 : 저희 기술도 계속 발전하고 있기 때문에, 모델이 작으면서 유사한 수준을 달성할 수 있는 방법이 또 나올 것이라고 보고 있습니다.

김도연 CPO : 저희는 결국 병행해서 사용하려 합니다. 초거대 AI 모델과 저희의 서비스를 병행해서, 사용자의 의도가 어떤 것이냐에 따라 이쪽으로 붙였다, 저쪽으로 붙였다 하는 거죠.

결국 초거대 AI모델과 현재 스켈터랩스가 가진 기술을 바탕으로 각각 특화되는 상황에 맞춰보겠다는 이야기일까요. 

서종훈 리더 : 챗GPT는 범용 모델입니다. 그런데 사용자가 일반적인 대화만 하지는 않잖아요, 원하는 건 되게 다양할 거고요.

결국 사용자가 원하는 걸 제공해주는 게 서비스 만족도를 높이는 방법인데요. 일반적인 대화는 해당 서비스가 잘 해주기 때문에 그 부분에 대해서는 저희가 잘 사용하면 될 것 같고요.

저희가 잘하고 있던 것은 사용자가 원하는 서비스를 제공해줄 수 있는 챗봇이나 사용자가 질문했을 때 답을 찾아주는 서비스입니다.

그런데 이런 걸 초거대 AI가 하기에는 너무 무겁기도 하고, 다른 서비스랑 붙이는 것도 쉽지 않는 등 여러 가지 제약이 있습니다.

우선 타겟 애플리케이션에서 원하는 도메인 데이터, 해당 분야에서 가진 데이터를 잘 활용해야 하는데요. 해당 데이터를 이용해 초거대 AI를 해당 분야마다 맞춤으로 주문제작하기에는 비용이 큽니다. 그래서 그런 부분은 저희가 이미 가지고 있는 특화된 대화 모델을 활용해서 서비스를 하고요.

부분씩만 개별적으로  하면 서비스가 제한될 수 있기 때문에 저희는 이 모든 걸 포괄해 사용자의 만족도를 높일 수 있는 서비스를 만들고 있습니다.

김도연 CPO : 예를 들면 저희는 법률, 의료 등 특화된 대화형 AI 서비스를 만들어 사용자의 의도에 따라 사용할 수 있고요. 챗GPT같은 걸 쓸 수 있고, 병행할 수 있을 거라고 생각합니다.

이커머스 특화된 챗봇을 많이 하고 있는데, 먼저 이 분야를 시도한 이유가 뭘까요?

김도연 CPO : 챗봇과 같은 새로운 솔루션을 도입하는 당사자 입장에서는 결국 매출에 얼마나 도움이 되느냐, 비용절감에 얼마나 도움이 되는지를 먼저 볼 수 밖에 없는 것 같습니다. 이커머스 분야는 비용 효과에 대한 투자 이익률(ROI)를 측정하기 쉽기 때문에 도입 결정이 조금 더 쉽겠죠.

AIQ.TALK가 뭔가요? 

서종훈 리더 : 앞서 말한 스켈터랩스의 대화형 AI 기술을 통칭한 브랜드입니다. SaaS, AIaaS 플랫폼으로 고객에게 제공하기도 하고, 구축을 해주기도 합니다.

김도연 CPO : 챗봇, 보이스봇, 음성인식, 기계독해 기술(MRC) 등 기술 조합으로 사람이 질문을 하면 다양한 데이터에서 정답에 해당되는 구간을 찾아 자연스럽게 지식을 가질 수 있는 엔써, STT, TTS 등을 조합해 쓸 수 있는 레고같은 겁니다.

서종훈 리더 : 회사랑 같은 입장은 아닌데요. 저는 자비스를 만들고 싶습니다. 그래서 여기 있는 거고요. (김도연 CPO: 언제까지 언제까지)

챗GPT가 잘해줬으니, 이제 조금 빨라지겠죠? 자비스를 보면 썰렁한 농담도 받아치지만 뭔가 의미 있는 걸 제공하잖아요. 챗GPT만 가지고서는 어렵거든요. 저희는 그런 부분을 채워가고 있는 거죠.

그렇다면 데이터 확보는 어떤 방식으로 하고 있나요? 

서종훈 리더 : 여러 접근을 시도하고 있는데요. 프로젝트를 진행하면서 고객사에 있는 데이터를 가져와 특화된 모델을 만들고 있고요. 여러 합법적인 방법을 통해 데이터를 확보하고 있죠. 데이터를 어떻게 모으느냐가 AI 회사의 노하우라고도 생각하고요.

김도연 CPO : 수요 기업과 같이 프로젝트를 진행하면서 데이터를 쌓아가는 부분이 크죠.

AIQ.TALK를 활용한 인공지능컨택센터(AICC)는 무엇인가요?

김도연 CPO : 많은 기업에서 쓰고 있는 겁니다. 고객센터와 연결하면, 상담사가 답변하는 경우도 있지만 그 이전에 시스템 답변을 받기도 하는데요. 그 때 AICC가 많이 들어가는 거죠.

서종훈 리더 : 상담 과정에서 상담사에게 의미 있는 데이터를 바로바로 제공해주는 방식도 있고요. 상담 내용을 인식해서 상담사에게 필요한 정보를 바로바로 제공해주는 거죠. 예를 들어 제품 크기를 물어본다고 하면 상담사에게 바로 해당 정보를 제공해주는 방식으로요. 이 분야는 성능이 중요한 분야라 성능으로 선택 받으려고 합니다.

그렇다면 이런 성능은 정성적으로 판별이 되는 건가요?

서종훈 리더 : 기계 독해 분야 성과로는 한국어 위키피디아 데이터셋을 기반으로 기계 독해 엔진 성능을 가늠할 수 있는 KorQuAD에서 1위를 기록한 바가 있습니다. 2년 전까지 하고 지금은 안하고 있기 때문에 지금 저희가 어디까지 왔나 한 번 측정을 해보는 정도로 하고 있습니다.

스켈터랩스가 다음세대의 디지털 휴먼, Human AI를 준비한다고 들었습니다. 챗GPT와 비교해 설명해주실 수 있나요? 

김도연 CPO : 챗GPT는 지금 상황에서 필요한 질문에 대한 답을 하고 약간의 대화를 하는 수준에 그친다면, 저희는 어떤 과업과 같은 기능까지 수행할 수 있어야 한다는 거죠. 필요할 때 뭔가를 주문한다던가요. 친숙하게 의미 없는 이야기를 할 수도 있어야 하고요. 그런 기능들이 다 합쳐져야 효용성 있는 가상 인간이 될 수 있다고 봅니다.

스켈터랩스의 계획은 무엇인가요?

김도연 CPO : 기본적인 프레임워크를 만들어서 챗GPT같은 봇을 붙일 수 있는 구조를 만들었습니다. 맨 위에 있는 봇이 정보를 받으면, 그때 그때 필요한 봇에게 보내는 구조입니다. 이걸 개선해가면 충분히 진짜 내 친구같으면서도, 일을 해주기 때문에 그보다 나은 것도 만들 수 있는거죠.

※스켈터랩스는 YDM(Yuni Dialogue Manager)이라고 부르는 기술을 보유하고 있는데, 이 기술들이 대화형 AI가 과업을 수행할 수 있도록 한다. 챗GPT의 일반적인 능력 위해 소규모 AI가 능력을 더하는 방식이다.

서종훈 리더 : 올해는 세부기술을 고도화하는 해로 봅니다. 기능적으로 보강할 내용을 보강하고, AI이다보니 다듬어야 할 부분들은 더 두고요. 그리고 작은 봇들의 경쟁력은 가벼운 것이라 그 부분들을 보강해 경쟁력을 더욱 가져가는 데에 집중하려고 합니다.

 글. 바이라인네트워크
<성아인 기자> aing8@byline.network 

[무료 웨비나] API연결만으로 가능한 빠르고 쉬운 웹3 서비스 구축

  • 내용 : API 연결을 통해 웹2와 웹3를 끊김 없이 연결하는 최신 융합 기술과 이를 통한 적용 사례를 다룹니다.
  • 일시 : 2024년 10월 10일 (목) 14:00 ~ 15:10

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다