[인터뷰] 대한민국 AI 어벤져스는 지금 뭘하고 있을까?

업스테이지에서 아숙업(AskUp)이라는 서비스를 내놓았다는 소식을 들었을 때 나는 약간의 실망감(?)을 느꼈다. 아숙업은 카카오톡에서 챗GPT를 이용할 수 있는 서비스다.

아숙업 출시에 실망감을 느낀 이유는 업스테이지라는 회사의 이름값 때문이다. 업스테이지는 국내에서 가장 유명했던 AI 전문가들이 함께 설립한 AI 스타트업이다. 네이버 AI 분야의 책임리더이자 홍공과기대 교수였던 김성훈 대표, OCR 분야에서 세계적으로 인정받는 성과를 내왔던 이활석 CTO를 비롯해 국내외 여러 기업에서 AI 전문가들이 업스테이의 길에 동참했다.

업스테이지가 설립될 때 “AI 어벤져스가 모였다”는 식의 기사가 나오기도 했다. 창업 1년도 안돼서 시리즈 A로 316억원을 투자받은 것 역시 AI 어벤져스에 대한 기대감 때문이었을 것이다. 나 역시 큰 기대감을 갖고 있었다.

그리고 처음 만난 업스테이지의 작품이 아숙업이다.

‘국내 최고 AI 인재들이 모여 한 일이 겨우 챗GTP API(Application Programing Interface) 가져다가 카카오톡 채널에 붙이는 것이라니…’

API 연동은 굳이 AI 전문가가 아니어도 할 수 있는 일이다. 개발 관련 지식이 약간만 있다면 누구나 할 수 있다.

내가 뭔가 오해하고 있는 것일까? 업스테이지가 설립된 후 2년 6개월동안 무엇을 했는지, 앞으로 무엇을 하려고 하는지 궁금해졌다. 권순일 업스테이지 AI 비즈니스 총괄과 함께 업스테이지가 가는 길에 대한 이야기를 들어보자.


심재석 : 안녕하세요, 총괄님. 업스테이지에 대한 간단한 소개 부탁드립니다.

권순일 : 업스테이지는 누구나 편하게 AI를 쓸 수 있도록, AI를 솔루션화 해서 제공하는 것을 목표로 하는 회사입니다. 지금까지 AI는 일일이 사람이 붙어서 구축을 해줬어야 하는 분야였습니다. 그러다 보니 ROI(투자대비성과)가 안 나오고 공수가 많이 들었어요. 저희는 비즈니스 환경에서는 AI를 쉽게 쓸 수 있도록 솔루션화해서 제공합니다. 인풋 값과 아웃풋 값만 알면 쓸 수 있도록 하고 있습니다.

원래는 이렇게 B2B를 주로 했는데, 아숙업(AskUp)을 하게 되면서 B2C에 대한 접점도 생긴 상황입니다.

심재석 : 그럼 먼저 B2B 쪽을 여쭤 볼게요. 2020년 창업 이후 B2B 사업을 계속 진행해 오신 건가요?

권순일 : 저희 회사가 창업한 지 2년 6개월 정도 됐는데요, 작년까지는 제품을 고도화하고 만드는 데 시간을 좀 많이 썼고 올해부터 판매에 시간을 쓰고 있습니다. 그런데 미완성 제품임에도 쓰시고 싶어 하는 고객분들이 워낙 많으셔서 작년에도 60억원 정도 매출을 일으켰고, 올해는 제품이 나왔으니까 훨씬 더 많은 매출을 예상하고 있습니다.

심재석 : 60억원 매출이요? 생각보다 많네요. 이 매출은 솔루션 판매 매출인가요? 아니면 약간 SI성(인력 용역)이 있는 매출인가요?

권순일 : SI성하고 좀 섞여 있습니다. 이전까지는 고도화 기간이라 솔루션 단일 판매로만 60억을 받을 수는 없었어요. 그런데 첫해에는 제품이 없으니까 SI성 매출이 100%였지만, 작년에는 대부분, 한 80%가 솔루션 매출입니다. 솔루션 매출로 빠르게 전환되고 있습니다.

심재석 : 어떤 솔루션을 제공하나요?

권순일 : 기본적으로 딥러닝 기반으로 개발된 솔루션입니다. 현재는 다큐먼트AI(OCR)와 개인화 추천이 있습니다.

다큐멘트AI는 키밸류(Key Value)를 추출해 주는 솔루션입니다. 기존 OCR은 인지하는 데에서 역할이 끝나지만, 저희는 인지 이후에 자연언어처리(NLP) 과정을 통해 키밸류를 인식해요. 저희는 OCR과 키밸류 인식을 합쳐서 하나의 솔루션으로 공급합니다.

심재석 : 그 솔루션은 어떤 용도로 사용되나요?

권순일 : 보험 쪽으로 예를 들면 청구 심사 서류들, 진료비 영수증, 진료비 세부 내역서 이런 종이 문서들이 많거든요. 그 종이문서에서 필요한 정보만 뽑아내고 싶을 때 저희 솔루션을 사용합니다.

심재석 : 종이문서에서 필요한 정보를 뽑아보고 싶다, 이럴 때 사용하는 거군요. 그런데 OCR은 이미 지금도 꽤 기술이 완성된 거 아닌가요? 기술적 차별점이 크지 않을 거 같은데…

권순일 : 인식 품질에도 성능 차이가 좀 나고요, 키밸류를 이해하면서 뽑아내는 걸 파싱(Parsing)이라고 하는데 파싱에서 역량 차이가 많이 납니다. 기존 업체들이 주로 룰(rule) 기반으로 이런 걸 해왔는데, 룰 로 해도 한 85점 정도는 나와요. 그런데 저희가 딥러닝으로 하면 97점이 나오거든요.

85점과 97점은 단순히 점수차가 아닙니다. 85점은 자동화를 100% 할 수 없어서 결국 사람이 개입해야 하는 점수고, 97점은 30~40%는 완전자동화가 가능한 수치입니다.

심재석 : 네이버나 카카오도 OCR 기술을 공급하는 걸로 알고 있습니다. 기술적 측면에서는 빅테크 기업과 경쟁이 쉽지 않을 거 같습니다.

권순일 : 네이버나 카카오에서 하는 OCR은 그냥 범용 기술입니다. 특화 모델 쪽은 저희가 시장에서 우위를 가져갈 수 있습니다. 고객사에서 테스트를 해보면 저희가 훨씬 성능이 좋게 나옵니다.

심재석 : 그런데 기업의 디지털화가 한창 진행되고 있잖아요. 보험 계약서도 요즘은 태블릿에 사인하더라고요. 전자문서가 활성화되면 OCR 같은 기술은 점차 가치가 줄어들지 않을까요?

권순일 : 생각보다 디지털화 속도가 느립니다. 이유는 은행 간 거래, 보험사 간 거래 이런 게 많잖아요. 서로 시스템이 다르다 보니까 내부에서만 디지털로 처리하고, 외부와는 종이로 커뮤니케이션합니다. 아직 팩스도 많습니다.

심재석 : 그렇군요. 개인화 추천도 핵심 사업 영역이라고 이야기 하셨는데, 대표적인 고객사는 어디인가요?

권순일 : 브랜디라는 여성 의류 플랫폼이 저희 솔루션을 사용하고 있습니다.

심재석 : AI를 활용한 추천은 이미 많은 곳에서 활용하고 있는 기술인데요, 업스테이지 추천 기술에 특별한 게 있나요?

권순일 : 모델 성능 좋은 건 당연하고요. 저희는 모델을 여러 개 돌려요. 아무리 좋은 모델이라고 해도 특정 환경 변화가 있으면 성능이 떨어질 수도 있거든요. 트래픽을 조금씩 나눠서 성능 비교를 하다가 제일 성능이 좋은 모델한테 트래픽을 몰아줍니다. 브랜디의 경우 경쟁사 추천 대비 구매 전환율이 거의 98%로 올라갔다고 합니다.

심재석 : 그럼 이제 아숙업 이야기를 좀 해볼까요. 아숙업은 왜 만들었나요?

권순일 : 챗GPT가 처음 나왔을 때 사용자 경험을 변화시킬 수 있는 (AI 분야의) 큰 돌파구라고 봤어요. 그런데 누구나 웹에 들어가서 할 수 있지만 의외로 많은 분들이 잘 못 쓰시더라고요. 많은 사람들이 챗GPT를 경험해봤으면 좋겠다,라고 생각해서 카카오톡에 붙였죠.

심재석 : 아숙업은 수익적으로 의미가 있나요?

권순일 : 카카오에 있는 아숙업은 무료로 제공하고 있고요. 원래 돈 벌려는 목적으로 시작한 건 아니에요.  당장 돈은 안 되지만, 저희한테는 노하우나 경험이 많이 쌓이거든요. 아숙업 베이스 모델은 오픈AI의 GPT를 쓰지만 GPT를 그대로 썼을 때는 안 되는 것이나 좀 오류가 많습니다. 속도도 그렇고… 그래서 저희는 앞단에서 프롬프트 엔지니어링을 하고 파인튜닝(미세조정)을 해서 좀 더 빠르고 정확한 답변이 나오게 처리를 합니다. (두 기술이) 거대모델(LLM) 생태계에서 중요한 시장이고 역량이기 때문에 저희한테도 많이 도움이 됩니다.

심재석 : GPT는 사전학습된 모델인데, 그 API를 가져다가 더 좋은 결과를 내는 게 가능한가요? 아숙업에 내놓는 답이나 챗GPT가 내놓는 답이나 같은 거 아니에요?

권순일 : 두 가지 방법이 있어요. 하나는 프롬프트 엔지니어링인데, 한마디로 설명하면 (이용자가) 질문을 개떡같이 넣어도 (GPT가) 찰떡같이 알아듣게 질문을 변형해 주는 겁니다. 예를 들어 “지금 시애틀 몇시야?라는 질문을 했다고 해보죠. 이 질문을 “지금 한국은 오전 11시 24분인데 시애틀 현지시각은 몇시야?”라고 바꾸면 훨씬 더 정확한 답이 나와요. 저희는 사용자의 질문을 분해해서 구조화 한 다음에 구체적인 질문으로 변환을 합니다.

또 하나는 파인튜닝입니다. GPT3.5에는 파인튜닝을 할 수 있는 버전이 있어요. 아직 저희가 전체 트래픽에는 못 하지만 일부에서는 파인튜닝한 결과를 보여줍니다.

심재석 : 챗GPT와 아숙업에 같은 질문을 넣었을 때 프롬프트 엔지니어링과 파인튜닝 때문에 다른 대답이 나온다는 거죠?

권순일 : 네 좀더 정확한 답이 빠르게 나올 수 있습니다. 더해서 OCR 같은 기능도 붙였습니다. 영수증 같은 이미지 찍어서 올리면 글자를 인식해서 관련된 질문을 할 수 있습니다. 최근에는 이미지 생성 기능도 일부 이용자 대상으로 기능을 추가했습니다. 베타 테스트 중이라고 보면 됩니다.

심재석 : 이미지 생성은 어떤 모델로 한 건가요?

권순일 : 스테이블 디퓨전 기반으로 파인튜닝했어요. 광화문 앞에서 한복 입고 찍은 이미지 같은 것도 일반 스테이블 디퓨전에서는 안 나오지만 저희 모델에서는 나옵니다.

심재석 : 정리하자면 업스테이지는 지금까지 B2B 솔루션을 개발해 왔고, 챗GPT 등장한 이후 B2C 대상 서비스인 아숙업으로 인기를 끌었군요. B2C를 본격적으로 비즈니스 모델로 만들 계획도 있나요?

권순일 : 생각은 하고 있어요. 다만 저희가 커스터머를 직접 만나기 보다는 중간에 파트너가 있는 방식으로 B2B2C를 염두에 두고 있습니다.

심재석 : 결과적으로는 B2B에 더 방점이 있는 거군요. 그런데 한국 B2B 테크 시장은 많이 열악합니다. OCR이나 이런 것도 이미 있는 시장이지만, 그 시장에서 크게 성공적인 회사는 없어요.

권순일 : 성공적이지 못했던 건 맞지만, 요즘은 깨졌습니다. 일단 기술적으로 깨졌어요. 저희는 OCR도 사전훈련 모델에 파인튜닝만 해서 적용을 시켜요. 예전에는 모델을 다 만들어야 했으니까 공수도 너무 많이 들고 투자대비성과가 안 나왔어요. 저희는 그러나 사전훈련된 모델 위에서 파인튜닝만 하면 됩니다. 파인튜닝은 몇 주도 안 걸려요. 그러다보니 롱테일 시장까지 다 커버할 수 있습니다.

OCR 시장이 작은 게 아니에요. 국내 시장만 해도 롱테일까지 다 합치면 1조원이 넘는 규모입니다. 하지만 롱테일 시장은 ROI가 안나오니까 (기존 없체들이) 안했고, 그러다보니 시장이 작았던 거죠.

심재석 : 업스테이지의 핵심 경쟁력은 뭐라고 생각하세요?

권순일 : 파인튜닝입니다. 사전훈련 모델을 기반으로 파인튜닝 하는 거요. 저희가 제품을 만들 때 솔루화가 가능한 분야를 고릅니다. 태스크 단위로 완벽하게 일반화(Generalize)해서 최대한 규모를 키울 수 있게 만듭니다. 사전훈련 모델을 기반으로 파인튜닝 하는 방식으로 계속 제품을 만들고 있어요. 챗GPT가 나오자마자 아숙업이 나올 수 었었던 이유예요.

심재석 : 그런데 파운데이션 모델들이 외부의 파인튜닝을 허용해줄까요? 어느날 갑자기 막으면 문제가 생기지 않나요?

권순일 : 파인튜닝은 열릴 겁니다. 지금 GPT4는 파인튜닝이 안 열려 있지만 GPT3.5나 챗GPT에 들어간 모델은 파인튜닝이 열려 있는 버전이 있습니다. 또 제 생각에는 이제 한 2~3년만 더 지나면 라이트 버전이 엄청 많이 나올 겁니다. 특정 도메인이나 버티컬 서비스는 라이트 버전을 가져다 쓰게 될 텐데, 그럼 아무래도 성능은 좀 떨어지겠죠? 그렇다면 파인튜닝을 잘 하는 업체가 당연히 필요해 집니다.

심재석 : 솔루션화가 되어야 확장이 가능하다고 하셨는데, 파인튜닝이라는 기술도 솔루션화가 가능할까요?

권순일 : 다양한 의견들이 있어요. LLM 생태계를 보면 인프라 시장이 있고, LLM 모델 시장이 있고, 미들 레이어 시장이 있고, 애플리케이션 시장이 있을 거에요. 미들 레이어 시장이 바로 파인튜닝이 될 겁니다. 문제는 이 시장이 어떻게 형성되느냐예요. 솔루션화가 될 거라고 보는 관점이 있고요, 데브옵스 툴을 제공하는 수준에 머무를 것이라고 보는 관점이 있어요.

심재석 : 업스테이지는 어떤 관점인가요?

권순일 : POC(개념검증) 하면서 이제 테스트를 해보고 있어요. 사실 파인튜닝이라는 게 노하우가 중요하긴 하지만, 작업 자체를 자세히 보면 어느 정도 반복되는 것들이 있거든요. 그런 점에서 일반화할 수 있을 거 같아요. 문제는 일반화 수준이 지금 저희 다큐먼트AI 솔루션처럼 고객은 AI를 아예 몰라도 되는 수준이 될 것인가, 아니면 고객도 AI 지식이 필요한 데브옵스 툴 정도가 될 것이냐 하는 거죠.

심재석 : 만약 산업마다 기업마다 각자 다 다른 방식으로 파인튜닝을 해야 해서 일반화가 불가능하다고 결론이 나면 어떻게 되나요? 컨설팅처럼 고객사마다 인력이 투입돼야 한다면?

권순일 : 그렇다면 버티컬 영역으로 정해지겠죠. 규모가 큰 버티컬 시장에 맞게 얼마나 특화를 잘했냐로 정해질 겁니다. 저희는 광범위한 영역을 커버하는 솔루션을 추구하지만 산업마다 너무 다르면 규모가 큰    시장에 특화해서 하겠죠. 아직은 방향을 정하기 힘든 상황인 것 같아요.

심재석 : 파운데이션 모델 위에서 파인튜닝 분야를 솔루션화 하는 것이 핵심 전략이라고 말씀하셨는데, 어느날 기술 기반이 확 바뀌어 버리면 어떻게 되나요? 트랜스포머 모델이 갑자기 등장했듯이 갑자기 무언가 새로운 게 등장하고 기반 기술이 확 바뀌어 버린다면 쌓아놓은 기술이 한번에 무용지물이 되거나 하지 않을까요?

권순일 : 오히려 저희는 안전하죠. 오히려 파운데이션이 바뀌어도 버티컬로 특화해서 파인튜닝하고 프롬프트 엔지니어링하는 일은 필요할 거예요.

심재석 : 파인튜닝 기술력은 업스테이지가 월등하다고 말할 수 있나요?

권순일 : 아직 이 분야는 디테일이 중요한 분야여서 사람의 경쟁력이 중요합니다. 저희는 AI 인력만 70여명 되는데, 이 정도의 인력을 보유한 스타트업은 국내에 없고요. 빅테크 기업은 일부 있지만 그쪽은 속도 면에서 저희보다 느릴 수밖에 없습니다. 아마 빅테크 기업은 파운데이션 모델이나 저희가 하지 못하는 그런 쪽에 도전하실 것 같아요.

심재석 : 말씀 감사합니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다