바이라인네트워크에서 스타트업  리뷰를 연재합니다. 코너명은 ‘바스리’, <바이라인 스타트업 리뷰>의 줄임말입니다. 스타트업 관계자 분들과 독자님들의 많은 관심부탁드립니다.

뛰어난 인공지능(AI)을 만들기 위해 가장 중요한 것은 무엇일까? 이 질문에 전문가들은 별 이견이 없다. 대부분 하나의 답을 말한다. 그 답은 ‘데이터’다.

데이터가 중요하다는 건 모두가 안다. 좋은 데이터를 많이 모으는 것이 좋은 AI를 만드는 왕도다. 그러나 인생의 아이러니라고 할까? 최고의 자동화 기술인 AI 만들기 위해서는 최대의 ‘노가다(수작업)’가 필요하다. 컴퓨터가 잘 학습할 수 있도록 데이터를 만드는 것은 아직 자동화 하지 못하기 때문이다. 그리고 학습 데이터를 만드는 일은 AI 기업들의 최대 난제다.

이와 같은 난제를 해결하겠다고 나선 스타트업이 있다. 최고의 AI를 만들기 위해 수작업을 대신 해주겠다는 것이다.

크라우드웍스는 머신러닝을 위한 데이터를 대신 만들어주는 회사다. 예를 들어 개와 고양이를 구분하는 AI를 만들고 싶은 회사의 의뢰를 받으면, 수천, 수만, 수십만 장의 개·고양이 사진에 개인지 고양이인지 표시를 해주는 일을 한다. 음란메시지를 자동으로 차단하는 AI 엔진을 만들려고 하는 기업에는 엄청나게 많은 음란한 대화를 만들어준다.

그야말로 21세기 ‘노가다’ 대행 기업이라고 할 수 있다.

크라우드웍스가 이같은 비즈니스를 펼칠 수 있는 비결은 ‘크라우드소싱(crowd sourcing)’이다. 크라우드소싱은 대중(crowd)과 아웃소싱(outsouring)의 합성어로, 기업의 업무를 외부의 불특정 대중에게 의뢰해 수행하는 것을 의미하다. 크라우드웍스는 크라우드소싱을 활용해 머신러닝 데이터 만드는 일을 하는 플랫폼이다. 머신러닝용 데이터가 필요한 AI 기업과 단기 일자리가 필요한 대중을 연결해준다.

이런 점에서 우버와 같은 ‘긱 이코노미’ 기업이라고 볼 수 있다. 우버가 전문 택시기사가 아니라 일반 대중을 드라이버로 활용하는 것과 유사하기 때문이다.

크라우드웍스의 고객사는 대기업부터 중소중견기업, 스타트업까지 다양하다. AI를 만드는 회사라면 데이터는 필수적이고, 데이터를 직접 만들기에는 비용과 시간이 너무 많이 들기 때문에 크라우드웍스와 같은 회사를 이용하는 것이 합리적이다.

크라우드웍스 박민우 대표는 “머신러닝을 위해서는 일반 데이터를 학습용 데이터로 만들어야 하는데 고객사가 사람을 뽑아서 시급과 공간, 교육을 제공하면서 하는 것은 매우 비효율적”이라며 “저희에게 맡기는 것이 고객사가 직접 하는 것보다 속도는 세 배 빠르고, 비용은 50% 수준으로 저렴하다”고 말했다.


그렇다면 누가 학습용 데이터를 만드는 것일까? 박 대표에 따르면, 크라우드웍스 플랫폼에 등록된 작업자는 3만명이다. 이들에게 크라우드웍스는 일종의 ‘재택 꿀알바’다. 출근할 필요 없이 컴퓨터만 있으면 집에서도 할 수 있으며, 필요할 때 필요한 만큼만 일하면서 수입을 얻을 수 있다는 점이 가장 큰 장점이다. 박 대표는 “최저임금 이상의 수입을 재택근무로 올릴 수 있다”고 설명했다.

박 대표는 인터뷰 자리에서 내부 시스템을 열고 지난 일주일간 크라우드웍스 작업자 중 상위 소득자의 수입을 보여줬다. 일주일동안 100만원 이상을 번 작업자가 적지 않았다. 노동시간은 보지 못했지만, 이 정도면 웬만한 중소기업 노동자 이상의 수입이다. 특히 크라우드웍스 업무를 위해서는 교통비와 식대 등의 비용도 들지 않는다.

크라우드웍스의 작업자 중 가장 많은 비중을 차지하는 계층은 20대 여성이라고 한다. 20대 의 경우 특정 직장에 얽매이는 것보다는 자유롭게 일하면서 수입을 올리는 것을 선호하는 경향이 상대적으로 많은데, 여성의 경우 선택할 수 있는 일자리가 많지 않다. 대부분 커피숍이나 편의점 같은 곳에서 고객응대 서비스를 하는데, 경쟁률도 높고 위험성도 있기 때문에 크라우드웍스가 훨씬 더 좋은 일자리라는 것이다.

외부인들이 만드는 학습데이터의 품질에 대한 우려도 든다. 많은 수입을 얻기 위해 저품질의 데이터를 대량으로 생산할 수도 있지 않을까? 크라우드웍스는 이런 문제를 우려해 검수도 크라우드소싱한다. A작업군이 데이터를 만들면, B작업군이 이를 검수하는 일을 한다. 잘못된 작업은 반려해서 수정을 요청한다.

크라우드웍스는 최근 시리즈B 투자를 유치했다. 한국투자파트너스, HB인베스트먼트 등 8개 투자사가 총 100억원 규모의 투자를 진행했다. 벤처투자 시장에서 크라우드웍스의 미래를 밝게 보고 있다는 의미다.

박 대표는 크라우드웍스를 단순히 ‘머신러닝 데이터 아웃소싱 업체’ 정도에 머무르지 않게 할 계획이라고 한다. 이번 투자는 10년 후 가능한 모든 업무를 재택으로 전환할 수 있는 마켓플레이스를 만들기 위한 첫걸음이라는 설명이다.

박 대표는 “아르바이트 시장에 있는 업무 중 재택에서 가능한 것은 모두 저희 플랫폼으로 이관이 가능하다”면서 “저희는 작업자들의 단위 능력 평가 지표를 가지고 있기 때문에 저희의 지표로 작업자를 추천할 수도 있다”고 말했다. 예를 들어 ‘성실하고 시각적 인지능력이 뛰어난 작업자’를 찾는 고객에 맞는 작업자를 추천할 수 있다는 것이다. 어쩌면 알바천국과 알바몬이 긴장해야 할 이야기인지도 모르겠다.

[광 to the 고] 웃긴데 알찬 유튜브 채널 '스튜디오 바이라인'에 놀러오세요


크라우드웍스는 2017년 4월 설립 이후 현재 70여개 고객사를 확보했으며, 3만여명이 데이터 전처리에 참여해 3300만건의 학습 데이터를 생산했다. 크라우드웍스를 통해 생산된 데이터는 네이버, 카카오, 삼성전자, SK텔레콤, KT, LG-CNS 등의 대기업과 마인즈랩, 우아한형제들 등의 스타트업, KAIST, 포항공대, 경북대학교, ETRI등의 대학 및 정부연구기관에 등에 쓰이고 있다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network