[IPO 2022] 제2의 SaaS 신화를 기록할까, 데이터브릭스(Databricks)

미국 소프트웨어 기업 중 가장 큰 IPO(기업공개) 규모를 기록한 회사는 2020년 9월 상장한 ‘스노우플레이크’다. 스노우플레이크는 상장하자마자 ‘따상(공모가의 두 배, 상한가)’을 기록하며, 상장 첫날 시가총액 700억달러(81조원)을 기록했다. 스노우플레이크의 성공적인 IPO 이후 SaaS(Software as a Service) 기반의 기업용 소프트웨어 스타트업의 몸값이 덩달아 올라갔다.

이 가운데 올해는 스노우플레이크 이후 가장 주목을 받는 소프트웨어 기업이 IPO를 준비하고 있다. 주인공은 바로 데이터브릭스다.

데이터브릭스는 마이크로소프트 애저, 구글 클라우드, 아마존의 클라우드 등에서 데이터 레이크하우스 플랫폼을 제공하는 소프트웨어 회사다. 빅3 클라우드 파트너들의 열렬한 지지를 등에 업고 현재 엔터프라이즈 소프트웨어 기업 중 가장 많은 관심을 받고 있다.

단순함, 유연함을 내세운 데이터브릭스 기술은 많은 사람들과 기업들이 선호한다. 어도비부터 스타벅스, SPA 브랜드 H&M까지 데이터 브릭스의 고객사다. 5000개가 넘는 기업들을 고객으로 둔 데이터브릭스는 지난해 8월 기업가치 380억 달러를 인정받았다. 작년에 이어 2022년 올해도 기업 공개가 가장 기대되는 기업 중 하나다. 

데이터브릭스란?

데이터브릭스는 2013년 설립한 엔터프라이즈 소프트웨어 기업이다. 아파치 스파크의 개발자인 알리 고드시(Ali Ghodsi), 메테이 자하리아(Mate Zaharia), 레이놀드 신(Reynold Xin) 등이 창립했다.

우선 아파치 스파크는 빠르기로 유명한 빅데이터 분석 프레임워크다. UC버클리대학 AMP랩에서 업계에서 주로 사용했던 하둡 맵리듀스의 단점을 보완해 내놨다. 아파치 스파크는 인메모리를 기반으로 해 디스크 입출력으로 시간이 지연되었던 맵리듀스와는 달리 시간을 획기적으로 줄였다. 특정 상황에서는 맵리듀스보다 100배 정도 빠르다. 이제는 빅데이터 분석, 머신 러닝에 가장 필요한 프레임워크로 불리는 아파치 스파크는 페이스북, 마이크로소프트, 은행, 주요 정부 등 다양한 곳에서 사용한다.

데이터브릭스는 오픈소스 ‘아파치 스파크 (Apache Spark)’를 기본 엔진으로 둔 데이터 레이크하우스 플랫폼을 제공한다. 이 때 데이터 레이크하우스란 데이터 브릭스가 고안한 새로운 데이터 플랫폼이다. 데이터브릭스는 데이터 레이크하우스가 데이터 레이크의 유연함, 효율적인 비용, 대용량 지원 기능에 데이터 관리 기능을 더한 플랫폼이라고 설명한다. 즉, 데이터 처리와 분석을 병합한 플랫폼이다. 

데이터 레이크 하우스의 장점은 단일 플랫폼에서 여러 직군이 협업이 가능하다는 점이다. 비즈니스 인텔리전스(BI), SQL, 데이터 사이언스, 머신러닝을 단일플랫폼에서 진행할 수 있다. 즉, 데이터 엔지니어, 데이터 분석, 데이터 사이언티스트 등 기업 내 다양한 직업군이 협업 가능한 환경을 제공한다.

이 밖에도 아마존 웹서비스(AWS), 마이크로소프트 애저(Azure), 구글 클라우드 3대 클라우드 플랫폼을 통해 머신 관리 기구 ML플로우, 오픈 소스로 델타 레이크 등 서비스를 제공한다.

데이터브릭스 현황

데이터브릭스는 두 가지 장점을 지녔다. 아파치 스파크를 기반으로 해 처리속도가 빠르다는 점과 통합이 어려웠던 데이터 분야의 업무를 한 플랫폼로 통합했다는 점이다. 특히 협업에 특화되었다는 점이 기업들이 데이터브릭스를 선택하는 이유다. 인베스터플레이스에 따르면 2020년 기준 데이터브릭스를 사용하는 기업은 5000곳이 넘는다. 

점유율로 봐도 데이터브릭스는 빠른 성장세를 보이고 있다. 세일즈 인텔리전스 플랫폼 슬린텔(Slintel)에 의하면 데이터브릭스는 빅데이터 분석 시장 내 점유율 약 10.5%로 업계 내 4위다. 아파치 하둡이 약 21%, 탈렌드가 16%, 오라클 빅데이터가 약 9.9%다.

매출도 준수하다. 데이터브릭스의 2020년 한해 연간 반복 수익(ARR)은 4억 2500만 달러였다. 그 2021년 8월 공개된 ARR은 6억 달러 정도로 이미 전년도 수준을 뛰어넘었다. 데이터브릭스는 새로운 ARR 수치는 전년대비 75% 성장을 의미한다고 발표했다.

데이터브릭스는 성장하는 SaaS(Software as a Service) 시장 속에서도 유독 빠르게 성장하는 기업으로 주목받고 있다. 지난해 2월 시리즈 G에서 10억 달러 투자금을 조달한 후 기업 가치 280억 달러를 인정받았다. 마이크로소프트, 알파벳 등 대기업도 앞다퉈 투자했다. 이로부터 7개월 후, 데이터브릭스는 시리즈 H에서 투자금 16억 달러를 유치한 후 기업가치 380억 달러로 거의 반년만에 100억 달러나 높게 평가 받았다. 8월 펀딩 당시 베세머 클라우드 인덱스는 데이터브릭스가 전년 대비 44% 성장했다고 분석했다. 

 앞으로의 성장

데이터브릭스는 꾸준한 연구개발로 플랫폼 이용자들의 편의를 증진해 시장 내에서 성장하고자 한다. 알리 고드시 CEO도 빠르게 변화하는 AI 시장에서 연구개발비를 결코 줄이지 않을 것이라고 밝힌 바 있다. 데이터브릭스는 지금까지 다양한 서비스를 출시할 뿐 아니라 새로운 제품, 기업 인수까지 진행했다.

예를 들어 데이터브릭스는 2020년 데이터분석가가 직접 표준 SQL 쿼리를 보다 쉽게 실행할 수 있는 SQL 애널리틱스를 공개했다. SQL 애널리틱스를 활용하면 다양한 비즈니스 인텔리전스 도구를 데이터 리포지토리에 쉽게 연결할 수 있다 .

고객군을 확대하기 위한 계획도 검토하고 있다. 데이터브릭스는 앞으로 상거래 및 소매업자들을 위한 패키지 솔루션 ‘레이크하우스 포 리테일(Lakehouse for Retail)’을 제공할 계획이다. 클라우드 인프라가 점점 복잡해짐에 따라 각 산업군에 따른 맞춤형 통합 패키지가 필요하다는 의견이 대두되었기 때문이다. 때문에 데이터브릭스는 우선 상거래 분야에 특화된 레이크하우스 포 리테일을 출시했다. 데이터브릭스 알리 고드시 최고경영자(이하 CEO)는 “레이크하우스 포 리테일은 소매업계의 기업과 파트너 간에 데이터 중심 협업을 강화할 것”이라고 말했다. 기존부터 데이터브릭스의 플랫폼을 사용한 H&M그룹, 월그린 등이 레이크하우스 포 리테일의 얼리어답터다.

데이터브릭스는 필요에 따라 기업 인수도 진행했다. 이 또한 더 많은 사용자가 플랫폼에 접근할 수 있게 하기 위해서다. 데이터브릭스는 지난 2020년 6월 데이터 시각화 및 대시보드 구축을 지원하는 스타트업인 Redash를 인수했다. 또한 지난해 10월 누구나 쉽게 프로그램을 구현할 수 있게 하는 로우코드, 노코드 기능을 확장하기 위해 독일 스타트업 8080 랩스 (8080 Labs)를 인수했다. 

위기 단점

데이터브릭스의 꾸준한 제품 개발과 구체적이고 실질적인 솔루션 창출에도 불구하고 일각에서는 데이터브릭스의 기업가치에 의문을 제기한다. 10억 달러도 채 되지 않는 ARR에 비해 기업가치가 수십 배 더 높다는 지적이다. 이들은 소프트웨어 시장, 빅데이터 시장이 점차 평가 절하된다면 데이터브릭스의 기업 가치가 훨씬 낮아질 수 있다고 말한다. 실제로 금리 인상 조짐이 보이자 스노우플레이크 등 클라우드 업계 내 기업들의 주가가 빠르게 떨어졌기 때문이다.

실제로 데이터브릭스와 유사한 엔터프라이즈 소프트웨어 기업인 스노우플레이크 경우, 기업공개 당시 이전 평가보다 훨씬 높은 수준의 기업가치를 달성했다.  스노우플레이크 경우,  2020년 9월 상장 첫날 704억 달러로 뉴욕증권거래소에 상장된 역대 소프트웨어 기업 중 최고치를 기록했다. 7달 전 기업 가치는 124억 달러 가량으로 기업공개 첫날 무려 5배나 증가한 셈이다. 

이와 비교했을 때 데이터브릭스도 높은 수준의 기업공개를 기대할 수 있다. 데이터 브릭스가 2021년 8월까지 6억 달러 정도의 매출을 기록했고 스노우 플레이크는 2021년 3분기까지 약 8억 달러 가량 매출을 공개했기 때문이다. 그러나 스노우플레이크 기업공개 당시 주식시장이 기록적인 수준으로 과열되었던 것에 비해 현재 금리 인상에 대한 기대로 주식시장이 폭락 중이다.

글. 바이라인네트워크
<성아인 기자> aing8@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다