국내 스타트업, 어떻게 글로벌 인기 오픈소스를 만들었을까

최근 국내 개발자들의 오픈소스 진영에 기여하는 사례가 늘고 있습니다. 한때 한국의 개발자들은 오픈소스를 가져다 쓰기만 잘하고 기여도는 낮다는 비판도 있었지만, 근래에는 유명 오픈소스 프로젝트 커미터 리스트에서 한국인의 이름을 발견하는 것이 어렵지 않습니다.

특히 국내에서 개발된 오픈소스가 아파치재단과 같은 유명 커뮤니티의 톱레벨 프로젝트로 선정되는 일도 종종 있습니다. 미나(MINA), 하마(HAMA), 타조(TAJO), 제플린(ZEPPLIN), 리프(REEF) 등이 그 예입니다.

TAJO하지만 아파치 톱레벨에 올랐다고 해서 성공적인 오픈소스소프트웨어가 되는 것은 아닙니다. 아파치재단 톱레벨 오픈소스 프로젝트만 300개만 넘습니다. 이 중에서 활발하게 이용되는 소프트웨어는 소수에 불과합니다. 국내 개발자들의 오픈소스는 대부분 활발하게 이용되지 못한 소수에 포함되지 못하는 것이 현실입니다.

이가운데 최근 국내 스타트업이 개발한 오픈소스가 세계적인 인기를 끌고 있어 눈길을 끌고 있습니다. 주인공은 제플린 X(NF랩스에서 사명변경)에서 개발한 ‘제플린’입니다.

ZeppelinLogo

아파치 제플린 CI

제플린은 하둡이나 스파크와 같은 빅데이터 분석 플랫폼과 함께 사용할 수 있는 빅데이터 분석 도구입니다. 빅데이터 분석을 훨씬 편리하게 할 수 있는 툴로 인기를 끌고 있습니다.

제플린은 미국의 IT전문지 인포월드가 선정한 ‘최고의 오픈소스’ 어워드에서2015~2016년 연속으로 수상했습니다. 이 수상리스트에는 스파크, 텐서플로우, 엘라스틱서치 등 유명 오픈소스가 함께 있습니다. 그야말로 글로벌로 인정받는 오픈소스 소프트웨어가 된 것입니다.

제플린은 어떻게 국내 소프트웨어들이 세계적으로 인기있는 오픈소스가 됐을까요? 제플린 프로젝트를 처음부터 현재까지 이끌고 있는 이문수 제플린X 최고기술책임자(CTO)를 만나봤습니다.

인터뷰는 지난 14일 서울 역삼동 마루18에서 열린 빅데이터 컨퍼런스 ‘데이터야놀자’ 행사 중간에 이뤄졌습니다

Q. 안녕하세요. 제플린의 발전을 축하드립니다. 제플린이 어떤 프로젝트인지 소개 부탁드립니다.

“아파치의 모든 프로젝트에는 각각의 목표가 있습니다. 제플린의 목표는 ‘분석 플랫폼을 위한 분석환경’이라고 정의돼 있습니다. 지금은 하둡, 스파크, 하이브 등을 비롯해 빅데이터 생태계를 위한 분석 환경을 제공합니다. 제플린을 통해 분석을 위한 라이브러리 통합, 시각화, 분석가의 커뮤니케이션 등이 가능합니다.”

Q. 제플린이 아파치재단 내에서도 인기가 많다고 들었습니다. 인기가 어느 정도인가요?

“깃허브의 별개수 순위로 보면 전체 아파치 프로젝트 중에서 12위입니다. 컨트리뷰터 수로는 7~8위입니다. 전체 순위로 보면 10위 정도 되지 않을까요? 상승률로 보면 더 높은 순위입니다. 별이나 컨트리뷰터 모두 2~3위입니다.

Q. 제플린을 많이 사용하는 대표적인 기업은 어디일까요?

“오픈소스 소프트웨어는 그냥 가져다가 쓰기 때문에 누가 쓰는지 일일이 조사하는 것이 불가능합니다. 알려진 곳 중 규모가 좀 있는 회사라면 트위터를 들 수가 있습니다. 트위터에서 1000명 정도가 제플린을 사용한다고 합니다”

Q. 국내에서 시작된 오픈소스 중에 이런 인기는 없었는데, 인기의 비결이 있다면 뭘까요?

“일단 시기가 잘 맞았습니다. 제플린이 나왔을 때 스파크가 엄청 인기를 끌고 있었는데, 제플린이 스파크 사용자에게 딱 맞았거든요.

또 하나 저희가 제플린을 처음 만들었지만, 주도하려고 들지 않았습니다. 커뮤니티에서 오픈소스를 하려면 많은 것을 결정해야 합니다. 저희는 그 결정을 커뮤니티 내에서 하려고 노력했습니다. 가고 싶은 방향은 있었지만 결정을 온라인으로 가져갔습니다. 외부의 개발자들이 본인들도 결정에 참여하고 있다고 느낄 수 있었습니다.

굉장히 많은 오픈소스 프로젝트가 있습니다. 가만히 보면 어느날 갑자기 새로운 기능이 생깁니다. 특정 집단 내부에서 결정하고 소스만 공개하는 것이죠. 이런 방식으로는 기여자들에게 어필하기 힘들다고 생각합니다”

Q. 제플린X는 어떤 회사입니까?

“원래는 CDN(Contents Delivery Network) 회사입니다. 내부적으로 하둡을 사용했는데 하둡은 너무 복잡해서 분석이 어려웠습니다. 하둡 생태계 보니까 스팍, 맵리듓, SQL on Hadoop, NoSQL 등 분석 플랫폼은 많은데 분석 환경은 쓸만한 것이 없었습니다.

이 문제를 해결하려고 자체적으로 만든 것이 결국 제플린이 됐습니다. 저희가 사용하려고 만들었는데, 이것을 사람들이 쉽게 사용할 수 있도록 하자고 방향을 바꾼 것이죠. 이제는 제플린이 회사의 주력입니다”

Q. 애써 개발한 소프트웨어를 왜 아파치재단에 기증했나요?

“제플린을 오픈소스화 하기 전부터 아파치로 가고 싶었어요. 시작할 때부터 생각했죠. 빅데이터 분야에서 아파치가 큰 역할을 했습니다. 아파치 생태계에 분석환경이 비어있었고, 시작할 때부터 아파치로 가야겠다는 목표가 있었습니다.

하지만 처음부터 아파치에서 시작한 것은 아닙니다. 처음에는 자체적으로 오픈소스 리포지토리를 운영했습니다. 그런데 어느날 보니까 스페인과 유럽의 이름 모를 회사가 제플린으로 뭔가를 만들었다고 하더군요. 그걸 보고 이제 됐다 싶어 아파치재단 인큐베이션에 제안했습니다”

Q. 제플린을 오픈소스로 공개했는데, 제플린X의 수익모델은 무엇입니까? 상용 라이선스를 팔거나 유지지원서비스를 서브스크립션으로 판매하나요?

“아닙니다. 저희 회사 규모에서 제플린으로 유지지원 서비스를 하는 것은 어렵습니다. 제플린의 발전을 위해서는 저희 말고 좀더 큰 회사들이 제플린을 서비스하는 것이 낫다고 봅니다. 호튼웍스와 같은 회사들이 제플린을 서비스 하고 있습니다.

저희는 이런 서비스보다 제플린 허브라는 상품을 만들 계획입니다. 제플린이 만든 노트북을 공유하는 서비스입니다.(여기에서 말하는 노트북이란 컴퓨터가 아니라 빅데이터 분석을 위한 분석코드나 SQL이 적혀있는 문서입니다)”

Q. 노트북 허브에 대해 좀더 설명해주세요.

“깃 허브를 생각하시면 됩니다. 깃 허브는 여러 깃을 모아놓고 사람들이 쉽게 검색하고 다운로드 할 수 있도록 한 서비스 아닙니까? 노트북 허브도 마찬가지입니다. 분석가들이 만든 노트북을 공유할 수 있는 서비스죠”

Q. 국내에서 오픈소스를 하려는 개발자나 개발사에게 한마디 부탁드립니다.

“저는 성공적인 오픈소스가 되려면 주변 비즈니스나 이해관계자들을 많이 만드는 것이 중요하다고 생각합니다. 심지어 경쟁사라도 늘어나는 것이 좋습니다. 제플린으로 돈을 벌든, 그냥 이용만하든 제플린과 관련된 이해관계자가 많아짐으로써 제플린은 더욱 활성화 됐습니다.

만약 제플린을 저희만 했다면 매우 위험한 프로젝트가 됐을 것입니다. 이제는 세계적으로 많은 회사들이 제플린과 이해관계를 맺고 있기 때문에 망하기 힘든 프로젝트가 됐죠. 한두 회사가 제플린을 접는다고 해도 다른 회사들이 공헌하고 서비스하기 때문입니다.”

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network



Categories: 기사, 인터뷰

Tags: , , , , , ,

댓글 남기기

%d 블로거가 이것을 좋아합니다: