나쁜 데이터란 없다, 데이터스택스의 데이터 활용법

이 기사는 지난 5월 12일 진행된 바이라인플러스 웨비나 <최신 클라우드 데이터베이스 기술과 동향>의 발표 세션을 기사화한 것입니다. 

“세상에 나쁜 데이터는 없습니다.”

지난 12일 바이라인플러스가 개최한 웨비나에서 데이터스택스 코리아 이규현 전무는 데이터에 대해 이렇게 말했다. 데이터가 나쁘지 않다, 중요한 것은 데이터를 저장해서 어떻게 활용할 수 있느냐의 문제다. 이 날 이규현 전무는 ‘세상에 나쁜 데이터는 없다, DB/CDC 매니지드 서비스로 제대로 데이터를 활용하자’라는 주제의 발표를 진행하며 서비스로서의 데이터베이스(DB-as-a-Service), 아스트라(Astra) DB를 소개했다.

우선 데이터스택스는 오픈소스 NoSQL 데이터베이스인 아파치 카산드라(Apache Cassandra)를 완전관리형 서비스로 제공하는 기업이다. 이규현 전무에 따르면 카산드라 개발 90%는 데이터스택스의 엔지니어 개발자가 개발, 유지, 버전 업그레이드를 진행하고 있다. 카산드라는 확장성, 빠른 성능, 고가용성 3가지를 특징으로 한다.

이규현 전무는 현재 전 분야가 SaaS(Software-as-a-Service)로 전환되고 있다고 설명했다. 데이터베이스도 마찬가지다. 2025년에 65.8%가 서비스로의 데이터베이스로 전환될 것이라는 전망도 있다.

아스트라 DB는 데이터스택스의 서비스로서의 DB다. 특정 데이터 타입만을 지원하는 것이 아니라 전분야를 지원하는 카산드라를 기반으로 하는 만큼 아스트라DB는 엔터프라이즈 버전에서 도큐먼트 DB, 타임시너지, 키벨류, 컬럼 패밀리 등을 모두 지원한다. 데이터스택스는 개발자 친화적인 다양한 API를 제공하는 스타게이트도 제공한다. 아스트라 DB, 스타게이트 모두 서버리스다. 데이터를 실시간, 혹은 거의 실시간으로 연결할 수 있는 아스트라 스트리밍(Astra Streaming)까지 서비스 제공 범위를 확장했다. 

이 날 이규현 전무는 “데이터스택스가 세상 모든 데이터를 리얼 타임(Real-Time)으로 연결할 수 있는 생태계를 만들어서 지원하고 있다”고 밝혔다.

 카산드라 DB는 언제든 24시간 서비스 가능한 고가용성, 초당 몇백만건 생산하는 데이터를 처리하는 빠른 성능, 최고의 확장성을 장점으로 가져 NoSQL DB의 표준일 정도다. 기존 DB 사용자들은 데이터 활용의 어려움, 운영의 어려움, 과도한 비용을 가졌는데 이 점을 NoSQL 아스트라DB가 해결 가능하다고 강조했다.

 이에 더해 이규현 전무는 서버리스 기반 기능 플랫폼 데이터스택스 CDC (DataStax CDC)를 소개했다. 데이터스택스 CDC는 기존 데이터가 방대하게 쌓인 NoSQL DB, 머신러닝 환경, 검색 연동 환경 등과 연동할 수 있는 데이터 스트리밍 서비스, 변경 데이터 캡처(CDC)다. 기존 데이터에서 고부가가치를 창출할 수 있게 돕는 셈이다. 데이터 통합, 이벤트 기반 아키텍처, 데이터 과학, 전문 검색, 실시간 앱도 가능하다. 핵심 기능은 카산드라 소스 커넥터로 변경 데이터 스트림에서 중복을 제거하는 로직을 제공하는 커넥터다. 이규현 전무는 기업이 해당 기능을 개발할 수도 있지만 서버리스 기반 데이터 스트리밍을 활용하면 수월하게 적용할 수 있다고 말했다. 

또한 이 날 이 전무는 데모 포함한 설명의 마무리로 “카카오톡을 할 수 있으면 아스트라 DB를 사용할 수 있다”고 강조했다.

 글. 바이라인네트워크
<성아인 기자> aing8@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다