[기획/DB②] ‘OLTP+OLAP’ 융합 솔루션 각광
데이터는 모든 업무의 토대이자 재료입니다. 적확한 방법으로 저장하고 관리하지 않으면 좋은 재료를 갖고도 맛있는 요리를 내놓을 수 없습니다. 데이터베이스는 그래서 중요합니다. 데이터를 제대로 다뤄야 업무가 제대로 돌아가겠죠. 데이터베이스의 뼈대는 무엇이고 지금의 흐름은 무엇일까요. 3회에 걸쳐 알아봅니다. <편집자주>
목차
1회 – ‘관계형’VS‘비관계형’ DB 경쟁에서 융합의 시대로(지난호)
2회 – ‘OLTP+OLAP’ 융합 솔루션 각광(이번호)
3회 – 춘추전국시대…시장은 ‘무중단·분산·클라우드’ 주목(다음호)
좋은 데이터베이스관리시스템(DBMS)의 덕목은 데이터의 원활한 저장과 관리다. 이제까지는 데이터 대부분이 온라인거래처리(OLTP)에 적합한 개인 정보나 거래 현황 등 정형 데이터였던 터라 관계형 DBMS(이하 RDBMS)가 널리 사용됐다. 영상과 사진, 음성 등 데이터의 형태는 갈수록 복잡해졌고, 이러한 비정형 데이터에 대한 분석 수요가 늘며 온라인거래처리(OLAP)를 위한 NoSQL 기반 비관계형 DBMS가 부상했던 게 현재까지의 상황이다.
하지만 원활한 저장 및 관리라는 기본기를 갖춘 관계형 DBMS(이하 RDBMS)에 OLAP 기능을 녹인 제품이 등장하기 시작했다. 반대로 비관계형 DBMS 진영도 RDBMS 기능을 어필한다. ‘OLTP+OLAP’의 융합형 DBMS 시장이 태동한 셈이다.
오라클의 진화가 두드러진다. 상용 RDBMS로 명성을 쌓았던 오라클은 ‘MySQL 히트웨이브(HeatWave)’로 융합형 DBMS 시장에 발을 내디뎠다. 본래 RDBMS를 활용해 비정형 데이터를 분석하려면 추출·변형·적재를 뜻하는 ‘ETL’ 과정이 필요하다. 데이터 소스로부터 데이터를 추출한 뒤 원하는 구조로 저장하기 위해 데이터를 변환, 이후 변환한 데이터를 스토리지나 데이터웨어하우스(DW)로 적재하는 과정이 필요했던 것. 이 과정에서 시간이 소모되고 데이터 중복 문제가 생겼다.
MySQL히트웨이브는 인공지능(AI) 머신러닝 기능을 넣어 OLAP도 충분히 수행한다는 게 오라클의 설명이다. 데이터 세트에서 지정된 작업에 최적화한 초매개변수와 알고리즘을 모델을 자체 생생해 머신러닝으로 분석 작업을 수행한다. 오라클 테크니컬 에반젤리스트인 김석 노브레이크 대표는 히트웨이브는 “OLTP를 기본으로 하면서도 OLAP을 ETL 없이 구현할 수 있다는 점에서 비용과 시간을 줄일 수 있는 효율적인 서비스”라고 설명했다.
인메모리 기반의 DBMS인 SAP의 ‘하나(HANA)’는 공간데이터, 머신러닝 연산 등의 기능이 내장돼 별도의 서드파티 솔루션 없이 데이터 분석 기능을 사용할 수 있다. 이밖에도 제이슨(JSON) 지원을 강화하고 그래프 엔진 등의 기능을 고도화해 다양한 비정형 데이터 활용 환경을 제공한다는 설명이다. SAP코리아 관계자는 “OLTP 또는 OLAP이냐의 구분으로는 현재 기업의 워크로드를 모두 아우르기는 어렵다”며 융합형 DBMS의 중요성을 강조했다.
RDBMS로 익숙한 마리아DB도 별도의 OLAP 솔루션을 제공한다. 분석에 초점을 맞춘 ‘컬럼스토어(ColumnStore)’는 트랜잭션을 비롯해 대용량 병렬 분석을 통해 빅데이터 OLAP가 용이하다는 설명이다. 이우상 마리아DB코리아 지사장은 “아직 점유율은 아주 높지 않지만 이에 대한 수요는 꾸준하다”고 말했다.
티맥스티베로는 RDBMS ‘티베로7’에 추가된 인메모리 컬럼 스토어(IMCS)를 통해 OLAP 기능을 강화했다. 메모리상에 컬럼 기반으로 데이터를 저장·처리할 수 있어 OLAP 업무가 가능하다. 테이블 및 파티션의 컬럼을 메모리에 저장해 속도가 빠르다. 속도가 빠르니 복잡한 데이터도 빨리 저장하고 분석한다. 또한 DBMS 성능관리 솔루션 ‘시스마스터DB’를 활용해 티베로 사용 환경에서 최적의 성능을 지원하고 있다. 클라우드 환경에서도 효율적인 성능과 관리를 지원하기 위해 최근 새롭게 출시한 ‘시스마스터DB 8(SysMasterDB 8)’는 대규모 시스템 성능관리 아키텍처를 제공, 최소한의 부하로 대용량 데이터의 수집과 관리를 돕는다.
조연철 티맥스티베로 제품개발팀장은 “기존 OLTP 위주의 처리 구조에서 OLAP 업무도 처리가 가능하게 확대한 기능”이라며 “사용자는 OLAP 업무를 위한 테이블을 인메모리 컬럼 구조로 로딩해 연산을 빠르게 처리할 수 있다”고 말했다.
반대로 OLAP에 특화한 NoSQL 진영은 RDBMS 개념을 녹이고 있다. NoSQL 기반의 비관계형 DBMS인 카우치베이스는 여러 테이블을 연결하고 합쳐 데이터를 보기 편하게 해주는 ‘Join’ 같은 RDBMS의 핵심 기능을 구현해준다. 또한 NoSQL은 말 그대로 SQL을 쓰지 않는 터라 개발 언어를 새로 배워야 했지만 카우치베이스가 쓰는 ‘니켈(N1QL)’은 ‘WHERE’, ‘FROM’ 등 SQL의 직관적인 키워드를 따른다.
김희배 카우치베이스코리아 지사장은 “개발자 개개인의 스킬셋을 그대로 지킬 수 있고, RDBMS 기능 수행도 충분히 가능하다”고 설명했다.
마찬가지로 NoSQL 기반의 도큐먼트 DBMS인 몽고DB 또한 OLTP와 OLAP 기능을 동시에 지원한다. 백단에 있는 데이터를 변경할 필요없이 그대로 실시간 분석에 활용할 수 있도록 해 효율성을 높였다. 정형 데이터를 도큐먼트로 전환하도록 도와주는 ‘릴레이셔널 마이그레이터(Relational Migrator)’ 로 정형 데이터의 스키마를 분석해 매핑할 수 있다. NoSQL을 기반으로 RDBMS를 활용하는 새로운 융합인 셈이다.
글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network