[인터뷰] “기본 없는 데이터는 사상누각…‘가상화’가 올바른 관리 열쇠”
데이터 중요한 건 알겠는데, 정작 제대로 쓰려니 할 일이 첩첩산중이다. 비싼 데이터베이스관리시스템(DBMS)을 들여봤자, 옳은 관리 방법을 택하지 않으면 말짱 도루묵. 데이터패브릭(Fabric)이나 데이터메시(Mesh) 같은 다양한 개념도 관리자 입장에서는 혼란을 느끼게 하는 요소다.
복잡한 데이터의 실타래를 푸는 기업이 있다. 데이터 비즈니스 전문기업 엔코아는 ‘가상화’를 통해 데이터를 효과적으로 관리하고, 플랫폼 체계를 도입해 복잡한 데이터를 조화롭게 활용하라고 조언한다.
김범 엔코아 전략사업본부장(전무)은 바이라인네트워크와 인터뷰에서 “데이터패브릭과 메시 등 아키텍처 자체는 크게 중요하지 않다”며 “고품질의 데이터를 빠르게 확보하는 게 올바른 관리의 선제 조건”이라고 말했다.
최근까지 데이터 관리 아키텍처는 정형 데이터를 관계형 데이터베이스로 정리해 담는 데이터웨어하우스(DW)와, 비정형 데이터를 중심으로 여러 데이터 소스를 한 곳에 몰아 담는 데이터레이크(Lake)가 대표적인 모델이었다.
특히 호수에서 이름을 따온 데이터레이크는 방대한 데이터를 한 곳에 모은 장점은 있지만, 정제되지 않은 터라 불필요한 자료를 걸러내는 과정이 필요했다. 또 모든 데이터를 담아내기 때문에 스토리지나 서버 용량이 계속 커진다. 한 곳에 몰아넣은 만큼 본인과 관계없는 민감한 데이터까지 확인하는 경우가 생겨 보안 이슈 또한 일어날 수 있었다.
여기에 데이터패브릭과 데이터메시라는 개념도 등장했다. 김범 전무에 따르면, 데이터패브릭은 데이터 소비자 수요에 맞춰 중앙화하는 게 핵심이다. 활용할 데이터를 엮어 시각화, 분석 솔루션 등 다양한 도구를 활용해 탐색을 편리하게 하는 게 골자다.
예컨대 마포구 도서관과 서대문구 도서관이 있다고 치자. 도서관 각각에 대출목록이 존재하겠지만, 마포도서관 사서는 자신이 속한 곳의 목록만 볼 수 있을 테다. 이에 마치 모든 자치구 도서관의 대출목록을 볼 수 있는 중앙도서관의 개념으로 데이터를 거버닝(Governing)해 가시성을 높이는 아키텍처가 데이터 패브릭이다.
반대로 데이터메시는 도메인에 맞춰 데이터를 디센트럴라이즈(Decentralize), 즉 주제에 맞게 비중앙화하는 개념이다. 자신이 쓰려는 데이터 영역을 빠르게 탐색할 수 있도록 경량화하는 게 핵심이다. 메시라는 단어를 붙인 것도 그물망처럼 필요한 데이터를 걸러내는 분산형 접근 방식을 쓰기 때문이다.
하지만 이 모든 건 아키텍처의 방향성일 뿐 올바른 데이터 관리의 열쇠는 제대로 된 가상화라는 게 김범 전무의 말이다.
데이터 가상화는 물리적 스토리지를 따로 사용하지 않고 논리적 레이어로 복사해 통합된 관점(싱글뷰)로 보여주는 것을 말한다. 원본은 본래의 테이블에 있고, 메모리단으로만 불러와 활용한다. 스토리지 낭비 없이 바로 분석할 수 있어 이상적인 데이터 관리 방안으로 꼽힌다. 그는 “어떤 방법으로 모았든 데이터가 엉망이면 곤란하다”면서 “가상화가 받쳐주지 않으면 의미가 없다”고 말했다.
단 가상화에도 과제는 있다. 레이어를 하나 더 만들면서 성능이 떨어질 수 있다. 이에 플랫폼 솔루션을 통해 가시성을 확보하고, 다양한 관리도구를 통해 효율을 높여야 가상화의 이점을 오롯이 누릴 수 있다.
엔코아는 자사의 ‘데이터웨어(Dataware)’를 통해 가상화 성능 또한 높일 수 있다고 강조한다. 데이터웨어는 데이터 가상화를 비롯해 ▲메타데이터 관리 ▲데이터 품질 관리 ▲애플리케이션 영향도 분석 ▲데이터 흐름 관리 ▲데이터 통합 등 기능별 솔루션을 모은 통합관리 서비스다. 각각의 기능을 플러그인 형태로 장착할 수 있고, 하나의 통합 웹 기반 포털 형태로도 제공한다.
김 전무는 “데이터 관리는 모델 설정, 진단, 영향도 등 굉장히 다각적인 포인트로 접근해야 한다”며 “엔코아는 모든 관리 툴을 풀 스택으로 갖추고 있다”고 설명했다.
특히 데이터 모델링 툴 ‘디에이샵(DA#)’에는 인공지능(AI)까지 심었다. 최근 디에이샵 AI 파워드팩을 출시했다. 챗GPT 기반의 자동화 기능을 탑재해 보다 쉽게 데이터 표준화가 가능하다는 설명이다.
김 전무는 데이터웨어를 “고품질의 데이터를 신속하게 관리할 수 있는 데이터 옵스(Ops) 제품”이라고 표현했다. 운영(Operation)에서 따온 옵스의 어원처럼 데이터 운영에 꼭 필요한 도구라는 것. 특히 디지털 전환을 성공적으로 이루기 위해서는 데이터를 제대로 자산화해 식별과 이해, 활용까지 제대로 이어져야 한다는 게 김 전무의 생각이다.
그는 “기본이 없으면 모든 데이터는 사상누각일 뿐”이라며 “근간이 되는 데이터 가상화가 잘 이뤄져야 하고, 그 기본이 갖춰진 솔루션이 데이터웨어”라고 강조했다.
글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network