“복잡한 데이터 관계, 그래프로 해결”…글로벌 겨냥하는 비트나인
행(Row)과 열(Column)을 기반으로 스키마가 갖춰진 데이터는 틀을 따라 분석하고 처리한다. 과거의 데이터 환경은 금융 거래 내역이나 인적 사항 등 행과 열로 딱 떨어지는 스키마 기반의 정형 데이터가 대다수였다. 이에 스키마 테이블 형태로 데이터를 처리하는 관계형 데이터베이스관리시스템(RDBMS)만으로도 관리가 가능했다.
하지만 무궁무진한 IT 서비스 생태계는 정형화된 데이터만 요구하지 않는다. 복잡한 데이터 간의 관계를 이어 도식을 구성하고 제대로 된 분석 결과를 내야 한다. 특히나 데이터 간 연관성이 갈수록 복잡해지는 현재 흐름에서는 더욱 그렇다.
그래서 각광받는 게 그래프 DBMS(GDBMS)다. 네트워크를 점과 선으로 연결해 그래프 형태로 저장한다. 우리가 생각이 막히면 메모지에 고민거리들을 선으로 이어보고 심사숙고하는 걸 생각하면 쉽다.
2013년 설립한 비트나인은 ‘아젠스(Agens) 그래프’를 제공하고 있다. 그래프를 통한 관계 분석 기능을 제공하는 GDBMS이면서 정형 데이터 처리 성능이 좋은 RDBMS의 장점은 놓치지 않은 솔루션이다.
황장현 비트나인 기술본부장(부사장)은 “아젠스 그래프는 관계형 모델과 그래프 모델을 합친 멀티 아키텍처를 지원한다”며 “오픈소스인 포스트그레SQL을 기반으로 확장해 만들었기 때문에 다양한 관리 기능과 처리 안정성을 자랑한다”고 강조했다.
그의 말처럼 데이터 모두가 그래프 형태를 요구하진 않는다. 고객 데이터 집계나 거래 내역 등 행과 열에 맞춘 스키마가 필요한 데이터는 RDBMS처럼 처리하고 그 외 관계 데이터는 그래프로 저장·처리한다는 설명이다.
예를 들어 은행이라고 치자. 예금 잔액이나 거래 일자, 고객 인적 사항은 RDBMS로 충분하다. 하지만 보이스피싱에 따른 대량 예금 인출이나 부정 대출 같은 금융사고는 뒤에서 일어나는 ‘관계’를 읽어야 방지할 수 있다.
여기서 GDBMS가 힘을 발휘한다. A라는 사람이 언제 얼마나 예금을 인출했고, 이 사람이 또 누구에게 돈을 보내고, 다른 사람과의 거래 내역에서 이상한 점은 없는지 등의 데이터간 관계를 그래프 형태로 파악해 한 눈에 파악할 수 있다. 기존 RDBMS만 썼다면 데이터 하나하나를 들여다보며 일일이 관계를 파악하는 프로세스가 추가로 필요했겠지만 GDBMS는 이러한 과정이 훨씬 수월하다.
비트나인은 GDBMS 기반의 ‘이상금융거래탐지시스템(FDS·Fraud Detection System)’ 기능인 G-FDS를 제공한다. 물론 FDS 자체는 새로운 것이 아니지만, G-FDS는 블랙리스트의 접속 IP나 행동 룰북 정도로 이상행위를 탐지하는 기존 FDS의 단점을 보완했다. 황 부사장은 “노드 간의 연결 관계를 분석해 의심스러운 연결을 식별하고 패턴을 찾아낸다”고 부연했다.
GDBMS가 힘을 발휘하는 분야는 또 있다. 이커머스 분야에 쓰임새가 좋다. 사용자 행동 패턴과 판매하는 제품의 속성을 모델링해 개인화 추천이 가능하다. 사용자가 언제 어떤 제품을 샀는지, 특정 제품을 샀을 때는 또 다른 제품 무엇을 검색했는지, 고객군 간 공통점이나 차이점은 무엇인지 등 사용자 행동을 관계도로 도식화해 유사한 선호도를 가진 사용자를 추려내고 제품을 추천할 수 있다.
또 공급망의 경우에도 공급자, 창고, 운송 수단 등의 관계를 모델링해 운송 경로를 최적화하고 비용을 절감할 수 있다는 게 황 부사장의 설명이다. 같은 데이터라도 관계를 통해 새로운 통찰력을 낼 수 있는 셈이다.
챗GPT와 같은 생성 인공지능(AI) 기술을 발전시키는 데도 GDBMS가 도움이 된다. 예를 들어 자연어 모델을 학습 시킬 때는 문맥을 이해하고 정보 조각을 연결하는 작업이 필요하다. 이때 GDBMS를 활용해 자연어 데이터를 그래프 형식으로 정리하면 관계 파악이 용이해 이해력 향상도 이끌 수 있다.
황 부사장은 “결론적으로 GDBMS는 다양한 분야에 걸쳐 기존 DBMS가 제공할 수 없는 인사이트를 제공한다고 말할 수 있다”며 “복잡한 정보를 표현하는 강력한 도구이며 자연어 처리, 추천 시스템이나 검색 엔진을 포함한 광범위한 응용 프로그램에도 적합한 솔루션”이라고 말했다.
아젠스 그래프는 기본적으로 GDBMS다. 하지만 기본기로 여겨지는 RDB에 대한 완벽한 기술적 이해 또한 갖췄다는 게 황 부사장의 설명이다. 아젠스 그래프 출시 전 포스트그레SQL 기반의 ‘아젠스 SQL’을 내놓은 것도 이 같은 맥락이다. 데이터 처리에 대한 핵심 기술을 먼저 제대로 개발한 뒤 GDBMS를 확산시키려던 전략이 숨어 있었다.
지난해에는 아젠스 SQL 2.0 버전을 내놓기도 했다. 또한 GDBMS 환경 구축용 포스트그레SQL 확장 프로그램 ‘아파치 AGE’를 내놓은 회사는 RDBMS부터 GDBMS 전반을 아우르는 데이터 전문기업으로 자리잡는 게 목표다.
비트나인은 한국을 비롯해 미국 실리콘밸리와 파키스탄에 연구개발(R&D) 센터를 구축하고 맞춤형 DBMS 제공에도 힘 쏟을 계획이다. 글로벌 시장 진출에도 속도를 더한다.
황 부사장은 “비트나인은 코어 개발과 고도화한 데이터 분석, 시각화 등 DBMS 자체에 대한 강력한 기술 역량을 보유하고 있다”며 “고객의 요구사항에 따라 전폭적으로 맞춤형 지원을 할 수 있다는 것도 큰 자산”이라고 말했다.
글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network