AI로 비정형 데이터 검색도 빠르게…개발자 혁신 지원하는 몽고DB

인공지능(AI) 기술이 데이터베이스관리시스템(DBMS)에까지 녹아들었다. 몽고DB가 AI를 접목한 기능으로 기업의 데이터 비즈니스를 돕는다고 밝혔다. 비정형 데이터 관리에 AI를 접목해 거대언어모델(LLM) 학습과 도움을 주는 기능이다. 관계형DBMS에 담긴 데이터를 손쉽게 옮겨오는 기능도 새로 추가해 개발자 친화적인 DBMS 기업으로 자리매김한다는 포부다.

13일 서울 양재동 엘타워에서 ‘몽고DB 닷로컬 서울(MongoDB.local Seoul)’ 컨퍼런스가 개최됐다. 자사의 신기술과 시장전략, 개발자를 위한 정책 등을 한국 사용자들에게 소개하는 자리다.

사히르 아잠(Sahir Azam) 몽고DB 최고제품책임자(CPO)는 기조연설을 통해 새로 공개한 신기능을 집중 조명했다. 아잠 CPO는 “몽고DB는 데이터의 힘으로 혁신가들에게 더 많은 역량을 제공하는 것이 목표”라며 “까다로운 애플리케이션 현대화도 적극 지원하겠다”고 밝혔다.

이날 기조연설에서 눈에 띈 건 단연 AI 관련 기능이다 비정형 데이터를 벡터화해 사용자가 쉽게 데이터 정리와 분석을 돕는 기능이 소개됐다.

사히르 아잠 몽고DB CPO가 기조연설을 통해 자사 솔루션의 강점을 소개하고 있는 모습.

몽고DB가 쓰는 NoSQL은 사진이나 영상 같은 비정형 데이터를 다루는 데 적합하다. 몽고DB는 제이슨(JSON) 형식으로 데이터를 저장하고 질의하도록 설계해 스키마가 없는 비정형 데이터에 더 적합한 비관계형 DBMS다.

유연성이 강점으로 꼽히지만 영상, 음성, 사진 등 비정형 데이터는 스키마가 없어 적확한 데이터를 빨리 찾는 데는 다소 안정성이 떨어질 수 있다는 편견이 존재했다.

그래서 내놓은 것이 ‘아틀라스 벡터 서치(Atlas Vector Search)’다. AI를 활용해 비정형 데이터를 벡터로 저장하고 다양한 데이터의 검색을 보다 쉽고 빠르게 지원하는 기능이다.

아잠 CPO는 자동차 수리를 예로 들었다. 몽고DB에 자동차와 관련한 정보를 모두 담아 놓고 이를 벡터화한다. 또한 자동차에서 나오는 파열음이나 배기음 등 소리까지 모두 벡터화 해 저장해 놓는다.

만약 고객이 소리를 녹음해 증상을 파악해 달라고 했다면, 이를 벡터화해놓은 소리 데이터와 비교해 증상을 쉽게 확인하는 식이다. 일일이 자동차를 수리센터에 가져와 뜯어보는 수고를 덜 수 있는 형태다. 또한 벡터를 통해 빠른 쿼리 검색이 가능해져 검색 속도 또한 빨라진다. 해당 기능은 현재 퍼블릭 프리뷰 상태로 누구나 신청하면 체험해볼 수 있다.

특히 벡터 서치는 LLM 학습에도 활용된다. 고객이 어떤 LLM을 도입해 학습하려 할때 소리나 영상 같은 비정형 데이터는 LLM이 쉽게 학습하지 못한다는 게 그의 설명이다. 이에 벡터 서치가 먼저 데이터를 벡터화해놓고, 이 데이터를 LLM에 학습시키면 비정형 데이터까지 제대로 학습한 LLM을 쓸 수 있다는 게 아잠 CPO의 말이다.

기존에 쓰던 DBMS의 데이터도 마이그레이션할 수 있는 ‘릴레이셔널 마이그레이터(Relational migrator)’도 소개했다. 관계형DBMS에 담긴 데이터터라도 몽고DB로 중단 없이 옮길 수 있는 기능이다.

아잠 CPO는 “관계형 DBMS의 스키마를 이해하고 마이그레이션 한뒤 최종 구동까지 전체 라이프사이클을 관리해주는 기능”이라며 “여기에도 AI를 접목하는 방안을 연구하고 있다”고 말했다.

몽고DB는 비주류로 인식되는 비관계형DBMS의 한계를 넘어 한국 시장에서도 선전하고 있다. 지난해까지 450곳 정도였던 고객사 수가 680곳으로 늘어났다. 또한 정보통신산업진흥원(NIPA)이 발간한 ‘2022 오픈소스SW(OSS) 실태조사 보고서’에 따르면 향후 1년  가장 써보고 싶은 DBMS로 몽고DB가 꼽히는 등 국내에서도 널리 확산하고 있다는 게 한국 지사의 설명이다.

신재성 몽고DB코리아 지사장은 한국에서도 몽고DB의 확산이 가속화하고 있다고 밝혔다. (사진=몽고DB코리아)

신재성 몽고DB코리아 지사장은 “몽고DB는 한국 비즈니스에서 개발자를 가장 중심에 두고 있다”며 “개발자가 개발뿐 아니라 운영까지 관장하는 시대에서 얼마나 쉽고 빠르게 개발자의 효율을 높이느냐에 중점을 둔다”고 말했다.

이어 “국내 기업이 모든 워크로드를 위한 전사적인 최신 애플리케이션을 구축할 수 있는 최상의 플랫폼으로 역할하고 있다”면서다양한 업계의 수백여 기업이 몽고DB의 개발자 데이터 플랫폼을 통해 디지털 현대화를 이끌고 비즈니스 성과를 달성하고 있다고 덧붙였다.

한편 이날 컨퍼런스에서는 몽고DB를 활용한 고객사 사례도 소개됐다. 삼성전자 디지털어플라이언스(DA) 사업부의 임성빈 프로는 몽고DB를 도입해 레이턴시 시간을 줄이는 한편 DBMS 장애 또한 ‘제로(0)’가 됐다고 밝혀 눈길을 끌었다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다