말로 하는 데이터 검색…오라클이 제시한 새로운 패러다임

앞으로 데이터베이스관리시스템(DBMS)을 만지는 개발자들이 수다스러워질지도 모르겠다. 오라클이 자사DBMS에 신기술을 접목해서다. 생성 인공지능(AI)을 접목해 말만 하면 SQL 질의를 만들어주는 기능을 붙이는가 하면 관계형 DBMS에서도 제이슨(JSON)이나 그래프 타입까지 지원한다는 설명이다.

24일 오라클에 따르면 자사 DBMS ‘23c’에는 다수의 신기술이 베타로 접목된 상태다. 생성AI의 단점으로 꼽혔던 할루시네이션(환각) 현상을 줄이고 올인원 DBMS로 활용할 수 있도록 지원하고 있다.

장성우 한국오라클 전무는 “이제까지는 데이터의 포맷에 따라 DBMS에 종속되는 문제가 있었다”고 말했다. 오라클 23c는 기본적으로 관계형 DBMS. SQL 언어를 통해 정형화된 데이터를 관리하는 형태다.하지만 영상이나 사진 등 비정형 데이터를 관리하려면 기업들은 23c와 별도로 JSON이나 그래프를 지원하는 비관계형 DBMS를 채택해야 했다.

데이터 형태에 따라 DBMS를 따로 써야 하는 불편함이 있었던 셈이다. 애플리케이션별로 서로 다른 DBMS를 쓰면서 돈은 돈대로 들이고 인력까지 투입해야 하는 어려움이 생겼다.

하지만 이제 그런 걱정은 접어도 될 듯하다. 오라클은 23c에 ‘릴레이셔널 듀얼리티 뷰(Relational Duality View)’ 기능을 넣어 비관계형 DBMS가 지원하는 JSON과 그래프 데이터까지 주고받을 수 있도록 했다. 장 전무는 “다양한 데이터 포맷을 관계형 DBMS에서 관리할 수 있다”면서 “모든 데이터 변환은 (23C) 안에서 관리할 수 있어 비용 절감과 생산성 증가 효과가 있다”고 강조했다.

놀라운 것은 또 있다. ‘검색 증강 생성(RAG·Retrieval Augmented Generation)’ 기능이 그것이다. 거대언어모델(LLM)을 기업 비즈니스 데이터를 결합해 자연어 질문에 대한 답을 내놓는다. 생성AI 기업 코히어(Cohere)와 협력하고 있는 오라클은 코히어의 LLM을 활용해 개발자들이 자연어로 질의를 넣으면 그에 대한 데이터 값을 제공해 준다.

특히 SQL 구문 생성 기능은 획기적이다. 자연어 프롬프트나 마이크를 통해 말로 명령을 넣으면 SQL 구문으로 변환해 질의를 넣어준다. 개발자 입장에서는 SQL 구문을 따로 익힐 필요가 없다. 바꿔 말하면 전문가가 아니더라도 쉽게 데이터 관리 업무가 가능하다는 뜻이다.

장 전무는 “지금은 모두 코딩이 필요하지만 RAG는 말로 서술한 내용을 이해해 실행하는 형태”라며 “모든 데이터 관리와 앱 개발의 변화를 이끌어낼 수 있다”고 말했다.

이 같은 기능 구현이 가능한 건 23C가 지원하는 ‘AI 벡터 서치(Vector Search)’ 기능 덕분이다. 생성AI, 특히 LLM을 활용한 챗봇은 프롬프트를 제대로 이해하지 못하거나 잘못된 데이터를 답으로 가져오는 환각 현상이 문제로 대두된다.

쉽게 말해 벡터란 다양한 포맷의 데이터를 숫자로 표현하는 것을 말한다. 이에 기업의 데이터를 LLM이 이해하기 쉬운 벡터 형태로 저장하고, 이를 다시 벡터 형태로 검색하기 때문에 환각을 줄일 수 있다는 게 장 전무의 전언이다.

장 전무는 “벡터화를 통해 질문과 가장 연관도가 높은 정보를 가져오고 이를 이용해 답을 내는 것이 바로 RAG 기술”이라며 “다양한 형태의 데이터에서 자연어 프롬프트의 이해도를 높이고 정확한 SQL 질의 결과를 낼 수 있다”고 말했다.

단 앞으로도 해결해야 할 과제는 남아있다. 금융권이라면 실시간으로 변하는 금리나 주가 등을 확인해야 하지만 실시간으로 벡터화하는 데는 한계가 있다. 향후 오라클은 이 같은 문제를 해결하기 위해 실시간으로 기업 데이터를 LLM에 물리는 플러그인도 제공할 방침이다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다