데이터베이스를 AI의 인프라로 재정의하려는 오라클
“오늘날 많은 회사가 인터넷에서 공개적으로 사용 가능한 대량의 데이터를 기반으로 AI 모델을 훈련하는 데 막대한 돈을 쓰고 있지만, 이런 모델이 최고 값에 도달하려면 개인 소유의 데이터도 사용할 수 있어야 한다.”
래리 엘리슨 오라클 회장 겸 최고기술책임자(CTO)는 최근 ‘오라클 AI월드 2025’ 기조연설에서 생성형 AI와 에이전틱 AI 시대 오라클의 경쟁력을 강조하며 이같이 말했다.
래리 엘리슨 CTO는 “사람들은 모델이 프라이빗 데이터를 추론하길 원하면서도, 자기의 데이터는 비공개로 유지하고 싶어한다”며 “오라클 AI 데이터 플랫폼, 오라클 AI 데이터베이스는 이미 그록, 챗GPT, 라마, 제미나이 등을 포함하고 있어서, 선택한 모델로 공개 데이터뿐 아니라 프라이빗 데이터를 추론할 수 있게 돼 있다”고 설명했다.
그는 “전 세계 고부가가치 데이터의 대부분은 이미 오라클 데이터베이스에 있기에 오라클이 특히 중요한 역할을 한다”며 “오라클은 이미 데이터베이스를 AI 모델에서 데이터를 추론에 사용하도록 변경했고, 그 AI 모델은 공개 데이터뿐 아니라 개인 데이터에 대해서도 추론할 수 있게 됐다”고 강조했다.
오라클은 그 스스로를 AI를 위한 인프라를 제공하는 회사로 정의하려 한다. 오픈AI GPT, 구글 제미나이, 앤트로픽 클로드, 메타 라마, xAI 그록 등 업계의 프론티어급 AI 모델 학습에 GPU 인프라를 제공하고, ‘AI 데이터베이스’로 이름을 바꾼 오라클 데이터베이스는 프론티어 모델에 기업 내부 데이터를 공급하는 데이터 인프라 역할을 한다. 오라클 SaaS는 이런 데이터베이스와 클라우드 인프라를 사용하는 AI 모델을 기반으로 AI 기능을 기업고객에게 제공한다.
트랜스포머 기반의 생성형 AI 모델은 21세기의 유틸리티, 혹은 인프라로 여겨진다. AI 모델이 비즈니스와 일상 기저에서 기능한다고 보기 때문이다. 오라클은 AI란 인프라의 인프라이길 바란다. 모델을 구축하고, 구동할 수 있는 인프라란 것이다. 보통 AI 인프라라면 GPU를 떠올리지만, 오라클의 시각에서 AI 인프라는 현실의 데이터센터와 논리적인 데이터베이스를 결합한 추상적 형태다.
단순히 엔비디아 GPU만 데이터센터에 설치한다고 AI 인프라라 볼 수 없고, GPU를 구동하기 위한 전력, 냉각, 네트워크, 스토리지 등 전반적인 데이터센터 설계 혁신이 필요하다는 얘기다. 많은 양의 GPU만 확보한 게 아니라 그를 위한 모든 물리적 환경을 재구축하고 있다는 점을 내세우는 이유다.
래리 엘리슨은 “오라클은 12억 와트 규모의 AI 두뇌를 구축하고 있으며, 애벌린 데이터센터는 50만개의 엔비디아 GPU를 담게 된다”며 “시중의 거의 모든 AI 모델이 오라클 클라우드에 있고, 다른 어떤 회사보다 더 많은 멀티모달 AI 모델을 훈련하는 데 참여하고 있다”고 말했다.

AI의 인프라에 데이터베이스를 포함시키는 시도는 프라이빗 데이터의 활용과 연관된다.
래리 엘리슨은 “우리가 구축하려는 것은 텍스트, 이미지, 오디오, 비디오 등 모든 유형의 데이터에 대해 훈련된 다중 모드 신경망”이라며 “그러나 이 AI 모델의 가장 큰 문제는 여러 이유로 사람들의 자신의 데이터를 비공개로 유지하길 원하기에 그 데이터를 훈련할 수 없다는 것”이라고 말했다.
그의 말처럼 챗GPT, 제미나이, 그록, 클로드 등의 AI 모델은 공개된 데이터를 학습한다. 특정 산업, 특정 기업, 특정 업무 종사자의 작업과 관련한 질문에 적절한 답을 내놓기에 익힌 정보의 수준이 제한적이다. 특정한 사용자의 요청에 답하려면 내밀한 사정을 알아야 하며, 공개되지 않은 프라이빗 데이터를 학습하거나 언제든 활용할 수 있어야 한다. 그렇지 않으면 엉뚱한 답을 내놓는 반쪽의 AI 모델이 된다.
개인과 기업의 프라이빗 데이터를 범용 AI 모델에 연결하는 일반화된 방법은 검색증강생성(RAG)이다. 오라클 AI 데이터베이스와 오라클 AI 데이터 플랫폼은 RAG 역량을 내장함으로써 안전하게 프라이빗 데이터를 활용하게 한다.
그는 “모델이 접근할 수 있는 데이터베이스에 정보를 넣기만 하면 된다”며 “RAG를 갖춘 오라클 데이터베이스에 저장된 데이터는 모든 데이터를 가져와 벡터화하며, AI 모델에서 접근할 수 있도록 하는 기능을 갖고 있다”고 설명했다.
그는 “많은 데이터가 이미 오라클 데이터베이스에 있으므로, 모델이 이해할 수 있는 형식으로 해당 데이터를 넣을 수 있는 오라클 데이터베이스만 있으면 된다”며 “OCI 오브젝트 스토어나 아마존의 오브젝트 스토어에 저장된 데이터도 오라클 데이터베이스는 벡터화하고 인덱스를 생성할 수 있다”고 덧붙였다.

오라클은 올해 컨퍼런스에 맞춰 오라클 AI 데이터베이스 26ai와 오라클 AI 데이터 플랫폼을 공개했다.
오라클 AI 데이터베이스 26ai는 데이터 관리의 핵심에 AI를 설계 반영해, 모든 데이터에 AI를 안전하게 적용할 수 있도록 돕겠다는 오라클의 비전을 한층 더 강화한다. AI 벡터 검색, 데이터베이스 관리용 AI, 데이터 개발용 AI, 애플리케이션 개발용 AI, 분석용 AI 등 데이터 및 개발 스택 전반에서 AI를 활용하는 차세대 AI 네이티브 데이터베이스라는 오라클의 ‘데이터 혁신을 위한 AI(AI for Data)’ 비전을 구체화한다. 이로써 프라이빗 데이터베이스 데이터와 공개 정보를 결합해 정교한 답변과 액션을 제공하는 동적 에이전틱 AI 워크플로우를 실행할 수 있다.
오라클 AI 데이터베이스 26ai는 ▲아파치 아이스버그 오픈 테이블 포맷 ▲모델 컨텍스트 프로토콜(MCP) ▲업계 선도 LLM ▲인기 에이전틱 AI 프레임워크 ▲오픈 신경망 교환(ONNX) 임베딩 모델 등을 포함한 다양한 지원을 담았다.
AI 데이터베이스는 AI가 데이터의 목적, 특성, 의미를 이해하도록 돕는 주석(Data Annotations) 기능을 제공한다. 이를 통해 AI는 더 나은 애플리케이션을 생성하고 자연어 질의에 보다 정확하게 응답할 수 있다. 기업은 AI 모델에서 즉시 활용가능한 시맨틱 데이터를 쉽게 생성할 수 있어 데이터 파이프라인의 수작업을 대폭 줄이게 됐다.
오라클 AI 데이터 플랫폼은 선도적인 생성형 AI 모델을 기업의 데이터, 애플리케이션, 워크플로우와 안전하게 연결할 수 있도록 설계된 포괄적 플랫폼이다. 자동화된 데이터 수집, 시맨틱 강화(semantic enrichment), 벡터 인덱싱에 생성형 AI 도구를 결합해 원시 데이터(raw data)에서 실제 운영 수준(production-grade)의 AI까지 전 과정을 단순화한다.
오라클 AI 데이터 플랫폼은 데이터를 AI에 최적화하고, 오라클 클라우드 인프라스트럭처(OCI), 오라클 자율운영 AI 데이터베이스, OCI 생성형 AI 서비스 등을 결합해 에이전틱 애플리케이션의 생성과 배포를 가능하게 한다.
후안 로이자 오라클 DB 기술 부문 총괄부사장은 “오라클 AI 데이터베이스는 AI와 데이터가 결합된 설계로 ‘데이터 혁신을 위한 AI’를 익히고 활용하기 쉽도록 한다”며 “오라클은 고객이 운영 시스템, 분석 데이터 레이크를 포함해 여러 위치에 저장된 다양한 데이터에서 신뢰할 수 있는 AI 인사이트, 혁신, 생산성을 손쉽게 얻어낼 수 있도록 지원한다”고 밝혔다.
오라클에서 제공하는 인프라 플랫폼 덕에 온전한 기능, 역할을 수행할 수 있는 AI 모델은 애플리케이션과 AI 에이전트의 성능도 꽃피게 한다.
오라클 클라우드 기반 위에 오라클 퓨전 SaaS 애플리케이션을 이용한다면 기업용 AI 에이전트도 활용하기 쉬워진다. 오라클 퓨전은 AI 에이전트 스튜디오란 개발도구와 오케스트레이션 도구를 제공해 업무용 애플리케이션의 AI 에이전트를 구축하고 배포하며 관리하게 해준다. 또한, 노코드로 애플리케이션을 개발하고, 에이전트를 생성할 수 있는 도구인 ‘오라클 APEX’를 바이브코딩 도구로 업그레이드시켰다.
래리 엘리슨은 “오라클은 인프라와 애플리케이션, 확장된 엔터프라이즈 애플리케이션, 그리고 확장된 AI 인프라를 제공한다”며 “오라클은 이 기술을 이용해 산업을 자동화하고 생태계를 자동화하려 하며, 다른 클라우드와 다르게 AI 기술을 만드는데 참여하고, 다른 산업의 문제를 해결하는 데 참여하려 한다”고 밝혔다.
그는 오라클에서 인프라로 참여하고 산업의 요구사항을 해결하려 만들어낸 AI 기술을 통해 세상에 어떤 이점을 가져올 수 있는 지 몇가지 예를 들며 미래를 전망했다. AI 기반의 생체 인식, 의료 모니터링, 의료 영상 진단, 금융 사기, 질병 진단, 악성 종양 치료, 스마트 농업, 기후 변화 등에서 자동화와 획기적 솔루션 도출의 혜택을 누리게 될 것이라고 강조했다.
오라클은 확실히 현재 상황에서 AI 경쟁의 한 복판에 존재하고, 명확히 존재감을 과시하고 있다. 오픈AI의 원대한 스타게이트 프로젝트의 인프라를 맡고 있으며, 엔비디아나 AMD 같은 주요 AI 반도체 기업에게 강한 구매력을 행사하는 입장에 섰다. 이미 수많은 엔터프라이즈 기업의 데이터를 저장하고 있는 오라클 데이터베이스는 빠르게 AI용 데이터 플랫폼으로 진화하고 있다. AI를 위한 최첨단 대규모 데이터센터, AI 학습과 추론을 위한 클라우드, AI 기능을 갖춘 애플리케이션, AI 기반 산업용 솔루션, AI 기반 개발도구 등 수평적으로 수직적으로 폭넓은 포트폴리오를 갖췄다. 치열한 AI 경쟁 속에 DB 회사에서 인프라 회사로 변모하려는 오라클의 시도는 어떤 결과를 보이게 될 지 주목된다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network

 
		
