“오라클 AI 레이크하우스 핵심은 연합 카탈로그 아키텍처”
[인터뷰] 체틴 외즈뷔튠 오라클 자율운영 데이터베이스 기술 총괄 부사장
오라클은 14일 미국 라스베이거스에서 개최한 연례 컨퍼런스 ‘오라클 AI 월드 2025’에서 개방성을 전면에 내세운 ‘오라클 자율운영 AI 레이크하우스’를 발표했다. 이 솔루션은 오라클 자율운영 AI 데이터베이스와 널리 사용되는 아파치 아이스버그 표준을 결합해 기능적 제약 없이 분석 사일로를 해소하고, AI 및 분석 솔루션을 신속하게 구축할 수 있도록 한다.
체틴 외즈뷔튠 오라클 자율운영 데이터베이스 기술 총괄 부사장은 “오라클 자율운영 AI 레이크하우스는 시간당 480억건 이상의 쿼리 처리가 가능한 강력한 성능을 기반으로 업계에서 검증된 자율운영 AI 데이터베이스에 아파치 아이스버그의 개방성을 결합한 타협 없는 레이크하우스 플랫폼”이라며 “오라클은 아이스버그로 분석 시스템 간 데이터 사일로를 해소할 뿐 아니라, 클라우드와 온프레미스를 아우르는 다양한 운영 및 분석 플랫폼에서 아이스버그 데이터를 활용할 수 있도록 지원한다”고 말했다.
오라클은 자율운영 AI 데이터베이스 카탈로그(Autonomous AI Database Catalog)를 함께 공개했다. 이는 여러 카탈로그 및 플랫폼의 데이터와 메타데이터를 통합하는 ‘상위 카탈로그(catalog of catalogs)’로, 멀티 데이터 플랫폼과 클라우드 환경 전반에서 데이터 탐색과 접근을 간소화한다.
자율운영 AI 레이크하우스는 아파치 아이스버그에 대한 네이티브 지원으로, 데이터브릭스 유니티, AWS 글루, 스노우플레이크 폴라리스 등 주요 카탈로그와 연계해 모든 아이스버그 테이블에 대한 간편한 고성능의 접근을 제공한다. 자연어를 SQL로 변환하고 에이전틱 AI 프레임워크를 제공하는 셀렉트 AI, JSON 관계형 이원성(JSON-Relational Duality), 프로퍼티 그래프 애널리틱스, AI 벡터 검색 등의 강력한 기능을 아이스버그 테이블의 데이터에 적용할 수 있으며, 이는 엑사데이터의 성능, 가용성 및 보안성을 기반으로 하면서도 벤더 종속성을 최소화하고, 데이터 이동으로 인한 운영 부담을 줄여준다. 자율운영 AI 레이크하우스는 OCI, AWS, 마이크로소프트 애저. 구글 클라우드. 엑사데이터 클라우드앳커스터머에서 사용 할 수 있다.
자율운영 AI 데이터베이스 카탈로그는 여러 클라우드와 온프레미스 환경 전반의 엔터프라이즈 데이터에 대한 단일 뷰를 제공한다. 데이터베이스, 데이터 레이크, 데이터 공유(share), 기존 데이터 카탈로그 등과 간편히 연결할 수 있으며, 이를 통해 데이터 탐색, 검색, 접근 및 메타데이터 강화가 가능하다. 이를 기반으로 데이터 사이언스, 데이터 엔지니어링, 분석은 물론 데이터 기반 AI 프로세스를 향상시킨다.
체틴 외즈뷔튠 부사장은 “오라클 AI 레이크하우스의 아키텍처는 연합 카탈로그 아키텍처로, 외부 카탈로그를 간단한 클릭 한번으로 마운트한 다음 해당 카탈로그에 정의된 모든 데이터에 SQL 문을 실행할 수 있게 된다”며 “AWS 글루, 데이터브릭스 유니티, 스노우플레이크 폴라리스 같은 주요 카탈로그와 통합돼, 해당 카탈로그의 모든 메타데이터에 오라클 AI 레이크하우스 이용자가 사용할 수 있도록 한다”고 설명했다.
아울러 오라클은 쿼리 수요에 따라 자율운영 AI 데이터베이스에 대한 네트워킹 및 컴퓨팅 용량을 동적으로 확장하고, 사용한 리소스에 대해서만 과금하는 방식으로 아이스버그 테이블 대상의 대규모 쿼리를 가속화하는 ‘데이터레이크 액셀러레이터(Data Lake Accelerator)’를 공개했다.
데이터레이크 액셀러레이터는 쿼리 수요에 따라 네트워킹·컴퓨팅 자원을 자동으로 추가 할당해 아이스버그 테이블 전반의 대규모 쿼리 처리 속도를 가속한다.
외즈뷔튠 부사장은 “오브젝트 스토어에 저장된 아이스버그 테이블에 접근할 때 가상 머신에서 제공할 수 있는 대역폭이 제한된다”며 “오라클의 기술은 페타바이트 단위의 대규모 데이터세트를 초당 수백 메가바이트로 확장할 수 있도록 해당 데이터에 대해 많은 가상머신을 축적했다가 확장함으로써 높은 성능을 제공하게 된다”고 말했다.
엑사데이터 테이블 캐시는 오라클 엑사데이터 플래시 스토리지 내에 자주 액세스되는 아이스버그 데이터를 캐싱해 네이티브 엑사데이터 테이블 수준의 성능으로 쿼리 속도를 개선한다.
그는 “엑사데이터 테이블 캐시는 많은 양의 데이터의 서브셋을 반복적으로 스캔할 때 매우 유용한 기능”이라고 강조했다.
그밖에 셀렉트 AI 에이전트는 오라클 자율운영 AI 데이터베이스 내에서 AI 에이전트를 구축, 배포 및 관리할 수 있는 간단하고 안전하며 확장 가능한 인데이터베이스(in-database) 프레임워크를 지원한다. 맞춤화되거나 사전 구축된 PL/SQL 도구뿐 아니라 REST 를 통한 외부 도구, MCP 서버를 지원하며, 이를 통해 다단계 에이전틱 워크플로우 자동화하여 혁신을 가속하며 데이터 보안을 강화한다.
데이터 사이언스 에이전트는 자율운영 AI 데이터베이스 내에 사전 구축된 AI 어시스턴트로 제공할 예정이다. 이 기능은 데이터 실무자가 자연어 기반 제로코드로 데이터 카탈로그 전반을 검색하고, 데이터를 손쉽게 준비 및 탐색하며, 핵심 인사이트를 도출하고 실행가능한 성과로 전환할 수 있도록 돕는다.
플러그 앤드 플레이 SQL 액세스는 카탈로그 연결을 통해 데이터를 쿼리할 수 있는 간소화된 신규 SQL 구문을 제공한다. 고객은 AWS, 데이터브릭스, 스노우플레이크, 아파치 그라비티노(Gravitino)를 포함한 아이스버그 및 기타 데이터 카탈로그에 연결한 뒤, 별도 데이터 이동 없이 즉시 쿼리를 실행할 수 있다.
아이스버그용 골든게이트는 운영 및 분석 데이터 소스의 데이터를 실시간으로 어떤 아이스버그 타깃으로든 스트리밍할 수 있도록 지원한다. SaaS 애플리케이션과 수백 가지 데이터 소스를 아이스버그로 빠르고 효율적으로 통합한 뒤, 자율운영 AI 데이터베이스로 분석할 수 있다.
손쉬운 데이터 공유를 위한 테이블 하이퍼링크는 특정 테이블 또는 쿼리 결과에 대해 직접적이지만 격리된 접근을 제공하는 임시 하이퍼링크를 생성해, 복잡한 권한 설정 없이도 최신 데이터를 조직 내부 및 외부로 안전하게 공유할 수 있도록 돕는다.
외즈뷔튠 부사장은 “오라클이 자율운영 AI 레이크하우스의 독특한 핵심은 모든 데이터에서 얻을 수 있는 AI 통찰력을 프로덕션으로 전환한다는 것”이라며 “레이크하우스에서 수집할 수 있는 모든 AI 인사이트를 모든 비즈니스 프로세스, 미션 크리티컬 애플리케이션에서 즉시 사용할 수 있으며 이는 오라클만의 고유한 기능”이라고 강조했다.
글. 바이라인네트워크
<라스베이거스(미국)=김우용 기자>yong2@byline.network

