뉴타닉스, AI 플랫폼 퍼블릭 클라우드로 확장
뉴타닉스는 새로운 클라우드 네이티브 제품인 ‘뉴타닉스 엔터프라이즈 AI(NAI)’를 출시했다고 18일 발표했다.
NAI는 기업의 AI 인프라 플랫폼을 확장하며, 엣지, 코어 데이터센터와 아마존 EKS, 애저 쿠버네티스 서비스(AKS), 구글 쿠버네티스 엔진(GKE) 등 퍼블릭 클라우드 서비스 등 모든 쿠버네티스 플랫폼에 배포될 수 있다.
NAI는 가속화된 AI 워크로드를 위한 일관된 하이브리드 멀티클라우드 운영 모델을 제공한다. 이를 통해 조직은 선택한 안전한 위치에서 모델과 데이터를 활용하면서 투자 수익(ROI)을 개선할 수 있다.
엔비디아 인퍼런스 마이크로서비스(NIM)을 활용해 파운데이션 모델의 성능을 최적화한 NAI는 조직이 대규모 언어 모델(LLM)의 추론 엔드포인트를 안전하게 배포, 실행 및 확장할 수 있게 한다. 이로써 생성형AI애플리케이션을 수 일이나 수 주가 아닌 수 분 내에 배포할 수 있다.
생성형 AI는 본질적으로 하이브리드 워크로드로, 새로운 애플리케이션은 주로 퍼블릭 클라우드에서 구축되고, 사설 데이터를 사용한 모델의 미세 조정은 온프레미스에서 이루어진다. 추론은 비즈니스 로직과 가장 가까운 곳에 배포되는데, 이는 엣지, 온프레미스 또는 퍼블릭 클라우드일 수 있다. 이러한 분산된 하이브리드 생성형AI 워크플로우는 복잡성, 데이터 프라이버시, 보안 및 비용 측면에서 조직에게 과제를 제시할 수 있다.
NAI는 일관된 멀티클라우드 운영 모델과 NIM에 최적화된 추론 마이크로서비스 및 허깅페이스의 오픈 파운데이션 모델을 사용해 LLM을 안전하게 배포, 확장 및 실행할 수 있는 간단한 방법을 제공한다. 이를 통해 고객은 비즈니스 핵심 애플리케이션에 필요한 복원력, 데이 2 운영 역량 및 보안성을 갖춘 엔터프라이즈 생성형AI 인프라를 온프레미스 또는 아마존 EKS, 애저 쿠버네티스 서비스, 구글 쿠버네티스 엔진에 구축할 수 있다.
NAI는 예측하기 어려운 사용량 또는 토큰 기반 가격 책정과는 달리, 인프라 리소스를 기반으로 한 투명하고 예측 가능한 가격 모델을 제공한다. 이는 생성형AI 투자에서 ROI를 최대화하려는 고객에게 중요하다.
NAI는 뉴타닉스 GPT인어박스2.0의 구성 요소다. GPT 인어박스에는 뉴타닉스 클라우드 인프라(NCI), 뉴타닉스 쿠버네티스 플랫폼(NKP), 뉴타닉스 통합 스토리지(NUS) 등과 함께 온프레미스 훈련 및 추론을 위한 맞춤형 서비스가 포함된다. 퍼블릭 클라우드 배포를 원하는 고객은 NAI를 모든 쿠버네티스 환경에 배포될 수 있으며, 온프레미스 배포와 운영 일관성을 유지할 수 있다.
NAI는 엔비디아 전체 스택 AI 플랫폼과 함께 배포될 수 있으며 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼으로 검증됐다. 여기에 NIM이 포함되는데, 이는 고성능 AI 모델 추론을 안전하고 안정적으로 배포하기 위해 설계된 사용하기 쉬운 마이크로서비스 세트다. 뉴타닉스 GPT인어박스는 엔비디아 인증시스템으로, 성능의 안전성을 보장한다.
NAI 활용 주요 사례로는 ▲고객 피드백과 문서 분석을 통한 생성형AI로 고객 경험 개선 ▲코파일럿과 지능형 문서 처리를 활용한 코드 및 콘텐츠 생성 가속화 ▲특정 도메인 데이터로 모델을 미세 조정해 코드 및 콘텐츠 생성 효율화 ▲사기 탐지, 위협 탐지, 경고 강화, 자동 정책 생성을 위한 AI 모델 활용으로 보안 강화 ▲사내 데이터로 미세 조정된 모델을 활용한 분석 개선 등으로 제시됐다.
토마스 코넬리 뉴타닉스 제품 관리 부문 수석 부사장은 “뉴타닉스는 NAI를 통해 고객이 온프레미스나 퍼블릭 클라우드에서 생성형AI 애플리케이션을 쉽고 안전하게 실행할 수 있도록 지원하고 있다”며 “NAI는 모든 쿠버네티스 플랫폼에서 실행 가능하며, 고객의 AI 애플리케이션을 예측 가능한 비용으로 안전한 환경에서 운영할 수 있게 한다”고 밝혔다.
온프레미스, 엣지, 퍼블릭 클라우드에서 실행되는 NAI와 뉴타닉스 GPT 인어박스2.0은 현재 고객이 이용할 수 있다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network