증가하는 AI 인프라 수요, 손잡은 엔비디아-VM웨어
“AI는 제조, 금융, 소매, 의료, 코로나19 방역에도 사용되고 있다. AI의 수요가 증가하면서, 인프라의 확장성이 매우 중요해지고 있다. 엔비디아는 VM웨어와의 협업을 통해 이를 해결하고자 한다.”
GPU 생산업체 엔비디아와 가상화 솔루션 제공업체 VM웨어가 AI 로 손을 잡았다. AI에 전문기술을 보유한 엔비디아와 IT 인프라 소프트웨어 시장의 강자 VM웨어의 결합으로 AI 인프라 수요 급증에 대응하자는 것이다.
이의 일환으로 VM웨어는 자사의 소프트웨어 v스피어(vSphere) 7과 vSAN7을 업데이트했다. 이 업데이트에는 엔비디아의 AI 소프트웨어 기술이 내장돼 있다. 리 카스웰(Lee Caswell) VM웨어 클라우드 플랫폼 BU 부사장은 9일 진행된 미디어 브리핑에서 AI와 인프라의 중요성에 대해 강조하며 이같이 밝혔다. 양사는 협업을 통해 ▲VM웨어 v스피어(Sphere) 7 업데이트 2 ▲VM웨어 vSAN 7 업데이트 2를 선보였다.
효율성·보안성은 높이고 다운타임은 낮추고
v스피어는 VM웨어에서 제공하는 클라우드 OS로, 프라이빗(private) 클라우드와 퍼블릭(public) 클라우드를 통합하는 역할을 한다. 이번에 양사가 공개한 솔루션은 ‘v스피어 7 업데이트 2’로, 엔비디아의 A100 GPU을 지원한다.
저스틴 보이타노(Justin Boitano) 엔비디아 제너럴 매니저에 따르면, v스피어 7 업데이트 2는 기존 v스피어7에 비해 성능이 높아졌으며, AI 인프라 운영 시 AI의 성능을 높인다. 또한, 엔비디아의 GPU 다이렉트 RDMA(Remote Direct Memory Access)를 지원한다. RDMA는 CPU 없이도 원격 시스템 메모리에 접근할 수 있는 기능을 말한다. 저스틴 보이타노 매니저는 “이를 통해 GPU를 포함한 네트워크가 더욱 효율적으로 연결되도록 만든다”고 설명했다.
이번에 공개한 솔루션에는 엔비디아의 MIG(Multi-Instance GPU)가 적용돼 있다. MIG란 엔비디아 A100 GPU를 7개의 독립 GPU 인스턴스로 분할해 GPU 활용률은 높이고, 접근할 수 있는 사용자 수는 늘리도록 돕는 기술을 말한다. 이를 통해 GPU의 프로세스 처리 효율성을 높이고, 데이터 다운타임(downtime)도 줄인다. 또한, 프로세스의 병목현상도 줄였다.
클라우드에서 필수적인 보안성도 강화했다. 저스틴 보이타노 매니저는 ‘v스피어 네이티브 키 프로바이더(vSphere Native Key Provider)’를 소개하면서 “이를 통해 보안성을 높이고, 가상 머신이 외부에서도 암호화될 수 있도록 돕는다”고 설명했다.
HCI 메쉬로 확장성·유연성 갖춰
vSAN은 VM웨어가 v스피어와 함께 제공하는 엔터프라이즈 스토리지 가상화 소프트웨어다. 가상 시스템 상에서 공유 스토리지를 생성하고, 이를 필요에 따라 분배할 수 있다. 리 카스웰 VM웨어 부사장의 설명에 따르면, 현재 vSAN을 사용하고 있는 고객은 3만명 이상이다. 리 카스웰 부사장은 “vSAN 7 업데이트 2는 유연성과 탄력성을 갖추고 있으며, 미래지향적”이라고 설명했다.
부사장의 설명에 따르면, vSAN 7 업데이트 2는 HCI 메쉬(Mesh)를 통해 확장성과 유연성을 갖출 수 있었다. HCI(Hyper Converged Infrastructure)는 기존에 하드웨어 상에서 구동되던 시스템을 모두 소프트웨어로 구동시키는 인프라를 말한다. HCI 메쉬는 vSAN에서 데이터 저장소 역할을 하는 ‘데이터스토어(DataStore)’를 원격으로 마운트할 수 있는 기능을 말한다.
따라서 vSAN 7 업데이트 2는 HCI 메쉬를 통해 vSAN 상에 구축된 서버 클러스터에서 남은 용량을 클라이언트 클러스터에 전달할 수 있다. 이 솔루션에는 데이터 서비스와 스토리지 솔루션 간 프레임워크인 정책 기반 스토리지 매니지먼트(SPBM)가 적용된다. 따라서 HCI간뿐만 아니라 논HCI 클러스터에도 서버의 용량을 전달할 수 있다.

마지막으로 리 카스웰 부사장은 “무엇보다 소프트웨어 상에서 구동되기 때문에, 유연성을 높일 수 있으며, 앱의 수요에 맞게 스토리지 배치를 할 수 있다”며 “최소한의 컴퓨팅·스토리지 및 네트워크만 필요하기에 효율성도 높일 수 있다”고 설명했다.
글. 바이라인네트워크
배유미 인턴기자> youme@byline.network