델-엔비디아 AI 협력 확대…블랙웰 GPU 8개·72개 탑재한 델 파워엣지 서버 출시한다
델 테크놀로지스가 ‘엔비디아 기반 델 AI 팩토리(Dell AI Factory with NVIDIA)’와 관련된 서버 신제품부터 엣지, 워크스테이션, 솔루션, 서비스 분야에서 엔비디아와의 협력을 바탕으로 한 새로운 발표를 대거 쏟아냈다.
마이클 델 델 테크놀로지스 회장은 현지시간 20일부터 23일까지 개최하는 ‘델 테크놀로지스 월드(DTW) 2024’에서 “전세계가 AI를 활용하기 위해 빠르게 움직이고 있으며, 이것이 바로 엔비디아와 긴밀하게 협력하는 중요한 이유”라며 “엔비디아 기반 델 AI 팩토리 포트폴리오의 확장은 양사 공동의 사명을 이어가는 것으로, 더 많은 기업과 기관들이 AI를 보다 손쉽게 구축해 과감하게 차세대 기술에 도전할 수 있도록 하는 것을 목표로 한다”고 말했다.
‘엔비디아 기반 델 AI 팩토리’는 델의 AI 제품군을 ‘엔비디아 AI 엔터프라이즈’ 소프트웨어 플랫폼과 통합해 제공한다. 엔비디아 텐서코어 GPU, 엔비디아 스펙트럼-X 이더넷 네트워킹 패브릭 및 엔비디아 블루필드 데이터프로세서유닛(DPU) 등의 기술을 기반으로 하고 있다. 고객은 필요에 따라 맞춤화된 통합 기능 또는 사전 검증된 전체 스택 솔루션을 구매해 검색증강생성(RAG), 모델 학습, 추론과 같은 AI 사용사례에 적용할 수 있다.
이번에 발표된 것들 중 가장 두드러지는 신제품은 ‘델 파워엣지(Dell PowerEdge) XE9680L’ 서버다. 기존 모델 대비 더 작은 4U 폼 팩터에 8개의 엔비디아 블랙웰 아키텍처 GPU를 탑재해 높은 성능을 제공한다. 이번 신제품은 업계 표준 x86 랙 상에서 엔비디아 GPU를 탑재한 서버 중 최고 수준의 랙 스케일(rack-scale) 집적도를 자랑한다. 기존 6U 파워엣지 XE9680 모델 대비 노드당 33% 더 높은 GPU 집적도를 제공한다. 또한 20% 더 많은 5세대 PCIe 슬롯들을 장착하고, 북-남(노스-사우스) 네트워크 확장 용량을 2배로 늘렸다.
델 파워엣지 XE9680L서버는 ‘다이렉트 리퀴드 쿨링(direct liquid cooling)’ 기술로 CPU와 GPU의 냉각 용량을 높여 전반적인 효율성을 향상시켰다. 손쉬운 서비스가 가능하도록 설계됐으며, 랙 스케일 구축 및 현장 설치가 용이하게끔 공장에서부터 구성이 완료된 상태로 출하된다.
델은 업계에서 가장 높은 집적도와 에너지 효율의 랙 규모 턴키 솔루션을 공급함으로써 대규모 GPU 가속 구축의 가치 실현 시간을 단축한다. 델과 엔비디아는 향후 단일 랙에서 64개의 GPU를 지원하는 공냉식 설계 또는 단일 랙에서 72개의 엔비디아 블랙웰 GPU를 지원하는 수냉식 설계 등 다양한 옵션을 선보일 예정이다.
델 회장은 “엔비디아와 함께 델 AI 팩토리와 관련해 7가지를 발표했다”고 알리며 “이는 수년 간의 협업의 결과로, 데이터센터부터 PC, 가속화된 시스템, 소프트웨어 서비스와 솔루션에 이르기까지 엔터프라이즈 고객이 AI를 쉽게 도입할 수 있도록 매우 간편한 버튼을 만들었다”고 설명했다. 그는 “양사의 협력으로 이전에 출시한 XE9680은 엄청난 성공을 거뒀다. 이제 다이렉트 리퀴드 쿨링(수냉식 냉각)을 지원하는 XE9680L을 출시하게 돼 매우 기쁘다. 6U에서 4U 폼 팩터로 바꾼 것으로, 하나의 랙에서 72개의 B200 블랙웰을 장착할 수 있다. 매우 놀라운 집적도”라고 덧붙였다.
델 테크놀로지스와 엔비디아는 엣지 분야에서도 협력한다. 새롭게 선보인 ‘델 네이티브엣지(Dell NativeEdge)’는 ‘엔비디아 AI 엔터프라이즈’ 소프트웨어 배포를 자동화하는 최초의 엣지 오케스트레이션 플랫폼이다. 개발자와 IT 운영자는 이를 이용해 엣지에 AI 애플리케이션 및 솔루션을 손쉽게 구축할 수 있다. 제조업이나 유통업계의 다양한 기업들이 엔비디아 메트로폴리스(NVIDIA Metropolis) 영상 분석, 엔비디아 리바(NVIDIA Riva) 음성 및 번역 기능, 엔비디아 NIM 추론 마이크로서비스가 포함된 새로운 델 네이티브엣지 블루프린트를 통해 빠르고 정확하게 엣지 데이터를 분석할 수 있다.
아울러 새롭게 공개된 ‘디지털 어시스턴트를 위한 델 생성형 AI 솔루션’은 델과 엔비디아의 풀스택 솔루션을 기본으로 사용자가 개인화된 셀프서비스를 경험할 수 있게끔 디지털 어시스턴트의 빠른 구축을 돕는다. 함께 발표된 ‘디지털 어시스턴트를 위한 구축 서비스’는 디지털 어시스턴트 솔루션을 설계, 계획, 구현, 테스트 및 확장할 수 있도록 지원한다.
양사 공동 엔지니어링을 통해 설계된 풀스택 자동화 솔루션인 ‘엔비디아 기반 델 AI 팩토리’는 다양한 활용 사례에 대한 AI 환경을 빠르게 구축할 수 있도록 지원한다. 자체 분석 결과 가치 실현 시간(time-to-value)을 최대 85% 앞당기며, ‘엔비디아 추론 마이크로서비스(NIM 또는 NVIDIA Inferencing Microservices)’와 함께 사용할 경우 딜리버리에서 추론 작업 실행에 걸리는 전체 시간을 크게 단축한다.
‘프리시전 AI 워크스테이션 기반 RAG를 위한 델 가속기 서비스’는 AI 개발 주기를 단축하고 AI 애플리케이션 성능을 향상시킨다. 엔비디아 AI 워크벤치 툴킷이 탑재된 델 프리시전 워크스테이션 기반 RAG를 통해 맞춤형 대규모 언어모델을 활용함으로써 안전한 환경에서 신속한 프로토타이핑이 가능하다.
젠슨 황 엔비디아 최고경영자(CEO)는 DTW 2024에서 “생성형 AI는 새로운 유형의 컴퓨팅 인프라, 즉 인텔리전스를 생성하는 AI 팩토리를 필요로 한다”며 “엔비디아와 델은 함께 협력해 전세계 다양한 산업군에 컴퓨팅, 네트워킹, 소프트웨어를 포함한 풀스택 오퍼링을 제공해 코파일럿, 코딩 어시스턴트, 가상 고객 서비스 에이전트, 산업용 디지털 트윈 등을 구축할 수 있도록 지원할 계획”이라고 밝혔다.
‘델 파워엣지 XE9680L’ 서버는 2024년 하반기 중 출시될 예정이다. ‘델 네이티브엣지’의 엔비디아 지원은 2024년 하반기를 시작으로 순차적으로 제공된다. ‘디지털 어시스턴트를 위한 델 생성형 AI 솔루션’과 ‘디지털 어시스턴트를 위한 구현 서비스’는 현재 북미 지역에 한해 제공되고 있다. ‘프리시전 AI 워크스테이션 기반 RAG를 위한 델 가속 서비스’는 북미, EMEA, 아태지역의 일부 국가에 한해 하반기 중 출시될 예정이다.
글. 바이라인네트워크
<라스베이거스(미국)=이유지 기자>yjlee@byline.network