델 테크놀로지스가 발표한 ‘AI 팩토리’는 무엇? – 마이클 델과 젠슨 황이 말한다

델 테크놀로지스가 연례 고객 파트너 행사인 ‘델 테크놀로지스 월드(DTW) 2024’에서 기업에서 필요로 하는 인공지능(AI)을 빠르고 효율적으로 도입할 수 있도록 최적화해 구성한 ‘델 AI 팩토리(Dell AI Factory)’를 발표하고, 본격 확산에 나선다.

델 AI 팩토리는 델과 파트너사들이 함께 하는 개방형 생태계를 바탕으로 구성하는 AI 통합 솔루션·서비스이다. PC, 서버, 스토리지, 네트워킹을 아우르는 델의 AI 제품군에 델 파트너사가 제공하는 소프트웨어 플랫폼과 서비스를 통합해 기업과 다양한 조직에서 필요로 하는 다양한 AI 수요를 충족할 수 있도록 최적화해 제공한다. 이를 위해 델 테크놀로지스는 엔비디아를 시작으로 인텔, AMD, 퀄컴, 서비스나우, 애저, 데이터브릭스, 스노우플레이크, IBM, 허깅페이스, 메타와 협력하며, AI 팩토리 생태계를 확장하고 있다.

마이클 델 “최적화된 AI 인프라스트럭처, 미래를 위한 데이터센터, AI우선 사고방식으로 설계”

마이클 델 델 테크놀로지스 회장은 20일(현지시간) 미국 라스베이거스에서 열린 ‘델 테크놀로지스 월드(DTW) 2024’ 첫날 키노트에서 AI 팩토리를 “최적화된 AI 인프라스트럭처”이자 “미래를 위한 데이터센터”라고 소개했다.

델 회장은 “고객은 데이터에 AI를 도입하고자 한다. 델 테크놀로지스와 파트너 생태계가 제공하는 최적화된 AI 인프라스트럭처가 바로 그에 대한 해답”이라며 “데이터 성능, 서비스, 비용, 보안을 고객이 직접 제어할 수 있는 AI 팩토리를 구축할 수 있도록 제공한다. 이는 미래를 위한 데이터센터로, 처음부터 AI를 우선시하는 사고방식으로 구축·설계됐다. 데이터는 모든 것의 중심이 되어 왔고 앞으로도 같을 것”이라고 강조했다.

제프 클라크 “AI 워크로드에 적합한 완전히 새로운 컴퓨팅 아키텍처, 기업 자체 데이터로 가동되며 개방형 모듈식 인프라로 실행하고 개방형 생태계가 제공하는 전문가 서비스”

제프 클라크(Jeff Clarke) 부회장(COO)은 21일(현지시간) DTW 2024 둘째 날 키노트에서 “기존의 데이터센터 아키텍처는 생성형 AI 워크로드에 적합하지 않다. 완전히 새로운 컴퓨팅 아키텍처가 등장했다”라면서, ‘AI 팩토리’가 바로 그 새로운 컴퓨팅 아키텍처라고 제시했다.

클라크 부회장은 “AI 팩토리는 기업 자체 데이터로 가동되며, 다양한 사용사례를 위해 구축된 개방형 모듈식 인프라이다. 개방형 생태계에서 전문가 서비스를 제공해 데이터를 효율적으로 가공할 수 있도록 지원한다”고 소개했다.

델 테크놀로지스는 디바이스, 데이터센터, 클라우드에 걸친 광범위한 AI 제품군과 개방형 생태계를 바탕으로 기업과 기관의 특정한 AI 수요를 충족할 수 있는 목적형 설계 방식으로 제공한다.

이를 두고 클라크 부회장은 이렇게 설명했다.

“중소기업, 중견기업, 세계 최대규모의 다국적 기업에 이르기까지 광범위하게 배포되는 AI의 역량과 잠재력”이라며 “델 AI 팩토리는 다양한 형태와 규모로 제공된다. 확장할 수 있는 모든 모델에 적합한 단일한 사이즈가 있는 것이 아니다. 예를 들어 이동식일 수도 있고, 훈련 모델을 실행하고 데이터를 수집해 인사이트를 생성하는 워크스테이션일 수도 있고, 확장성을 위해 멀티 쿼리에 초점을 둔 80억개의 파라미터(매개변수)를 가진 라마(Llama)3 모델을 실행하는 플랫폼일 수도 있다. 원격 물류창고에서 품질 관리 데이터를 처리하고 공급망의 가시성을 모니터링하는 단일 파워엣지(PowerEdge) R760xa 서버의 러기드 솔루션일 수도 있다. 그리고 추론을 위한 데이터센터와 클라우드를 72개의 엔비디아 블랙웰 GPU가 장착된 단일 파워엣지 XE9680에서 구현할 수도있다. 수백 개의 XE9680 랙이 하나의 코그너티브(인지) 컴퓨터처럼 작동하는 데이터센터가 될 수 있다.”

그는 “이 새로운 아키텍처를 배포하는 가장 좋은 방법은 기존 시스템과 분리하는 것”이라며 “데이터센터를 지금까지와는 전혀 다른 방식으로 구축해 특정 워크로드에 맞게 최적화하는 방법을 고려해야 한다”고 조언했다.

젠슨 황 “단 하나의 목적을 위해 설계된 완전히 새로운 데이터센터, 대규모 인텔리전스를 생산하는 곳이 ‘AI 팩토리’”

델 테크놀로지스는 지난 3월 엔비디아와 협력을 바탕으로 ‘엔비디아 기반 델 AI 팩토리(Dell AI Factory with NVIDIA)’를 처음 선보였다. 이번에 DTW 2024에서는 엔비디아와의 협력을 확장하면서 새로운 서버, 엣지, 워크스테이션, 솔루션, 서비스 등을 추가한다고 발표했다.

‘엔비디아 기반 델 AI 팩토리’는 델의 선도적인 AI 포트폴리오를 ‘엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)’ 소프트웨어 플랫폼과 통합한 오퍼링이며, 엔비디아 텐서 코어(NVIDIA Tensor Core) GPU, 엔비디아 스펙트럼-X 이더넷(NVIDIA Spectrum-X Ethernet) 네트워킹 패브릭 및 엔비디아 블루필드 DPU(NVIDIA Bluefield DPU) 등의 기술을 기반으로 하고 있다. 고객은 필요에 따라 맞춤화된 통합 기능 또는 사전 검증된 전체 스택 솔루션을 구매해 검색증강생성(RAG) 모델 학습 및 추론과 같은 AI 사용사례에 적용할 수 있다.

젠슨 황 엔비디아 CEO는 DTW 2024 첫날 마이클 델 회장의 키노트 무대에 올라 “우리는 이제 역사상 처음으로 ‘인텔리전스(intelligence)’를 생산할 수 있는 능력을 갖추게 됐다. 지난 산업혁명은 소프트웨어 생산이었고, 이전에는 전기를 생산했지만 이제는 인텔리전스를 생산하고 있다”며 “이같은 산업은 당장 몇 배의 기회를 창출한다. 전세계에 1조달러 규모의 데이터센터가 있다. 지난 세대의 IT를 위해 만들어진 이 데이터센터는 이 새로운 형태로 완전하게 현대화될 것이다. 매우 흥미로운 부분으로, 단 한 가지 목적을 위해 설계된 완전히 새로운 종류의 데이터센터”라고 말했다.

이어 젠슨 황 CEO는 “대규모 인텔리전스를 생산하는 곳을 우리는 AI 팩토리라고 부른다. 우리가 알고 있던 컴퓨팅을 완전히 재창조한 대규모 인프라 기능으로, 이 팩토리로 데이터가 들어가고 토큰(Token)이 나온다. 생산되는 토큰은 모든 종류의 다양한 애플리케이션에서 사용될 수 있다. CPU 기반 범용 컴퓨팅에서 GPU로, 명령어 중심의 프로그래밍과 컴퓨팅에서 가속 컴퓨팅으로, 이제는 의도 중심 컴퓨팅으로 재창조되고 있다. 검색 기반으로 사전 기록된 콘텐츠, 검색 기반 데이터센터에서 이제는 생성형 AI 팩토리로 컴퓨팅의 모든 측면이 변화하고 있다”고 강조했다.

황 CEO는 이처럼 AI 팩토리라는 개념을 물을 이용해 전기를 생산했던 과거 산업혁명 당시의 공장에 비유했다. 오늘날의 산업혁명에서 데이터센터는 데이터와 전기를 전세계에 배포되는 귀중한 데이터 토큰으로 변환하는 AI 팩토리 역할을 한다는 것이다.

나아가 황 CEO는 “모든 기업은 인텔리전스를 기반으로 하고, 근본적으로 모든 기업은 인텔리전스 생산업체가 될 것”이라며 “이는 당연한 일이다. 문제는 사람들이 컴퓨팅 스택이 바뀌었다는 것이다. 앞으로 비즈니스 애플리케이션에는 대규모 언어모델, 애플리케이션프로그래밍인터페이스(API) 호출, 그리고 거대언어모델(LLM)이 모두 통합되면서 온프레미스에서 실행하는 데 나서는 문제를 해결하는데 도움이 될 것이다. 클라우드에서도 실행할 수 있겠지만 온프레미스에서 실행한다면 기본적으로 최첨단 AI 팩토리를 구축해야 한다”고 전망했다.

그는 “델 테크놀로지스와의 이번 파트너십은 역사상 최초이자 최대규모의 생성형 AI가 시장에 출시되는 계기가 될 것”이라며 “오직 델만이 가능하다. 공냉식, 수냉식 등 원하는 방식으로 컴퓨팅과 네트워킹, 스토리지를 구축하고, 소프트웨어와 통합해 기업에 제공하고, 전문 서비스와 IT 부서와의 협력을 통해 조직에 배포할 수 있는 새로운 애플리케이션을 개발할 수 있는 역량은 오로지 델만이 보유하고 있다. 엔비디아와 델의 파트너십은 말 그대로 처음으로 AI 팩토리를 구축해 전세계 기업에 솔루션으로 제공하는 것”이라고 강조했다.

엔비디아와 델은 전세계 산업에 컴퓨팅, 네트워킹, 스토리지, 서비스, 소프트웨어가 포함돼 있는 풀스택(full-stack) 기반 AI 팩토리 솔루션을 제공한다. 이 AI 팩토리는 코파일럿, 코딩 어시스턴트, 가상 고객 서비스 에이전트, 산업용 디지털 트윈을 지원한다. 이 풀스택 AI 솔루션 플랫폼은 델 AI 기능과 엔비디아 기술을 통합한 포괄적인 AI 제품군에 더해 여러 기술 파트너들로 구성된 개방형 생태계를 제공한다.

<관련기사> 델 테크놀로지스가 제시하는 ‘생성형 AI’ 도입 가속화를 위한 5가지 원칙

<관련기사> 마이클 델 회장 “AI가 ‘세기의 기회’ 창출, 빠르게 변화하고 활용하라”

<관련기사> 델 테크놀로지스, ‘델 AI 팩토리’ 신제품 대거 발표…허깅페이스·메타와 협력

글. 바이라인네트워크
<라스베이거스(미국)=이유지 기자>yjlee@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다