델 테크놀로지스가 제시하는 ‘생성형 AI’ 도입 가속화를 위한 5가지 원칙
제프 클라크 부회장 “기존 데이터센터는 생성형 AI에 부적합, 새로운 컴퓨팅 아키텍처 필요”
“300년 전, 산업혁명으로 전세계적으로 사회, 경제, 문화 전반에 걸쳐 거대한 변화를 가져온 것과 비슷한 변화의 시작점에 지금 와있다. 우리가 인공지능(AI) 혁명이라고 부르는 이 변화는 앞으로 더욱 오랫동안 지속적으로 진행될 것이고, 훨씬 더 빠른 속도로 진행되고 있다.”
제프 클라크(Jeff Clarke) 델 테크놀로지스 최고운영책임자(COO) 겸 부회장은 21일(현지시간) ‘델 테크놀로지스 월드(DTW) 2024’ 행사 2일차 기조연설자로 나와 “AI 혁명이 시작됐다”며 이같이 말했다.
“AI 혁명 시작…AI 빠르게 도입하고 활용해야”
클라크 부회장은 “새로운 원재료인 데이터와 정보, 새로운 기계인 초당 수조 개의 소숫점 연산을 수행하는 대규모 병렬처리가 가능한 GPU로 인해 속도가 더욱 빨라지고 있다. 여기에 고속 AI 패브릭, 고속 AI 스토리지, 올바른 모델과 데이터 도구가 결합해 정보(data and information)를 지식(Knowledge)으로 바꾼다. 이전에는 없던 지식을 얻게 되면서 모든 것이 변화하고 있다”고 강조했다.
클라크 부회장은 이같은 AI 혁명으로 얻을 수 있는 혜택으로 새로운 자율(autonomous) 기능으로 인한 잇점과 더불어 새로운 비서, 에이전트, 동료가 사람이 하는 모든 일을 함께 하게 되고, 보다 효율적으로 공급망을 만들 수 있다고 제시했다. 이와 함께 더 많은 로봇 공학과 로봇 자동화로 공장의 생산성을 크게 높이고, 예측적 유지보수와 자동 복구도 가능해져 보다 향상된 서비스가 가능할 것이라고 전망했다.
이같은 AI 혁명이 시작되는 초기 단계인 지금, 우리 모두가 해야 할 일은 무엇보다 AI를 빠르게 도입하고 활용해야 한다는 것이라고 델 테크놀로지스는 강조하고 있다. 실제로 많은 기업들이 이미 생성형 AI를 포함해 AI 기술을 비즈니스에 활용하려는 추세다. 하지만 AI 인프라를 구축하는 것이 쉽지 않을 뿐더러 어느 업무 분야에 적용할지, 어디서부터 시작할지 고민이 많은 것이 사실이다.
클라크 부회장은 “IT 전문가들에게 가장 중요한 것은 이를 구현하는 생성형 AI 워크로드에 완전히 다른 컴퓨팅 아키텍처가 필요하다는 점”이라며 “높은 수준의 병렬처리와 함께 벡터 수학에 최적화된 아키텍처가 필요하며, 이같은 생성형 AI 워크로드에 데이터를 공급하기 위해서는 높은 처리량의 AI 패브릭을 통한 고속 스토리지 등이 있어야 한다. 생성형 AI와 GPU로 우리가 원하는 결과를 얻기 위해서는 엄청난 속도로 데이터를 공급해야 한다”고 말했다.
이어 “이제는 프로그래밍과 사고(thinking), 명령어(instruction), 계산(computation) 중심에서 맥락(context)과 추론(resoning) 중심으로 나아가고 있으며, 이는 워크플로우 수행 방식을 바꾸고 있다. 명령어 기반 워크플로우에서 의도(intention) 기반 워크플로우로 전환되고 있는 것으로, 매우 심오한 변화다. 앞으로 10년 동안 이같은 역량은 더욱 강화될 것”이라며 “(이같은 변화에 대응하는) 우리의 전략은 가장 간단한 방식으로 AI 도입을 가속화하는 것”이라고 설명했다.
AI 워크로드에 최적화된 새로운 컴퓨팅 아키텍처, ‘AI 팩토리’
클라크 부회장에 따르면, 델 테크놀로지스의 이같은 전략은 5가지 핵심 원칙(core beliefs)을 바탕으로 한다. 그 첫 번째는 ▲데이터는 차별화 요소로, 모든 데이터의 83%가 온프레미스에 있고 그 데이터 가운데 50%가 엣지에서 생성된다는 점이다. 두 번째는 ▲AI가 데이터로 이동하는 것으로, 그 반대의 경우보다 더욱 효율적이고 효과적이면서 안전한 방법이다. 세 번째는 ▲모든 것에 들어맞는 단일한 접근방식은 없다는 점이다. 네 번째는 ▲혁신의 속도를 고려할 때 빠른 혁신을 지원하기 위해 개방형 모듈식 아키텍처가 필요하다는 것이다. 마지막은 작년 한 해 동안 우리가 목격한 것처럼 ▲AI의 빠른 혁신과 기술 발전을 활용하려면 광범위하고 개방적인 생태계가 필요하다는 점이다.
그는 “대부분의 기업은 직접 거대언어모델(LLM)을 학습시키지는 않겠지만 라마(Llama)3, 미스트랄(Mistral) 등과 같은 오픈소스 모델을 사용해 비즈니스에 생성형 AI를 활용하게 될 것이다. 그리고 시간이 지나면서 기업들은 더 작은 오픈소스 모델을 사용해 전문가 시스템을 구축하고 성능과 효율성을 개선할 것”이라고 설명했다.
뿐만 아니라 “오픈소스 소프트웨어 모델과 데이터를 조합해 전문가 시스템을 구축하고, 원하는 결과를 얻기 위해 검색 증강 생성(RAG)같은 기술을 미세 조정하거나 사용할 것이다. 엔지니어들에게 재미난 점은 이러한 전문가 시스템을 실제로 가져와 정량화 기술을 사용해 최적화함으로써 모델과 추론의 성능과 구성원의 활용도를 향상시킬 수 있다는 것”이라고 내다봤다. 아울러 “이러한 스마트 시스템과 전문가 시스템을 구축하고 데이터를 최신 상태로 유지할 것”이라며 “지능형 데이터 파이프라인을 구축해 AI가 항상 정확하고 최신의 데이터, 즉 가장 포괄적인 데이터 세트를 사용할 수 있도록 보장할 것이다. 그리고 추론은 수많은 곳, 즉 노트북, 서버, 데이터센터, 엣지 등 기본적으로 AI가 안내하는 결과를 얻으려는 모든 곳에서 이뤄질 것”이라고 예상했다.
클라크 부회장은 “기존의 데이터센터 아키텍처는 생성형 AI 워크로드에 적합하지 않다. 완전히 새로운 컴퓨팅 아키텍처가 등장했다”라면서 “어제(20일) 발표한 ‘AI 팩토리’를 통해 이같은 새로운 컴퓨팅 아키텍처를 제공할 것이다. AI 팩토리는 고객 전체에 걸쳐 AI를 발전시키기 위한 새로운 컴퓨팅 아키텍처로, 원재료인 데이터를 유용하게 전환시킨다. 인사이트, 지식, 토큰으로 바꾸는 것이다. 이것이 절대적인 필수요소라고 보고 있다”고 강조했다.
델 AI 팩토리는 클라크 부회장이 이야기한 5가지 원칙에 딱 들어맞는 AI 통합 솔루션·서비스 오퍼링이다. 그는 “AI 팩토리는 기업 자체 데이터로 가동되며, 다양한 사용사례를 위해 구축된 개방형 모듈식 인프라이다. 개방형 생태계에서 전문가 서비스를 제공해 데이터를 효율적으로 가공할 수 있도록 지원한다”고 소개하고, “정말로 중요한 것은 이전에는 경험하지 못했던 통찰력과 지혜, 비즈니스 이해도를 얻을 수 있다는 것”이라고 기대효과를 부각했다.
다만 그는 “이 새로운 아키텍처를 배포하는 가장 좋은 방법은 기존 시스템과 분리하는 것”이라며 “데이터센터를 지금까지와는 전혀 다른 방식으로 구축해 특정 워크로드에 맞게 최적화하는 방법을 고려해야 한다”고 조언했다.
클라크 부회장은 “AI 워크로드는 처음부터 엄청난 컴퓨팅 집약도를 필요로 한다. 따라서 가속화된 컴퓨팅(accelerated computing)이 핵심”이라며 “파일과 오브젝트 데이터 유형에 최적화된 고속 IO 스토리지, 높은 처리량, 저지연 네트워킹, 아직 많이 논의되지는 않지만 중요하다고 생각되는 패브릭 4. 그리고 가장 가치 있는 데이터는 학습되고 튜닝된 모델이 될 것이다. 데이터 시스템을 공통 데이터 파이프라인으로 통합해야 한다. 궁극적으로는 AI를 엣지, 공장, 병원, 스마트 시티까지 확장할 수 있는 PC가 있어야 하며, 이 모든 것이 훈련, 튜닝, 추론을 위한 소프트웨어 도구 세트로 구동될 수 있다는 광범위한 해답이 필요하다. 이러한 시스템은 매우 복잡하고 고도로 기술적인 시스템이라는 점을 명심하라”고도 덧붙였다.
그는 “배포 속도와 첫 토큰을 얻는 시간을 단축하기 위해 높은 수준의 엔지니어링과 통합돼야 한다. 그 이유로 가장 광범위한 포트폴리오를 갖춘 델 AI 팩토리가 해답이 될 것”이라고 피력했다.
글. 바이라인네트워크
<라스베이거스(미국)=이유지 기자>yjlee@byline.network