[리뷰] 생성형 AI 시대 최적의 모바일 워크스테이션, 델 프리시전 7780
생성형 AI 시대가 되며 여러 스마트폰들이 온디바이스 AI를 구현하려 노력하고 있다. 그러나 스마트폰의 경우 최대 처리 변수가 아직은 100억개 정도에 불과하다. 음성비서로 다양한 콘텐츠를 요약하고 처리하는 것이 가능하지만, 콘텐츠나 서비스를 생성하기에는 부족하다는 의미다. 따라서 챗GPT, DALL-E, 미드저니, 피카 등의 콘텐츠 생성 AI 서비스는 대부분 클라우드 자원을 활용한다.
그런데 만약 콘텐츠를 자체 제작할 수 있을 정도로 PC의 자원이 훌륭하다면 어떨까? 개인 혹은 기업에 속한 직원 역시 콘텐츠 크리에이터가 될 수 있을 것이다. 거기에 최근 근무 트렌드인 하이브리드 업무까지 접목 가능한 랩톱 형태의 워크스테이션이라면 시공간 제약 없이 생성형 AI를 마음껏 활용할 수 있을 것이다. 이 모든 조건을 갖춘 제품이 바로 델 프리시전(Precision) 7780 워크스테이션이다.
첫인상은 매우 크다. 17.3인치의 디스플레이를 갖춘 프리시전 7780은 펼치면 바로 사무실 PC가 다가온 듯한 느낌을 준다. 화면은 16:9 화면비, UHD 해상도(3840 x2160), 120Hz의 주사율, 500니트의 밝기를 갖춰 게이밍 제품과 견주어도 손색없는 디스플레이를 자랑한다. 특히 디자인 크리에이터에게 중요한 DCI-P3 색 영역을 만족하며, 프리미어컬러(PremierColor)를 통해 사용자가 보려는 콘텐츠에 가장 적합한 색 영역을 선택할 수도 있다.
제품의 사양은 현시점 온디바이스 AI 구동 혹은 훈련에 가장 적합하다. 제품 구성 시 최대 24코어의 13세대 인텔 코어 i9 vPro 프로세서와 엔비디아 RTX 5000 에이다 제너레이션(Ada Generation) GPU를 선택할 수 있다. 스토리지와 메모리 역시 각각 최대 16TB와 128GB DDR5로 구성할 수 있다.
해당 제품으로는 평소의 취미였던 스테이블 디퓨전(Stable Diffusion)으로 이미지 생성을 해보고, 특히 평소 PC 사양으로는 하기 어려웠던 스테이블 비디오 디퓨전까지 구동해 봤다.
스테이블 디퓨전 웹 UI는 이미지 생성을 위한 도구로, 달리나 미드저니 등과 오픈 소스 설치형 애플리케이션에 해당한다. 특히 프롬프트를 0에서부터 시작해 만져야 하는 타 소프트웨어들과 달리 타인이 학습시킨 모델을 내려받을 수 있다. 초기 학습에는 진입 장벽이 있지만, 하루에서 이틀 정도 소요되는 이 학습 과정을 지나고 나면 무한대로 이미지 생성이 가능하다. 또한, 각 모델을 섞거나 훈련시킬 수도 있다. 프롬프트 공유 사이트를 거치면 문장이 아닌 단어 나열만으로도 이미지를 만들 수 있다는 장점이 있다. 자신의 PC 사양이 부족하다면 구글의 컴퓨팅 자원을 빌려 쓰는 Colab 등도 사용할 수 있지만, 델 프리시전 7780 정도의 사양을 갖춘 PC라면 무한대로 무료 이미지 생성이 가능한 셈이다. 해당 이미지들은 이미 광고모델로 활약하는 경우가 심심치 않다.
이미지 생성은 모델, LoRa, 임베딩, 컨트롤넷 등을 내려받고 설정한 뒤 프롬프트 입력을 하면 가능한데, RTX 3050을 탑재한 i7 데스크톱에서는 이미지 1장을 만드는 데 최소 몇 분은 소요된다. 그러나 프리시전 7780에서는 이미지 한장에는 몇 초 수준, 5장을 만들어도 1분을 채 넘기지 않는다. 특히 샘플링 스텝 수(많을수록 이미지가 정교해진다)를 일반보다 2배인 40스텝으로 놓아도 팬 한번 돌지 않고 비슷한 속도로 이미지를 생성해 낸다. 즉, 원하는 어느 장소에서든 필요한 이미지를 원하는 만큼 빠르게 생성할 수 있는 셈이다.
특히 이 제품은 RTX 5000 에이다 제너레이션 GPU를 탑재하고 있어 동영상 생성도 가능하다. 스테이블 비디오 디퓨전은 스테이블 디퓨전에서 공식적으로 지원하는 동영상 생성 툴로, 이미지를 주면 해당 이미지를 인식해 최대 4초의 동영상을 만들어낸다. 그러나 초창기에는 40GB의 VRAM을 요구해 데이터센터용 GPU인 A100이나 H100 이외의 제품은 아예 사용할 수 없었다. 그러나 몇번의 최적화를 거쳐 현재는 10GB 정도의 VRAM으로도 구동은 가능하다. 프리시전 7780의 RTX 5000 에이다 제너레이션 GPU의 경우 최대 VRAM이 32GB이므로 일반 소비자용보다 압도적으로 빠른 속도로 동영상 제작이 가능하다.
웹 UI로 생성한 이미지를 스테이블 비디오 디퓨전을 지원하는 Comfy UI로 가져와 제작했다. 이미지가 영상으로 바뀌는 데는 장당 5분 정도가 소요되며, 시네마틱 표준 프레임(24fps)이 아닌 8~16프레임으로 제작할 경우 2~3분 내외에서 영상 이미지 생성이 가능하다. 현재는 4초 생성까지만 가능하지만 앞으로 분 단위로 늘어날 경우 애니메이션을 홀로 제작하는 것도 가능할 것이다. 그리고 그 크리에이티브 작업에 프리시전 7780 이외의 선택지는 그렇게 많지 않을 것이다.
아래는 스테이블 비디오 디퓨전으로 생성한 짧은 영상들이다. 생성한 이미지는 물론 일반 사진도 불러와 영상으로 만들 수 있다.
스테이블 디퓨전 외에도 프리시전 7780은 다양한 AI 작업을 지원한다. 주로 데이터 과학자를 위해 설계돼 있다. 특히 기존에도 많은 사랑을 받은 델 옵티마이저를 프리시전 전용으로 제공해 애플리케이션 성능, 배터리 시간, 오디오 설정, 개인 정보 보호 등을 기본으로 제공한다. 주요 기능으로는 사용 빈도가 높은 애플리케이션을 감지하거나 사용자가 선택해 성능을 높이고, 워크로드 및 시스템 분석을 리포트 형태로 제공하는 익스프레스 리스폰스, 신속한 로그인과 얼굴 인식을 위한 익스프레스 사인-인과 인텔리전트 프라이버시 등이 있다. 또한, 익스프레스 차지, 익스프레스 커넥트 등을 통해 배터리 충전 학습 패턴을 개인화하거나, 동시 다중 연결을 지원한다.
최근에는 일반적인 크리에이티브 소프트웨어에도 AI가 활발히 적용돼 있는데, 강력한 컴퓨팅 성능과 더불어 AI 도구를 잘 활용하면 혼자서도 다양한 결과물들을 만들어낼 수 있다.
제품을 체험할 때 프리미어의 경우 성능 제한이 걸린 적이 없으며, RTX 3050 GPU를 가진 11세대 i7 데스크톱에서 8~9분 걸리는 4K 20분 분량의 영상을 렌더링하는 데 약 4분 정도의 시간이 소요됐다.
3D 툴의 경우 1.4GB에 달하는 애니메이션을 렌더링하는 데 약 10분, 약 120MB의 3D 이미지를 렌더링하는 데 약 5분이 소모됐다. 같은 조건으로 i7/RTX3050 데스크톱에서는 1.4GB 영상은 렌더링 실패, 3D 이미지는 약 26분이 소요됐다.
생성형 AI 시대가 되며 유료 생성 AI 툴에 크레딧을 구매해 사용하거나 월 과금을 신청해 사용하는 일이 많다. 그러나 이 경우 보안이나 개인 정보 보호에서 일정 부분의 위협을 가질 수 있다. 만일 기업 소속 크리에이터라면 제품의 관리나 보안에 신경을 쓸 수밖에 없다. 또한, 오픈 소스를 활발하게 활용하면 추가 비용이 들지 않는다는 점에서, 델 프리시전 7780은 현시대에 가장 어울리는 제품이 될 것이다.
글. 바이라인네트워크
<이종철 기자> jude@byline.network