[엔비디아 탐구] ② GPU 다음은 무엇인가

인공지능 시장에서 방귀깨나 뀐다고 하는 회사들은 모두 엔비디아 GPU를 사서 씁니다. 아니, 인공지능을 한다는 거의 모든 회사가 그렇겠군요. 엔비디아가 인공지능 인프라를 위한 GPU 시장에서 차지하는 점유율이 90%라고 하네요. 비싼 건 GPU 1장에 3만 달러가 넘는다고 하는데, 그렇게 비싸도 공급이 달립니다.

엔비디아는 기분이 어떨까요? 그렇다고 여기서 만족할까요? 그럴 순 없겠죠. 엔비디아는 GPU 판매 이외에 또다른 그림을 그리고 있습니다.

젠슨 황 엔비디아 창업자 겸 최고경영자(CEO) 겸 가죽재킷 애호가가 “지금은  AI 분야의 아이폰 모먼트(moment)”라고 말한 이유를 알아봅시다.

“슈퍼컴퓨터를 빌려줍니다”

잠깐 2016년으로 돌아가봅시다.  알파고 이야기 하려는 건 아닙니다. 알파고와 같은 것을 만들어낼 수 있도록 하는 인프라가 ‘패키지’로 만들어진 해입니다. 엔비디아는 2016년에 딥러닝 연구를 위한 하드웨어와 소프트웨어를 결합한 솔루션을 개발했는데, 이름이 DGX-1 입니다. 엔비디아가 처음 만든 딥러닝 전용 슈퍼 컴퓨터죠.

GPU(당시 최신식이었던 파스칼 아키텍처 기반 테슬라 P100) 8대 위에 딥러닝 소프트웨어를 장착했습니다. 성능을 비교하자면 당시 x86 서버 250대와 맞먹는 수준이었다고 합니다. 엔비디아는 스스로 “괴물 같았다”고 표현합니다.

젠슨 황 대표는 앞서 “엔비디아의 11세대 GPU 아키텍처인 파스칼(Pascal)이 주요 딥 러닝 작업에 있어 1년 내 10배 더 뛰어난 성능을 발휘할 것”이라고 공언했습니다. 이런 약속을 했는데 안 지켜지면 자존심이 상하겠죠?

그런데 실제로는 상황이 녹록치 않았나봅니다. 머신러닝 개발자들이 새 GPU로 그만한 성과를 내기 위해서는 꽤 긴 시간을 연구에 매진해야 하는 상황이었다고 합니다. 혹시 지난번, [엔비디아 탐구] ①편 본 분 계신가요? (바로 그 ①편: 엔비디아가 AI 짱 먹게 된 결정적 순간, 넷)

①편에도 나오지만 엔비디아가 어떤 회사입니까. 쿠다를 잘 쓰도록 라이브러리를 만들어 배포한 그 회사 아닙니까. 마찬가지 일을 합니다. 개발자들이 편하게 쓸 수 있는 하드웨어+소프트웨어 형태의 서버 시스템을 만들어 내라는 미션이 떨어집니다. 그게 엔비디아 슈퍼컴퓨터의 기원입니다(엔비디아 블로그 참고).

엔비디아는 이 슈퍼컴퓨터 DGX-1을 오픈AI가 쓰도록 빌려줍니다. 지금의 챗GPT를 만든 그 오픈AI 맞습니다. 젠슨 황 CEO는 올해 GTC에서 그 순간을 돌이켜보면서 “팀에 대한 확신이 있었다”고 말했는데요. 능력 있는 개발진이 하고픈 연구에만 집중하도록 나머지 인프라(하드웨어+소프트웨어)는 패키지로 제공하는 게 가능성이 있다는 걸 확인한 거죠.

슈퍼컴퓨터를 더 많이 빌려줍니다

자, 이제 젠슨 황은 깨닫습니다. 오, 이거 빌려주니까 기업들이 빵빵한 성과를 내네? 이거 되겠네? 젠슨 황은, 올해 이런 말을 합니다.

“지금은  AI 분야의 아이폰 모먼트(moment)다”

엔비디아는 올해부터 이 DGX를 클라우드 서비스로 공급하기로 했습니다. 엔비디아에게 있어 iOS 확산과 같은 모먼트, “우리는 SaaS(소프트웨어를 클라우드 서비스로 제공하는 것)로 간다”입니다.

미래의 오픈AI와 같은 회사들이 쉽게 가져다 쓰게 하겠다는 것이지요. 엔비디아 입장에서는 이게 앞으로 더 많은 돈을 벌게 할 모먼트라고 판단했습니다. 다시 젠슨 황 CEO의 말을 들어볼까요?

“이제 모두가 변곡점이 왔다는 것을 깨달았고, AI로 무엇을 달성할 수 있는지 알고 있다. 가장 먼저 일어날 일은, 지난 6~8년간 연구 분야에서 활동해 온 DGX AI 슈퍼컴퓨터의 역할이 확장될 것이라는 점이다. 기존에는 AI가 컴퓨터 비전에 집중되어 있었다면 이제는 갑자기 모든 산업 분야로 이동하고 있다. 매우 중요한 개념 중 하나가, AI가 이제 많은 영역의 언어를 학습했다는 것이다. 3D 그래픽의 언어, 인간의 언어, 동작의 언어, 이미지 언어 등을 모두 배우고 이해한 후 생산하는 영역까지 나아갔다. …(중략)… 이제 컴퓨터가 연구용에서 본질적으로 AI 공장이 되는 시대가 될 것이다.”

앞서 빅테크나 혹은 일부 뛰어난 연구진에 의해서만 개발되어 오던 인공지능이 이제는 거의 모든 산업과 기업에 의해 개발되고, 활용될 것이라고 전망한 것이죠. 챗GPT가 나오고 나서, 챗GPT를 어떻게 업무에 활용해야 할지를 수많은 기업이 궁금해 했던 것을 떠올리면 답이 나옵니다. 아주 보수적인 산업군에서조차(예를 들어 금융권), 챗GPT와 같은 생성AI 솔루션의 업무 도입이 가까운 미래에 이뤄질 것이라고 생각하게 됐거든요.

젠슨 황 CEO는 이런 상황을 “생성 AI의 놀라운 기능을 본 기업들이 제품과 비즈니스 모델을 재창조해야 한다는 위기감을 느꼈을 것”이라고 표현하기도 했습니다. 모두가 AI를 업무 환경 변화와 제품 개발에 도입할 거라고 판단했고, 이것이 엔비디아에 또 한 번의 기회가 될 거라고 본 것이죠.

지난 3월 엔비디아가 GTC에서 AI 슈퍼컴퓨팅 서비스인 ‘엔비디아 DGX 클라우드(NVIDIA DGX Cloud)’를 발표하면서, 자기들이 빌려주는 시스템의 사양과 가격을 공개한 것을 볼까요?

요약하자면, 노드당 총 640GB의 GPU 메모리에 8개의 엔비디아 H100 또는 A100 80GB 텐서 코어(Tensor Core) GPU를 탑재한 인스턴스를 빌려준다는 것인데요. 하나의 인스턴스를 빌려 쓰는데 드는 비용은 3만6999달러(약 4835만원)입니다.

엄청 큰 금액이지만, 현재 엔비디아 H100 한 개의 값만 3만달러가 넘는 것으로 알려진 것을 떠올리면 갑자기 싸게 느껴집니다. 엔비디아 측은 이를 “스타트업과 기업들을 위한 시스템과 서비스 세트”라고 표현했습니다.

그런데 이걸 왜 스타트업을 위한 서비스 세트라고 부를까요? 스타트업이 모두 대기업처럼 슈퍼컴퓨터를 구축하기 어려우니, 서비스로 빌려 쓰라는 뜻이죠. 모든 회사가 인공지능 솔루션을 쓰려고 할텐데, 그 회사들이 모두 슈퍼 컴퓨터를 구축할 필요도 없고 또 그럴 자원도 없을 거라는 전략 하에 나온 솔루션입니다. 이것이 젠슨 황이 생각하는 엔비디아의 미래죠. 말 그대로 SaaS 회사로의 전환입니다.

젠슨 황 CEO는 DGX 클라우드를 발표하면서 “스타트업은 파격적인 제품과 비즈니스 모델을 구축하기 위해 경쟁하고 있고, 기존 기업도 이에 대한 대응을 모색하고 있다”면서 “고객은 글로벌 규모의 클라우드에서 엔비디아 AI 슈퍼컴퓨팅에 즉시 액세스할 수 있다”고 강조했습니다.

같은 의미에서, 엔비디아는 올해 GTC에서 자신들의 AI 리더십을 재차 강조했는데요. 봐, 우리 이렇게 대단한 사람들 나온다고 자랑이라도 하듯 연사 라인업도 AI 분야 최고 유명인들로 꾸렸습니다.

예컨대 딥마이드의 창업자이자 CEO인 데미스 하사비스(알파고의 아버지)나 오픈AI 공동창업자이면서 최고과학자인 일리야 수츠케버 등이 나왔죠. 이들은 젠슨 황 엔비디아 CEO와 대담을 갖고 인공지능의 미래에 대한 인사이트를 나누면서, AI 리더십을 끈끈하게 나눴습니다.

참고로, 다음은 엔비디아가 올해 내놓은 대표적인 신제품들입니다

차세대 슈퍼칩, ‘GH200 그레이스 호퍼’

지난 5월, 엔비디아는 자사 차세대 슈퍼칩 ‘GH200 그레이스 호퍼(Grace Hopper)’의 양산에 돌입했다고 밝혔습니다. 복잡한 AI와 고성능 컴퓨팅(HPC) 워크로드를 실행하기 위한 시스템에 쓰일 칩이죠.

엔비디아에 따르면 GH200 기반 시스템은 엔비디아 그레이스(Grace), 엔비디아 호퍼(Hopper), 엔비디아 에이다 러브레이스(Ada Lovelace), 엔비디아 블루필드(BlueField)를 포함한엔비디아의 최신 CPU와 GPU 아키텍처 기반 400개 이상의 시스템 구성에 추가될 예정입니다. 이로써 급증하는 생성형 AI에 대한 수요를 충족시키겠다는 것이 엔비디아의 구상입니다.

이 슈퍼칩은 최대 900GB/s의 총대역폭을 제공합니다. 이는 기존 가속 시스템에서 볼 수 있는 표준 PCIe Gen5 레인보다 7배 더 높은 대역폭으로 까다로운 생성형 AI나, HPC애플리케이션을 처리할 수 있는 컴퓨팅 기능을 지원합니다.

엔비디아 그레이스 호퍼

크리에이티브를 겨냥한 새 AI 모델 ‘뉴럴란젤로’

3D 장면을 재구성하는 엔비디아 리서치(NVIDIA Research)의 새 AI 모델이 ‘뉴럴란젤로(Neuralangelo)’입니다. 2D 비디오 클립을 세부적인 3D 구조로 변환해 건물, 조각품, 기타 실제 물체의 가상 복제품을 생성합니다. 이름은 미켈란젤로에서 따왔습니다. 그가 대리석 블록으로 실제와 같은 멋진 작품을 조각했듯, 뉴럴란젤로도 2D 비디오 클립을 가지고 실제와 같이 복잡한 디테일과 텍스처를 가진 3D 구조를 만들어낸다는 뜻입니다.

엔비디아는 크리에이티브 전문가가 뉴럴란젤로를 예술, 게임 개발, 로보틱스 및 산업용 디지털 트윈에 사용할 수 있다고 설명했습니다. 아울러 지붕 널, 유리창, 매끄러운 대리석 등 복잡한 재료의 텍스처를 2D 비디오에서 3D 에셋으로 변환시킬 수 있습니다. 스마트폰으로 캡처한 영상을 사용해 프로젝트에 사용할 수 있는 가상 객체를 더 수월하게 3D로 재구성할 수 있다고도 설명했습니다.

로봇 플랫폼, 아이작

젠슨 황 엔비디아 CEO는 올해 대만 타이베이에서 열린 컴퓨텍스 기술 컨퍼런스 기조연설에서 아이작(Isaac) AMR을 발표했습니다. 아이작 ARM은 차세대 자율주행로봇(autonomous mobile robot, 이하 AMR) 플릿을 지원하는 새로운 플랫폼입니다. 모바일 로봇에 고급 매핑, 자율성, 시뮬레이션을 제공하며 가까운 시일 내 배포될 예정입니다.

아이작 AMR은 자율주행로봇 플릿을 시뮬레이션, 검증, 배포, 최적화, 관리할 수 있는 플랫폼입니다. 엣지 투 클라우드 소프트웨어 서비스, 컴퓨팅, 레퍼런스 센서 세트는 물론 AMR의 개발, 배포를 가속화하는 로봇 하드웨어가 포함돼 비용과 시장 출시 기간을 단축할 수 있다고 엔비디아 측은 설명합니다.

(기사에 사용된 이미지 출처= 엔비디아)

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network

[컨퍼런스 안내] 클라우드 보안 & 제로트러스트 컨퍼런스 2024

  • 일시: 2024년 7월 4일 오전 8:40 ~ 오후 6:00
  • 장소: 서울 서초구 강남대로 213 양재 엘타워 6층 그레이스홀

[무료 웨비나] B2B기업, AI 시대 어떻게 고객을 발굴할 것인가?

  • 정민아 <하룻밤에 읽는 B2B 마케팅> 저자
  • 2024년 7월 9일 14:00~15:00

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다