GTC 2020 키노트 총정리 – 엔비디아의 AI 폭격

엔비디아가 이렇게 잘나가고 있다

엔비디아의 올해 주요 화두는 AI가 만드는 소프트웨어다. AI가 만든 소프트웨어는 더 병렬적이고 훨씬 더 연산 집약적이다. 개발 방법과 컴퓨팅 인프라가 다르고 툴과 소프트웨어 실행 방법, 배포 방법까지 모두 다르다. 따라서 AI를 위해 컴퓨팅을 완전히 재발명(Full-Stack re-thinking)해야 한다. 칩, 시스템, 알고리즘, 도구, 생태계를 모두.

따라서 개발자들에게는 훌륭한 도구가 필요하므로, 고성능 컴퓨팅, 데이터 사이언스, 분석, AI, 헬스케어, 자율주행차, 로봇 공학, 5G 엣지 등 많은 분야에 엔비디아의 SDK를 제공한다. 이번 GTC에서는 80개의 SDK를 발표해 총 110개 SDK를 제공하게 됐다.

[무료 웨비나] 아이덴티티 보안 없는 보안 전략은 더 이상 안전할 수 없습니다

◎ 일시 : 2025년 7월 15일 (화) 14:00 ~ 15:30
◎ 장소 : https://bylineplus.com/archives/webinar/53537

엔비디아의 강점은 아키텍처 호환성과 설치 가능 디바이스가 많다는 것이다. 현재 CUDA 호환 GPU는 10억개 이상이며, CUDA SDK는 2천만회 이상 다운로드됐고, 그중 올해만 600만회 다운로드가 발생했다. 1800여개 애플리케이션이 CUDA로 가속되고 있으며, 6500개의 스타트업이 엔비디아의 SDK를 기반으로 사업을 전개 중이다. SDK 사용 개발자는 200만명이 넘으며 작년에만 60만명이 가입했다.

메타버스 시대를 위한 옴니버스 출시

마인크래프트처럼 세계를 만들고, 아바타와 AI 에이전트(NPC로 생각하면 간단하다)가 공존하는 메타버스 시대가 인터넷의 뒤를 잇게 될 것이다. 따라서 이 메타버스를 설계하도록 기존 물리법칙을 지원하는 시뮬레이션과 협업 툴 옴니버스를 오픈 베타 형태로 출시했다. 물리법칙을 따르므로 로봇 시뮬레이터로도 사용할 수 있다.

질병과 싸우는 AI – 슈퍼컴퓨터

신약 개발은 시장 규모가 1.5조달러 수준으로 크지만 평균 개발 기간 10년 이상, 평균 R&D 비용은 25억달러, 이중 90%가 실패할 정도로 어려운 작업이다. 아래의 과정은 어려우므로 읽지 않아도 좋다.

신약 개발이 어려운 이유는 1. 질병 관련 단백질이 무엇인지 찾기 어렵다 2. 이 단백질과 결합해 질병을 물리치는 저분자 화합물을 찾기 어렵다 3. 이 저분자 화합물을 세포에 넣기 어렵다. 신체가 방어 시스템을 갖추고 있기 때문이다. 4. 이 화합물이 안전하게 흡수, 분배, 대사, 배설되는 과정을 정확하게 알고 있어야 한다.

이 과정에서 유전체학을 사용해 질병을 유발하는 단백질을 고르고, 단백질이 어떤 약물에 반응하는지를 결정한다. 현미경을 통해 사진을 3D로 재구성하고, 단백질 구조가 어떤 기능을 하는지 확인한다. 데이터 분석을 통해 투여할 약물 후보는 총 10의 60제곱개 화합물 중 하나를 선택한다. 딥러닝을 통해 기존에 있는 화학 물질 중 새로운 화합물을 생성하고 설계한다. 분자 도킹을 통해 화합물과 단백질 사이 결합력(친화도)를 예측한 후 분자 역학을 통해 단백질의 물리운동과 화학물질의 상호작용을 분석한다. 그 후 병리학과 방사선 이미지를 사용해 바이오마커를 연구한다. 약물의 효과를 측정하는 지표다. 나도 내가 뭘 쓰고 있는지 모르겠다.

NVIDIA Clara Discovery는 이 모든 과정을 지원하는 도구 모음이다. 현재 신약 개발에 사용되는 도구들을 가속화하거나, 도구가 없다면 직접 개발해 제공한다.

엔비디아는 클라라 디스커버리 적용을 위해 영국에 영국에 슈퍼컴퓨팅 인프라를 도입한다. 이름은 Cambridge-1이며 400페타플롭스 AI 성능으로, 영국에서 가장 빠르고 전 세계에서 30위 내 드는 속도의 컴퓨터다. 제약 부문뿐 아니라 학계, 산업계, 스타트업을 모두 지원한다.

앞으로 AI가 소프트웨어를 직접 작성하면, 이 소프트웨어 처리를 위해 더 좋은 컴퓨터가 필요할 것이며, 그래서 NVIDIA DGX SuperPOD AI 슈퍼컴퓨터를 사용하는 것을 제안했다. 20개부터 140개 DGX 시스템까지 확장 가능하다. 국내에서는 네이버와 라인이 자연어 이해 능력 향상을 위해 DGX SuperPOD을 사용한다.

소프트웨어가 만드는 소프트웨어 – 자연어 처리 AI

엔비디아의 자연어 이해 AI는 RACE 독해 테스트에서 전문가(95%)보다는 낮고 일반인(73%)보다는 높은 91%의 점수를 받았다. 자연어 처리 엔진인 메가트론-버트의 기록이다. 이를 활용해 대화형 AI인 자비스(JARVIS)를 만들었다. GPU 가속을 골자로 하는 서비스로, CPU 가속보다 두배 빠르고(600ms->300ms) 자연어 합성 능력이 뛰어난, 즉 사람의 언어와 유사한 JARVIS를 오픈 베타 서비스 중이며, CPU 기반 서비스의 1/3 비용으로 제공한다.

엔비디아의 신기한 영상통화 툴 맥신

맥신(Maxine)은 영화의 CGI처럼 영상통화를 하는 툴이다. 얼굴을 인식한 후 얼굴의 주요 부분(눈썹, 눈, 입 등)을 머신러닝으로 처리해 이 얼굴 변화만 지속적으로 보내주는 방식이다. 즉, 통화자의 얼굴을 일종의 3D CGI 처리하는 셈이다. 얼굴의 변화만 계속해서 보내고 수신자의 PC에서 얼굴을 다시 합성한다. 이렇게 하면 영상을 그대로 보내는 것보다 1/10만의 대역폭을 사용하게 된다.

얼굴의 각도 역시 바꿀 수 있다. 눈을 안 마주치는 측면 상태에서도 얼굴을 합성해 정면을 보도록 한다.

얼굴을 3D 모델링하는 것과 유사한 방법이므로 정면을 보고 있지 않아도 정면을 보는 것처럼 보정할 수 있다

얼굴의 특징점만을 따서 사용하므로 아바타를 사용할 수도 있다. 엔비디아의 음성인식 AI인 자비스(JARVIS)를 사용해 실시간 언어 번역과 자막을 제공한다. 이때 주최자가 아닌 다른 사람이 동시에 말하는 것도 가능한데, 이 말들은 텍스트로 변환된다.

블루필드 2 DPU

소프트웨어 정의 데이터센터는 보안에 강점이 있지만, 다수 사용자들이 클라우드에 접속하면 CPU 과부하가 발생한다. 따라서 엔비디아는 DPU(Data Processing Unit)을 선보인다. 네트워크, 스토리지, 보안을 위한 가속기로 구성돼 있고, 프로그래머블 ARM CPU를 통해 하이퍼바이저 부하를 줄인다. 블루필드-2 DPU로 부르며, 단일 칩 형태로 구성돼 있다. ARM CPU와 가속기, 하드웨어 엔진으로 구성된다. 프라이빗, 퍼블릭, 하이브리드 클라우드용으로 모두 사용할 수 있다. 클라우드에서 기대하는 대부분의 보안 절차를 기대할 수 있다. NVMe를 기본으로 하며 오픈스택과 쿠버네티스 가속을 지원한다.

DOCA SDK는 소프트웨어 정의 네트워킹, 소프트웨어 정의 스토리지, 원격 측정을 통한 인프라 앱을 만들 수 있다. 주요 클라우드 OS에서 실행할 수 있으며 블루필드 2 DPU를 포함한 블루필드의 다른 제품에서도 사용할 수 있다.

엔비디아는 VMWare의 OS에 블루필드 2 DPU를 포팅한다고 발표하기도 했다.

추후 블루필드 3와 4를 출시해 블루필드 4에 이르면 현재보다 1000배 빠른 제품을 제공하겠다고 하며, DOCA 아키텍처는 공유된다.

블루필드 2X 모델을 동시 제공하는데, 암페어 아키텍처 GPU를 단 모델로 보안 기술(이상치 탐지, 비디오 분석, 호스트 검사 등) 강화를 위한 제품이다.

VMWare와 협업한 GPU 추천 알고리즘 가속

IT 기업이 아닌 서비스에서도 AI가 활용되고 있다. 커머스, 광고, 소셜 미디어, 뉴스, 음악, 검색 앱에 모두 추천 알고리즘이 쓰인다. 데이터에서 취향을 학습하고 처리하는 과정에서 머신 러닝이 쓰여야 한다. 대형 서비스는 페타바이트 수준의 검색량을 매일 학습하고 처리한다. 이 정도 규모의 기업에는 정확도 1% 향상이 수십억 달러 매출로 이어지거나 고객 이탈율을 줄이는 효과로 나타난다. 따라서 엔비디아는 추천알고리즘 학습 모델인 멀린(Merlin)을 공개했다. 텐센트가 비디오 학습 모델에 멀린을 사용한다. 핵심 엔진은 어도비가 사용하는 것으로 알려진 데이터 사이언스 프레임워크인 NVIDIA RAPIDS다. VMWare와 협의해 GPU 가속을 모든 기업에게 제공한다고 밝혔다.

엣지 컴퓨팅용 제품 EGX EDGE AI PLATFORM

미래에는 모든 사물에 AI가 탑재돼 건물 자체가 AI가 될 것이다. 그러나 AI만으로 모든 것을 처리할 수 없으므로 인간과 함께 일하게 된다. 이 과정에서 중요한 것이 건물이나 셀타워에 탑재되는 소형 클라우드, 엣지 AI의 존재다. 따라서 엔비디아는 엣지 AI 서버 구축을 위한 EGX EDGE AI PLATFORM을 출시한다. 상점, 재고, 환자 모니터링 등 대부분을 지원할 수 있다. 엣지를 위한 AI 컴퓨팅, 소프트웨어, AI 프레임워크를 모두 갖춘 풀 스택 제품이다. 블루필드 2 DPU와 암페어 GPU를 하나의 카드에 통합했다. 배포와 프로비저닝이 쉽게 설정돼 있다. 젠슨 황 CEO는 “아이폰이 출시된 것과 비견되는 제품”이라고 밝혔다.

자율주행

자율주행 로봇에 탑재되는 엔비디아의 젯슨 AI 컴퓨터의 가격을 인하한다. 젯슨 나노 2GB의 가격은 59달러로 책정됐다.

자율주행차를 위한 드라이브 AV도 공개했다. 현재 메르세데스 벤츠와 협업한 모델로, 2024년 벤츠에 도입된다. RTX 서버로 월드 뷰를 만들고, 드라이브 AV 컴퓨터가 서버와 연결돼 자동차를 구동한다. 이때 실제 세상을 러닝하는 게 아니라, 서버가 만든 가상 세계를 러닝한다.

ARM CPU

엔비디아가 인수한 ARM CPU로 무엇을 할지 윤곽이 밝혀졌다. ARM CPU에 GPU 가속을 제공하는 것이 골자다.

1. GPU, 네트워킹, 스토리지 보안 기술을 ARM 오픈 라이선싱 파트너 생태계에 제공한다.

2. ARM 파트너와 협업해 HPC, 클라우드, 엣지, PC 플랫폼을 만든다.

3. 엔비디아의 AI와 RTX 엔진을 ARM으로 포팅한다.

글. 바이라인네트워크
<이종철 기자> jude@byline.network