반도체 넘어 ‘AI 기업’으로 도약하는 엔비디아

“우리는 AI의 아이폰 시대를 맞이하고 있다.”

21일(현지시간) 진행된 엔비디아 연례 개발자 컨퍼런스인 ‘GTC’ 키노트 세션에서 젠슨 황(Jensen Huang) 최고경영자(CEO)가 몇 차례에 걸쳐 언급한 내용입니다. 인공지능(AI)은 인류에게 위협이 아니라 혁신이라는 점을 강조하기 위해 이 같은 표현을 쓴 것으로 보입니다. AI가 온 세상 구석구석에 스며들기 시작하면서, 엔비디아도 다양한 산업의 AI를 뒷받침하기 위한 여러 기술을 마련하고 있습니다.

이번 GTC에서도 그런 엔비디아의 다짐을 볼 수 있었습니다. 이번 GTC에서 나온 젠슨 황 CEO의 키노트는 좀 독특하긴 했습니다. 지난해까지만 해도 AI 관련 기술이 아닌 하드웨어 신기술을 선두에 세워 공개했었거든요. 2022년 상반기 GTC에서 엔비디아가 가장 먼저 선보인 것은 데이터센터 규모의 AI 가속기 H100을 발표와 서버용 프로세서 그레이스 중앙처리장치(CPU)였습니다. 하반기에는 그래픽처리장치(GPU) 신제품 RTX 40에 초점을 맞췄고요. 모두 초장에 하드웨어 기술을 언급했던 겁니다.

이번 키노트에서는 하드웨어가 아닌, 소프트웨어 스택 라이브러리와 서비스, 협업 사례를 가장 먼저 앞세워 소개했습니다. 젠슨 황 CEO는 키노트 세션 초반에 “엔비디아는 300개의 가속 라이브러리와 400개의 AI모델 가속 컴퓨팅 선순환을 확립했다”면서 “더불어 물리학, 화학, 지구 및 생명과학 전반에 걸쳐 머신러닝 및 AI 기능을 향상시킬 100개의 업데이트를 진행했다”고 운을 뗐습니다.

어려운 분야도 “라이브러리로 쉽게 AI 도입할 수 있어”

이번 키노트에서 젠슨 황 CEO는 300개의 가속 라이브러리를 확립했다고 했죠. 그 중에서도 특히 강조한 부문은 크게 세 가지입니다. 양자 컴퓨팅, 물류 및 경로 최적화 가속 엔진, 그리고 반도체 제조 부문, 이렇게 말이죠.

먼저 엔비디아는 키노트 세션에서 쿠퀀텀(Cu Quantum) 라이브러리를 공개했습니다. 쿠퀀텀은 양자 컴퓨팅 플로우를 가속화하기 위해 엔비디아가 구성한 라이브러리 및 소프트웨어 툴킷 명칭입니다. 양자회로 시뮬레이션 속도를 높일 수 있다는 점을 강조했죠.

이어 발표한 라이브러리는 쿠옵(Cu Opt)입니다. 쿠옵은 여러 변형을 고려한 추론을 가속화하는 엔진을 말합니다. 로봇 시뮬레이션, 작업 스케줄링 등 부문에서 순서와 경로 선정 알고리즘을 최적화하기 위한 목적으로 만들어진 라이브러리입니다. 주로 물류 쪽에 사용될 것으로 예상됩니다.

반도체 제조와 관련해서는 쿠리소(Cu Litho)를 선보였습니다. 쿠리소는 포토마스크에 새겨진 회로가 웨이퍼에 어떻게 새겨지는지 그 패턴을 빠르게 시뮬레이션할 수 있도록 합니다. 보통 반도체는 회로 모양이 새겨진 포토마스크 기판에 빛을 쏴서 그 반대편에 있는 웨이퍼에 그대로 새겨지는 방식으로 만들어지거든요. 미세 공정의 경우 약간의 오류만 생겨도 금방 불량이 나고 마는데요, 이를 미리 시뮬레이션해 불량률을 줄일 수 있도록 돕는 것이 바로 쿠리소입니다. 이번 라이브러리는 TSMC와 ASML, 반도체 설계자동화 업체(EDA) 시높시스와 협업해서 만들었습니다.

쉽고 다양하게 AI 서비스 개발 돕는다

슈퍼컴퓨팅 서비스인 DGX 클라우드 서비스도 공개했습니다. DGX 클라우드는 각 기업이 생성형 AI와 관련 애플리케이션 모델을 훈련하는 데 필요한 인프라와 소프트웨어에 수월하게 접근할 수 있도록 돕는 엔비디아의 서비스를 말합니다.

젠슨 황 CEO는 “스타트업은 파격적인 제품과 비즈니스 모델을 구축하기 위해 경쟁하고 있으며, 레거시 기업도 이에 대한 대응 방안을 모색하고 있다”며 “DGX 클라우드를 통해 각 고객은 글로벌 규모의 클라우드로 엔비디아 AI 슈퍼컴퓨팅 서비스에 바로 접근할 수 있다”고 설명했습니다.

젠슨 황 CEO에 따르면, DGX 클라우드 서비스는 오라클 클라우드 인프라스트럭처(OCI)로 호스팅이 가능합니다. 마이크로소프트 애저(Azure)에서는 올해 2분기부터 호스팅을 시작할 예정이며, 구글 클라우드도 논의 중입니다.

이어서 좀 더 세분화한 생성AI가 적용된 클라우드 서비스도 선보였습니다. 먼저 엔비디아는 클라우드 기반의 이미지 생성AI 서비스 ‘피카소(Picasso)’를 발표했는데요, 피카소는 인공지능 기반의 시각 응용 프로그램을 구축하는 클라우드 서비스입니다. 텍스트 데이터를 입력하면 이미지, 비디오, 3D 콘텐츠 등을 출력해 내는 것이지요. 젠슨 황 CEO는 소프트웨어 플랫폼 기업 어도비, 이미지 제공업체 셔터스톡과 손잡고 서비스 개발에 나설 예정이라고 밝혔습니다.

이어 소개한 건 AI 기반의 헬스케어 솔루션 ‘클라라(Clara)’입니다. 의료 부문에 특화한 애플리케이션 프레임워크로, 생성AI의 숨결을 더했습니다. 클라우드에 배포되는 이미지, 유전체, 환자 모니터링 및 신약 개발 등의 데이터가 담겨 있는데, 클라라를 이용해 기업은 AI 기반 헬스케어 애플리케이션을 더욱 수월하게 개발할 수 있을 것으로 보입니다.

바이오니모(BioNeMo)는 약물 발견 분야의 생성AI를 위한 클라우드 서비스입니다. 엔비디아의 클라우드 API를 통해 약물 개발자는 최신 생성 및 예측 생체 분자 AI 모델을 지정하고, 연구를 진행할 수 있다는 것이 젠슨 황 CEO의 설명입니다.

생성AI를 뒷받침하는 하드웨어 기술은?

마지막으로 엔비디아는 이번 키노트 세션에서 생성AI 서비스를 가속할 만한 하드웨어 기술도 발표했습니다. ▲L4 ▲L40 ▲H100 NVL ▲그레이스 호퍼가 베일을 벗었습니다.

L4는 비디오, AI, 비주얼 컴퓨팅, 그래픽, 가상화 등 범용적이면서 에너지 효율성이 높아야 하는 AI 가속에 사용되는 GPU입니다. 젠슨 황 CEO는 L4가 높은 처리량과 짧은 대기 시간을 제공할 수 있다는 점을 강조했습니다.

여기에서 좀 더 확장된 가속기가 L40입니다. L40은 데이터센터와 같은 대규모에 적합한 하드웨어로, 신경 그래픽, 가상화, 컴퓨팅 AI 기능을 제공합니다. L4가 엣지 중심이었다면, L40은 엔터프라이즈 데이터센터를 목적으로 만들어졌다고 볼 수 있겠습니다.

H100 NVL은 여러 개의 GPU를 유기적으로 연결해 마치 하나의 칩처럼 작동하도록 만들어준 가속기를 말합니다. 8개의 H100 모듈은 NVL이라는 자체 기술을 통해 연결돼 있어 마치 하나의 거대한 프로세서처럼 작동합니다. 데이터센터 중에서도 글로벌 규모의 대규모를 구축하는 데 사용될 예정인데요, 현재 생산중이라는 것이 젠슨 황 CEO의 설명입니다.

그레이스 호퍼는 CPU와 GPU를 빠른 속도로 연결해준 칩입니다. 엔비디아에 따르면, 그레이스 호퍼는 추천 시스템, 대형 언어 모델 등 거대한 데이터 세트를 처리하는 데 이상적입니다. 젠슨 황 CEO는 “이상적인 추론 엔진”이라고 강조하기도 했죠.

처음 그래픽 처리장치라는 하드웨어 사업으로 시작한 엔비디아지만, 이제는 소프트웨어와 라이브러리 기술을 빼고 논할 수 없는 기업이 됐습니다. 앞서 엔비디아가 소프트웨어 툴킷과 라이브러리로 AI 생태계 저변에 영향력을 확산할 수 있었던 것처럼, 생성AI 시대에도 결국 소프트웨어 기술로 영향력을 넓혀갈 것으로 보입니다. 이제 단지 팹리스 기업으로만 봐서는 안 될 엔비디아. 젠슨 황 CEO가 “엔비디아는 이제 그래픽 처리장치 업체가 아닌 종합 컴퓨팅 회사”라고 언급한 것이 떠오르네요.

글. 바이라인네트워크
<배유미 기자>youme@byline.network