[GTC 2025] 엔비디아가 꿈꾸는 AI 미래 톺아보기
엔비디아가 H100의 아키텍처인 ‘호퍼’보다 수백 배 빠른 차세대 아키텍처 ‘루빈’을 공개했다. 엔비디아는 2026년 하반기에 루빈을, 2028년에는 루빈의 다음 세대 아키텍처인 ‘파인만’을 출시할 예정이라고 밝혔다.
젠슨 황 엔비디아 최고경영자(CEO)가 18일(현지시각) 자체 개발자 컨퍼런스인 ‘GTC 2025’ 행사에서 기조연설을 통해 새로운 제품과 기술을 소개했다. 주목할 만한 내용으로는 ▲차세대 그래픽처리장치(GPU) 아키텍처 로드맵 ▲기업 AI용 DGX 플랫폼이 탑재된 PC ▲신형 실리콘 포토닉스 네트워킹 스위치 ▲AI 추론 보조 소프트웨어 ‘다이나모’ ▲인간형 로봇 파운데이션 모델 ‘그루트 N1’이 있다.
성능 올리고 비용 낮춘다…블랙웰 울트라 플랫폼
젠슨 황은 지난해 엔비디아가 발표했던 GPU 아키텍처 ‘블랙웰’ 기반 플랫폼이 본격 생산 중이라고 말했다. 이어서 올해 하반기 차세대 플랫폼 ‘블랙웰 울트라’를 출시할 예정이라고 알렸다.
젠슨 황은 블랙웰이 이전 세대 아키텍처(호퍼)보다 추론 성능이 높으면서 전력 소모량은 줄었다고 주장했다. 같은 비용으로 더 많은 작업이 가능하다는 이야기다. 블랙웰 울트라에는 추론 도중 더 많은 연산을 통해 정확도를 개선하는 기술을 도입했다. AI 추론, 에이전트 AI, 물리적 AI 기술이 적용된 앱을 더 빠르게 구동할 수 있다.

블랙웰 이후 아키텍처 로드맵도 공개했다. 2026년 하반기에는 차세대 아키텍처 ‘베라 루빈’을 출시할 예정이다. 엔비디아 맞춤형 프로세서 ‘베라’와 속도를 향상시킨 최신 GPU ‘루빈’을 결합한 새로운 형태의 슈퍼칩이다. 2027년에는 베라 루빈의 업그레이드 버전 ‘베라 루빈 울트라’가, 2028년에는 파인만 아키텍처가 출시될 예정이다.
젠슨 황은 “(AI 데이터센터 기준으로) 블랙웰 성능이 H100에 적용된 호퍼보다 68배 높으며, 루빈 성능은 호퍼의 900배에 달할 것”이라고 주장했다. 이어 “동일한 성능을 내는 데 필요한 비용은 블랙웰이 호퍼의 13%, 루빈은 호퍼의 3%에 불과할 것”이라고 강조했다. 다만, 다음 세대 칩으로 소개한 파인만 아키텍처의 성능은 언급하지 않았다.
개인 PC 크기에 데이터센터의 기업용 AI 플랫폼 넣었다
블랙웰 울트라 플랫폼을 기반으로 한 신형 DGX AI 컴퓨터 ‘DGX 스파크’와 ‘DGX 스테이션’도 공개했다. DGX는 기업 AI용으로 만들어진 엔비디아의 하드웨어와 소프트웨어 통합 플랫폼이다.

그동안 데이터센터를 통해서만 이용할 수 있었던 기업용 고성능 AI 플랫폼을 개인 PC 크기의 기기에서 구동할 수 있게 했다. 블랙웰 울트라의 높은 연산 성능 덕이다. 엔비디아는 델·레노버·HP를 비롯한 파트너사를 통해 신형 DGX AI 컴퓨터를 출시하겠다고 밝혔다.
데이터 전송에 ‘빛’ 사용, 에너지 절약하는 네트워킹 스위치
이날 엔비디아가 발표한 실리콘 포토닉스(광자) 네트워킹 스위치는 ‘퀀텀-X’와 ‘스펙트럼-X’까지 두 종류다. 전기 신호 대신 빛으로 데이터를 전송하는 광자 기술을 전자 회로에 통합했다.

젠슨 황은 광자를 활용하면 기존 전자 신호에 비해 전력 효율성이 3.5배 높아진다고 주장했다. GPU가 수백만 개 있는 초대형 AI 데이터센터에 신형 네트워킹 스위치를 도입하면 에너지 소비와 운영비를 절감할 수 있다고 덧붙였다. 퀀텀-X는 올해 하반기, 스펙트럼-X는 2026년 출시 예정이다.
GPU 병목 현상 막는 무료 소프트웨어 ‘다이나모’
오픈소스 모듈형 추론 프레임워크 ‘다이나모’도 등장했다. 메모리 관리, 데이터 전송 가속 등 AI 추론 과정을 보조하는 역할을 담당한다.

다이나모는 대형언어모델(LLM)을 처리하고 답변을 생성하는 과정을 세분화한다. 그다음 각 작업을 서로 다른 GPU에 할당한다. 소수의 GPU에 요청이 몰리고 성능이 저하되는 ‘병목 현상’을 줄일 수 있다. 젠슨 황은 이 기술이 AI 데이터센터의 수많은 GPU 자원을 골고루 활용하며, 각 단계에 필요한 처리 방법도 독립적으로 최적화할 수 있다고 밝혔다.
물건 옮겨 잡고 이동도 가능…인간형 로봇 ‘그루트 N1’
이날 젠슨 황은 인간형 로봇 파운데이션 모델 ‘그루트 N1’을 소개했다. 파운데이션 모델은 다양한 분야에 활용할 수 있도록 광범위한 데이터로 훈련한 AI 모델을 가리킨다.

젠슨 황은 그루트 N1에 대해 “잡기, 물체 옮기기, 다른 손으로 옮겨 잡기 같은 일반적인 작업부터 긴 맥락을 이해해야 하는 여러 단계의 작업까지 기본적으로 소화해 낸다”며 “대표적으로 자재 운반, 포장, 검사 같은 작업에 활용할 만하다”고 언급했다. 파운데이션 모델 특성상 개발 방향에 따라 활용도는 무궁무진하다.
젠슨 황은 “추론 AI와 에이전트 AI의 발전으로 AI 컴퓨팅 수요가 가속화되고 있다”며 “향후 데이터센터 구축 규모가 1조달러(한화 약 1453조원)에 달할 것”이라며 AI 수요가 앞으로 더욱 크게 높아질 것임을 시사했다.
그가 기조연설을 발표한 GTC 2025 행사는 미국 새너제이에서 17일부터 21일까지 진행된다. 이 자리에서 900여개 기업이 엔비디아 기술과 관련된 발표를 진행할 예정이다.
글. 바이라인네트워크
<이병찬 기자>bqudcks@byline.network