반도체 3사 나란히 AI 칩 발표, 인텔 “저렴”, AMD “성능”, 엔비디아 “엔비디아”

대만에서 열리는 컴퓨텍스에서 반도체 3사가 나란히 AI 가속기를 공개했다. 가장 크게 관심을 모은 것은 엔비디아의 신규 GPU 로드맵이다.

젠슨 황 엔비디아 CEO는 컴퓨텍스 기조연설에서 앞으로 매년 GPU 아키텍처를 바꾸겠다는 놀라운 발언을 했다. 엔비디아는 기존에는 2년에 한번씩 아키텍처를 바꾸고 있었다. 현시대 서버용 GPU를 대표하는 H100과 H200이 같은 아키텍처를 사용했으며, 올해 말 출시할 블랙웰 제품이 그다음 아키텍처다. 올해 말 출시되는 블랙웰에는 8단 HBM3E를 탑재할 예정이며, 2025년 출시 예정인 블랙웰 울트라에는 12단 HBM3E가 들어간다.

엔비디아는 지난 3월 블랙웰을 공개한 이후 3개월 만에 2026년 제품 루빈 아키텍처까지 공개했다. 루빈에 대한 자세한 제원은 공개되지 않았으나, 6세대 HBM인 HBM4가 최대 12개까지 들어갈 것은 확실하다.

AI 칩 시장에서 꾸준히 엔비디아에 도전하고 있는 AMD 역시 컴퓨텍스에서 AI 가속기 개발 로드맵을 공개했다. 기조연설에서 리사 수 AMD CEO는 기존 제품 MI300X의 업그레이드 버전인 ‘MI325X’를 공개했다. MI325X의 특징은 메모리 용량이다. 엔비디아가 현재 판매 중인 H200에는 HBM3E가 총 6개(141GB) 들어가는데, MI325X에는 288GB가 탑재될 것으로 알려졌다. 12개에 해당하는 수치다. “성능 전체는 B200보다 1.2배 빠르다”고 수 CEO는 강조했다. AMD는 또한 새 아키텍처를 사용하는 인스팅트 MI350 시리즈는 2025년 출시, 인스팅트 MI400 시리즈는 2026년에 출시한다고 밝혔다.

두 업체의 발표 이후 시장 반응은 갈렸다. 엔비디아가 미래에 대한 청사진을 선보였다는 평가를 받았고, AMD는 따라가는 느낌만 주었다는 느낌이 강하다. 평가는 주식에서도 바로 나타났는데, 엔비디아는 동부 표준시 기준 3.13% 오른 1130.09달러에 거래됐으며, AMD는 3.23% 내린 161.51달러를 기록했다.

인텔 역시 기존의 가우디 3를 다시 언급하며 AI 가속기 시장의 유일한 대안이 자신들이라고 밝히고 있다. 펫 갤싱어 인텔 CEO는 가우디 3에 대해 언급하며, “동급 규모의 H100 GPU 대비 학습 시간이 최대 40% 빠르고, 거대 언어모델을 실행할 때 엔비디아 H100 대비 평균 최대 2배 빠른 추론을 제공할 것”이라고 밝혔다. 인텔이 내세우는 건 저렴한 가격도 있다. 가우디 3는 H100 대비 2/3 가격에 판매될 것이라고 밝히고 있다. 8개의 인텔 가우디 3 가속기와 UBB 포함 키트는 12만5000달러에 판매된다.

PC 시장에서도 AI 가져간다

한편, 세 업체는 소비자용 PC 시장에서도 AI를 강조했다.

엔비디아는 ‘RTX AI PC’를 공개하며 AI 비서와 디지털 휴먼 기능 등을 사용할 수 있도록 RTX 노트북 업데이트를 지원한다. 엔비디아는 PC 게임에서 맥락을 인식해 음성으로 게임 풀이를 도와주는 RTX 기반 AI 비서 프로젝트 G-어시스트를 공개했다.

해당 기술은 엔비디아가 배포알 RTX AI 툴킷을 통해 구현됐다. RTX AI 툴킷은 개발자들이 윈도우 PC에서 대규모 생성형 AI 모델을 최적화하고 배포할 수 있는 도구 및 소프트웨어 개발 키트 모음이다.

윈도우 11 사용자에게는 코파일럿+ PC 환경으로 무료 업데이트를 지원한다. 기존 CPU 제조사의 NPU를 통해 구동되는 코파일럿+ PC를 RTX GPU로도 구현 가능하게 되는 셈이다.

이외에도 엔비디아는 디지털 휴먼 구현을 위한 엔비디아 ACE NIM 기술을 공개했다. 온디바이스에서 자연어 이해, 음성 합성, 페이셜 애니메이션 등을 위한 고품질 추론을 제공한다.

AMD는 노트북용 AI CPU ‘라이젠 AI 300’과 데스크톱용 CPU ‘라이젠 9000’을 공개했다.

라이젠 AI 300은 코파일럿+ PC용으로 사용할 수 있는 칩셋이다. 대만 TSMC 4나노 공정에서 생산되는 AI 300은 50TOPS의 연산 속도를 갖고 있다. 현재 코파일럿+ PC에 탑재되는 퀄컴 스냅드래곤 X 엘리트의 NPU 연산 속도는 40~45TOPS 수준이다. 또한, 라데온 800 GPU를 내장해 콘솔 못지않은 속도와 해상도로 게임을 처리한다고 AMD는 밝혔다. 데스크톱용 라이젠 9000은 AMD의 최신 아키텍처인 ‘젠5’를 적용해 기존 젠4 CPU 대비 16%의 성능 개선을 이뤘다.

인텔 역시 코어 울트라 CPU 2세대인 ‘루나레이크’ 제품에 대해 언급했다. 올해 3분기 출시가 예정된 루나 레이크는 TSMC의 3나노 공정에서 제조되며, 48TOPS의 연산 속도를 갖추고 있다. 인텔은 CPU 처리 속도는 기존 모델 대비 14%, GPU 성능 50%, 배터리 수명 60% 개선됐다고 밝히고 있다. 또한, 루나레이크 제품에는 16GB 혹은 32GB LPDDR5X 램이 통합 패키징돼 있다. 이로써 데이터를 옮기는 데 드는 전력 소비 역시 40%가량 줄였다고 밝혔다.

인텔은 루나레이크의 후속작인 팬서레이크에 대한 정보도 약간 공개했다. 팬서레이크는 인텔이 내년 출시 목표로 개발 중인 PC용 프로세서로, TSMC에서 제조되는 루나레이크와 달리 인텔의 18A(1.8나노미터) 공정에서 생산된다.

팻 겔싱어 인텔 CEO는 퀄컴의 스냅드래곤 X 엘리트에 대한 언급을 하기도 했다. 겔싱어 CEO는 “:Arm 기반 윈도우는 처음도 아니고, 현재 PC 생태계에서 x86의 점유율은 대단히 높다”며, “현재 생태계에서 Arm 기반 생태계로 넘어가기에는 이유가 필요하다”고 밝혔다. 퀄컴에서 배터리 효율을 강조하는데, 인텔 역시 루나레이크로 배터리 효율을 확보했기 때문인 것으로 밝혀졌다. 저스틴 호타드(Justin Hotard) 인텔 수석 부사장 역시 미디어 라운드에서 “인텔과 루나 레이크의 강점은 x86 기반의 강력한 소프트웨어, 파트너 생태계를 이어받는 것”이라며, 소프트웨어 호환성을 무기로 들었다.

글. 바이라인네트워크
<이종철 기자> jude@byline.network

[컨퍼런스 안내] 클라우드 보안 & 제로트러스트 컨퍼런스 2024

  • 일시: 2024년 7월 4일 오전 8:40 ~ 오후 6:00
  • 장소: 서울 서초구 강남대로 213 양재 엘타워 6층 그레이스홀

[무료 웨비나] B2B기업, AI 시대 어떻게 고객을 발굴할 것인가?

  • 정민아 <하룻밤에 읽는 B2B 마케팅> 저자
  • 2024년 7월 9일 14:00~15:00

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다