GPU 생태계 선두에 선 엔비디아, 침투하려는 NPU 업계

[무료 웨비나] 개발자를 위한 클라우드플레어를 소개합니다

◎ 일시 : 2025년 2월 6일 (목) 14:00 ~ 15:00


[무료 웨비나] 중동의 ICT 및 테크 기업 생태계 – 사우디 아라비아, UAE를 중심으로

◎ 일시 : 2025년 1월 23일 (목) 14:00 ~ 15:10

2017년 구글이 자체 개발한 딥러닝 칩 ‘TPU’를 처음 선보였을 때, 인공지능(AI) 업계는 큰 변혁이 일어날 것이라며 놀랍다는 반응을 보였다. 그간 AI는 그래픽 처리장치(GPU)로만 구동된다는 인식이 있었는데, 구글이 이 틀을 처음으로 깼기 때문이다. 이후에도 신경망처리장치(NPU)로 불리는 AI가속기를 만드는 기업이 속속 늘어났고, 최근에는 AI반도체만을 설계하는 스타트업도 생겨나기 시작했다. AI 기술이 발전하면서 NPU의 가능성을 봤기 때문일테다.

그럼에도 여전히 GPU의 아성은 견고하다. 시장조사업체 딜로이트의 올해 1월 통계에 따르면, 엔비디아의 AI반도체 시장점유율은 97%를 기록했다. TPU를 비롯한 NPU가 시장에 등장하면서 엔비디아가 100%의 점유율을 가져갈 수는 없게 됐지만, 여전히 그 입지는 탄탄하다.

젠슨 황 엔비디아 CEO

GPU 생태계 견고하게 만들려는 엔비디아

엔비디아는 “PC로 풍부한 게임과 멀티미디어를 즐길 수 있도록 하자”는 목적으로 설립됐다. 그래픽 처리가 본래의 목적이다.

그런데 GPU는 기존 데이터 처리에 사용되던 중앙처리장치(CPU)와 달리 한 번에 많은 양의 데이터를 처리할 수 있다는 장점이 있다. CPU는 들어오는 데이터를 한 번에 하나씩 순차적으로 처리하는 직렬 처리 방식으로 구동되지만, GPU는 들어오는 데이터를 병렬로 처리하기 때문이다.

AI 연구자들은 한 번에 많은 데이터를 처리할 수 있다는 GPU의 특성이 그래픽 처리 외에 딥러닝 등에 사용하면 유용하다는 사실을 발견했다. 엔비디아는 이를 사업의 기회로 삼고 AI 시장에 적극 투자했다. 대표적으로 GPU를 프로그래밍할 수 있는 언어 쿠다(CUDA)를 개발했다. 쿠다 언어는 기존 개발자가 사용하던 개발 언어와 호환되는데, 이로써 GPU는 범용으로 사용될 수 있었다.

나아가 엔비디아는 각 목적에 맞게 필요한 소프트웨어(SW)를 묶어서 함께 제공하기 시작했다. 이미지 생성, 자동차, 가상현실 등 각 기술을 구현하기 위해서는 다양한 종류의 SW가 필요한데, 이를 미리 엔비디아가 준비해서 함께 제공하는 것이다. 이미 개발에 필요한 판을 다 깔아주니, 개발자는 오로지 서비스에 필요한 기술만 개발하면 됐다. 개발자 입장에서는 GPU를 사용해 서비스를 개발하는 것이 훨씬 수월하다. 결국 엔비디아는 GPU를 사용하기 쉽게 만들어 생태계를 넓힐 수 있었다.

일각에서는 GPU 시장을 독식하고 있는 엔비디아가 NPU까지 출시하면 AI 반도체 시장 전체를 독식할 수 있지 않겠느냐는 분석이 있었다. 그러나 엔비디아가 NPU를 개발할 가능성은 낮다는 평가다. 이미 GPU로 만들어 놓은 생태계가 방대하기 때문에, 또 다른 칩 생태계 구축에 나설 필요성을 크게 느끼지 못하기 때문이다. 물론 CPU와 데이터센터용 프로세서 DPU 사업도 진행하고 있기는 하지만, 이는 모두 엔비디아의 GPU를 뒷받침하기 위한 목적이 크다.

한 국내 반도체 설계 엔지니어는 “몇 년전 엔비디아가 딥러닝 전용 가속기를 개발한 적이 있었으나, 별도의 성과가 없었고, 결국 이를 오픈소스로 배포했다”며 “엔비디아는 새로운 칩을 개발하기보다는 이미 가지고 있는 GPU에 텐서코어와 같은 가속 기능을 탑재하는 방식으로 성능을 높이고 있다”고 말했다.

엔비디아는 다양한 종류의 AI 서비스가 등장할 것을 고려해 SW 스택의 종류도 늘리고 있다. 지난 3월 진행된 연례 개발자 콘퍼런스 GTC 2023에서 엔비디아가 300개의 분야에 적용될 수 있는 가속 라이브러리와 100개의 업데이트 사항을 공개했던 것도 그 일환으로 풀이된다. 엔비디아는 지원하는 분야를 세분화해 더 많은 서비스 개발자가 GPU를 사용하도록 유도하고 있다.

NPU 업계에 주어진 도전 과제는

엔비디아의 아성에도 자체 칩을 개발에 뛰어드는 기업이 늘어나고 있고, 심지어 NPU만을 다루는 스타트업도 생겨나는 중이다. 구글과 테슬라, 아마존 등 대기업은 자체 칩 개발에 나서고 있다. 국내에서는 NPU만을 주력하는 반도체 기업이 생겨나고 조금씩 세력을 키워 나가고 있다. 이들은 무엇을 바라보고 사업을 지속하는 것일까

우선 NPU를 개발하는 가장 큰 이유는 자체 서비스를 강화하기 위함이 크다. 아무래도 서비스에 적합한 칩은 이를 개발한 기업이 가장 잘 안다. 각 기업은 반도체에 필요한 성능을 자유롭게 반영해 서비스 품질을 높이기 위한 목적으로 NPU 개발에 나섰다.

애초에 NPU는 데이터를 대량으로 학습하는 트레이닝보다 결과값을 내고 서비스를 제공하는 역할을 하는 추론(inference) 부문에 더 특화돼 있다. 국내 AI반도체 스타트업인 리벨리온의 박성현 대표는 “AI 중에서도 트레이닝 부문은 쿠다를 비롯한 엔비디아 시스템 없이 진행하기 쉽지 않다”면서도 “하지만 추론은 그보다 생태계나 시스템 및 소프트웨어 구조가 간단하기 때문에, NPU는 추론 쪽에 좀 더 강점을 가지고 있다”고 설명했다.

결국 엔비디아와 NPU 업계는 트레이닝과 추론 부문에서 각기 다른 강점을 가지고 공존할 것으로 보인다. 김선욱 엔비디아 이사는 “결국 각자만의 서비스를 강화하기 위해서는 자체 칩 개발이 필요하다”면서 “반면 엔비디아의 GPU는 범용 칩으로 이 세상의 모든 연구개발자가 사용할 수 있는데, 각기 다른 목적을 가지고 시장 내에서 공존할 것”이라고 설명했다.

다만 NPU가 GPU를 온전히 대체하기에는 쉽지 않을 전망이다. 이미 사회에 깊게 자리잡은 문화를 단번에 뿌리뽑기 어렵듯, GPU 중심의 생태계를 NPU 중심으로 단시간에 바꾸기란 쉽지 않다. 아무리 NPU의 데이터 처리 성능이 GPU를 앞선다 하더라도, 반도체는 다방면을 고려하며 접근해야 한다. 타 서비스와의 호환성, 보안 등 다방면을 고려했을 때 아직은 NPU 업계에 해결해야 할 과제가 남아있는 셈이다.

다만 NPU가 GPU를 대체하기 위해서는 성능 외 추가로 해결해야 할 과제가 남아 있다. 타 서비스와의 호환성, 보안 등 다방면을 고려해야 한다. 특히 보안성 문제는 기업이 민감하게 생각하는 부분이기 때문에, 이를 확보할 수 있는 기술도 함께 개발돼야 한다는 설명이다.

김선욱 이사는 “최근 챗GPT를 둘러싼 보안성 관련 문제가 대기업 중심으로 대두되는 것을 보면, AI반도체의 성능 못지 않게 보안성도 중요하다”며 “결국 AI 시장이 커질수록 이를 구동하는 반도체의 보안성은 더욱 중요해질 터인데, 규모가 작은 기업이 이를 모두 컨트롤할 수 있는 기술을 단시간에 개발하기에는 쉽지 않을 것”이라고 말했다.

글. 바이라인네트워크
<배유미 기자>youme@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다


The reCAPTCHA verification period has expired. Please reload the page.