사피온 AI 반도체 ‘X330’발표, “글로벌로 간다”
국내 AI 반도체 업체 사피온이 전작 대비 4배 속도 개선을 이룬 AI 반도체 신제품 ‘X330’을 발표했다.
X330은 TSMC의 7nm 공정으로 제작된 제품이다. 주요 특징은 플로팅 포인트 연산(실수 연산) 지원, 확장성, 클라우드 연결, 낮은 전력 소모, 넓은 모델 커버리지, 개발자 친화적인 제로-터치 SDK, 거대 언어 모델 지원 등이다. 초창기에는 2가지의 카드 형태로 제공하며 추후 서버나 시스템 형태로 제공할 예정이다.
카드 제품은 1개의 칩이 들어간 PCIe 한 칸짜리 X330 컴팩트와 2개 칩-PCIe 두 칸의 X330 프라임 2종이다.
X220과 비교하자면, 연산 성능은 87테라플롭스에서 367테라플롭스로 4배 이상 늘었다. 메모리는 기존 LPDDR4 램*5개 구성에서 GDDR6*8개 구성으로 바뀌었다. 탑재 메모리는 16GB이며 메모리 대역폭은 256GB/s까지 늘었다.
인터페이스는 PCIe Gen5 16레인을 사용하며 TDP는 최소 75W에서 최대 120W까지 사용한다. X330 프라임은 734테라플롭스, TDP 205W, 메모리 대역폭 512GB 등 컴팩트 제품의 두배 정도의 사양을 지원한다.
류수정 대표는 “칩 외에도 서버나 시스템으로도 제공할 것”이라며 “사피온 기반 서버로 교체할 경우 즉각 서비스 지원이 가능하도록 서비스 호환성을 제공할 것”이라고 밝혔다.
X330 제품의 구성 발표는 마이클 쉐바노우(Michael Shebanow) CTO가 맡았다.
X330 컴팩트 제품군을 기준으로 하면, AI 코어는 총 4개로, 64K MXC와 4개의 NVP로 구성돼 있다. 메모리의 경우 SK하이닉스 GDDR6 16GB 램을 사용하며 대역폭은 256GB/s다. 호환성 보장이 돼 있기 때문에 수급 문제가 생긴다면 타 회사의 GDDR6를 사용할 수도 있다.
CPU는 총 16개(4*4)의 RISC-V 기반 CPU를 사용하며, CPU 세트 옆에는 고성능 영상 코덱 클러스터가 위치한다. 이를 통해 영상 처리 속도를 개선했다. 내장된 하드웨어 IP를 통해 4채널 4K 60fps 동영상 입력 처리가 가능하다. 코덱 옆은 4개의 LGVCT를 통해 입출력과 형식변환을 제공하며, 하단에는 PCIe Gen 5 16레인을 통해 슈퍼컴퓨터와 통신한다.
제품은 주로 AI 훈련보다는 추론 전용이지만 웹 기반 트레이닝을 위한 트레이너 소프트웨어도 제공한다. 제로 터치 SDK를 사용해 배포 시간을 단축하며, 업계 표준인 OS 오닉스를 사용해 오픈소스-오닉스 컨버팅-사피온 하드웨어 사용 가능한 형태로 변환된다. 또한, 사피온 클라우드 서비스인 아티퍼런스(Artiference)를 통해 원하는 곳 어디에서든 AI 사용이 가능하다.
사피온은 왜 오직 훈련이 아닌 추론형 시장에만 집중하는 것일까? 해답은 사피온이 신생 업체이며, AI 시장에서 추론 시장이 더 크게 발전하고 있기 때문이다. 이 추론 시장에서의 점유율 확보가 사피온의 목표다.
전 세계 AI 데이터 센터용 서버 규모는 2027년까지 619만대로 증가할 것으로 예상되며, 이는 2022년 대비 31% 증가한 수치다. 추론만으로 따지만 32% 성장, 훈련 쪽은 26% 성장할 것으로 예상된다. 따라서 사피온은 AI 트레이닝보다는 추론(인퍼런스) 쪽에 집중한다.
추론 중에서도 생성형 AI는 2027년까지 81% 정도 성장할 것으로 예상되고 있다. 따라서 더 높은 메모리 대역폭이 필요할 것으로 예상되며, “경쟁 제품(엔비디아 L40S) 대비 비용 효율적이며 전력 효율적으로 만들기 위해 노력했다”고 류수정 대표는 밝혔다.
사피온의 미래 계획에 대해서는 SK가 지난 9월에 밝힌 바대로 2025년 정도에 X330을 통한 의미 있는 매출이 발생할 것으로 예상하고 있다. 우선은 X330 카드 비즈니스는 내년 상반기부터 매출을 만들어 갈 것이며, 빠르면 연말부터 PoC(Proof of Concept, 개념 증명)를 다른 AI 회사와 진행하기 시작할 것이라고 류수정 대표는 밝혔다. 현재 주요 매출처는 X220을 통한 SKB IDC(NPU 팜)이 절반 정도, NHN이나 MBC 등 외부 회사의 매출이 절반 정도다. “한국 전체 시장은 크지 않으므로 전 세계 업체로 진출하는 것이 목표”라며 류수정 대표는 전 세계 진출에 대한 포부를 밝혔다.
경쟁 상대는 엔비디아의 L40S로 생각하고 있으며, 엔비디아 A100 등과의 직접적인 성능 비교 언급은 “최적화가 끝나지 않아 어렵다”고 밝혔다. 다만 X220 대비해서는 성능은 4배, 전력 효율은 1.9배 성장했다고 밝혔다. 경쟁 제품과의 가격 경쟁력에 대해서는 밝히지 않았다.
추후 해당 제품은 X340으로 업그레이드돼 의료, 자율주행 등에서 쓰일 예정이다. 미래 제품은 X440의 경우 5나노 이하 공정을 사용해 더욱 높은 성능을 제공할 것이라고 사피온 측은 밝혔다.
한편, 사피온은 X330을 SKT의 ‘글로벌 AI 컴퍼니’ 도약을 위한 ‘SKT AI 피라미드’ 전략의 AI 인프라•AIX•AI 서비스 3대 영역 중 AI 인프라 영역에 참여해 지속적으로 신규 비즈니스 기회를 창출할 수 있는 관련 사업으로도 확장해 나갈 방침이다. 또한 사피온과 SKT는 AI 반도체를 활용하여 AI 및 빅데이터 분석을 통한 보이스피싱 방어 및 스팸/스미싱 방지 시스템을 제공해 외부 보안 위협으로부터 고객 보호를 위한 다양한 활동을 진행할 계획이다.
글. 바이라인네트워크
<이종철 기자> jude@byline.network
[무료 웨비나] API연결만으로 가능한 빠르고 쉬운 웹3 서비스 구축
- 내용 : API 연결을 통해 웹2와 웹3를 끊김 없이 연결하는 최신 융합 기술과 이를 통한 적용 사례를 다룹니다.
- 일시 : 2024년 10월 10일 (목) 14:00 ~ 15:10