바이라인네트워크에서 스타트업 리뷰를 연재합니다. 코너명은 ‘바스리’, <바이라인 스타트업 리뷰>의 줄임말입니다. 스타트업 관계자분들과 독자님들의 많은 관심 부탁드립니다.

“기존 AI는 클라우드를 거쳐야만 엣지 디바이스에서 결과를 도출할 수 있었다. 하지만 이제는 엣지 디바이스에서 발생하는 데이터 중 40%가 실시간 처리를 요구한다. 데이터가 생성된 곳에서 곧바로 AI 연산 처리하고 응답할 수 있는 솔루션의 필요성이 높아진 것이다.”

김녹원 딥엑스 대표는 창업 동기에 대해 이 같이 설명했다. AI 시장이 커지고 있지만 이를 뒷받침하는 기술은 아직 성숙하지 못하다. AI반도체 시장은 아직 초기 단계라는 평가를 받고 있다.

그 가운데 김 대표는 애플, 브로드컴, IBM, 시스코 등 주요 반도체·기술기업을 거치며 SoC 아키텍처와 관련 기술을 직접 다루고 개발했다. 해외 기업을 전전한 그는 아키텍처 구성과 이를 뒷받침하는 인력과 기술력이 중요하다는 사실을 깨닫게 됐다고 말했다. 이후 김 대표는 가벼우면서도 확장성을 가진 엣지용 AI반도체를 만들겠다는 목표를 가지고 딥엑스를 창업했다.

김녹원 딥엑스 대표

아픈 손가락 팹리스, AI반도체는 다르다?

한국은 메모리 강국이지만 시스템 반도체, 특히 팹리스 부문에서는 크게 빛을 발하지 못하고 있다. 우리 정부도 팹리스 산업을 키우기 위해 여러 정책을 마련하고 있지만, 여전히 산업 패권은 미국과 대만이 쥐고 있다. 그러다 보니 팹리스는 한국 시장에서 ‘아픈 손가락’으로 여겨져 오곤 했다.

그럼에도 김녹원 대표는 한국 팹리스 기업이 AI반도체 시장에서 경쟁력을 가질 수 있을 것이라고 보고 있다. 삼성, LG, SK 등 국내 대기업 중에서 AI를 자사 제품에 접목시키는 곳이 늘어나고 있기 때문이다. AI가 도입되는 곳은 어디든 AI반도체 기업의 고객사가 될 수 있다.

AI반도체 회사를 한국에 차린다는 것은 앞서 언급한 대기업과 더 많은 접점을 만들 수 있음을 의미한다. 김 대표는 “한국 시장에서 사업을 영위하면 대기업을 통해 시장 수요를 파악하는 데 유리하며, 추후 기업을 고객사로 유치할 가능성도 열어둘 수 있다”고 설명했다.

특히 데이터센터, 서버부터 시작해서 모바일, 스마트폰 등 단말기에도 AI가 광범위하게 탑재되면서, AI반도체의 중요성은 더욱 커지고 있다. 박영섭 딥엑스 전략기획팀장은 “이 AI반도체 시장을 효과적으로 공략하기 위해서는 각 애플리케이션을 최적화할 수 있으면서 소비전력도 낮은 AI반도체를 출시해야 한다”며 “딥엑스는 이 관점을 가지고 AI반도체를 개발해 나가고 있다”고 말했다.

딥엑스의 핵심 기술, ‘코어 최적화’

딥엑스가 주력하는 부분은 코어(프로세서 내에서 연산을 담당하는 요소) 최적화다. AI 프로세스에 걸맞게 프로세서 코어를 구성하고 이를 최적화하는 것이다. 그래서일까, 딥엑스는 자사 NPU에 대해 확장성이 좋고, 가볍게 사용할 수 있다고 자부한다.

AI반도체는 특정 알고리즘에 맞게 아키텍처를 설계하는 경우가 대부분이다. 그리고 하나의 칩에 여러 애플리케이션을 올리기 위해서는 각 애플리케이션 알고리즘마다 아키텍처도 다르게 적용돼야 한다. 하나의 반도체로 여러 애플리케이션을 올려 사용하는 것은 어렵다.

박영섭 팀장에 따르면, 딥엑스는 AI 응용 알고리즘을 자사 NPU에 바로 구동시킬 수 있는 자체 컴파일러와 런타임 소프트웨어와 연동 가능한 AI반도체를 만들었다. 이를 통해 하나의 칩에서 여러 애플리케이션을 위한 딥러닝 알고리즘을 구동시킬 수 있다. 박 팀장은 “딥엑스 NPU는 하나의 칩 위에 다양한 애플리케이션을 얹어도 문제가 안 된다”며 “여기에 소프트웨어 스택과 컴파일러도 확보해 AI 애플리케이션에 쉽게 적용하도록 지원한다”고 말했다.

더불어 딥엑스 NPU에는 좀 더 가볍게 데이터를 처리할 수 있는, ‘정수 연산’이 적용된다. 그간 AI 연산처리를 위해 탑재되던 GPU(그래픽 처리장치)는 부동소수점 연산을 한다. 부동소수점 연산을 하면 데이터 좌표를 정확하게 반영하기 때문에 자세하고 정확한 결과값을 낼 수 있다. 하지만 숫자가 복잡하기 때문에 데이터를 처리하는 데 많은 용량이 필요하고, 전력도 많이 소비된다.

이 한계를 극복하기 위해 딥엑스는 NPU에 정수 연산을 적용했다. 정수 연산이란 부동소수점 뒤에 발생하는 소수점을 제거하고, 정수 형태로 데이터를 처리하는 방법을 말한다. 숫자가 비교적 단순해 더 빠르게 연산할 수 있다. 박영섭 팀장에 따르면, 초저전력으로 AI연산을 엣지단에서 하기 위해서는 정수연산이 필요하다.

정수 연산을 도입한 일부 NPU는 정확도가 떨어진다는 평가를 받기도 한다. 하지만 박 팀장에 따르면, 딥엑스는 자체 압축 기술로 통해 데이터 용량을 6배 낮췄음에도 정확도가 높은 편에 속했다. 그는 “같은 1와트당 성능을 비교한 결과, 엔비디아는 1.4TOPS/W(초당 수조 번의 작업 횟수), 테슬라는 2TOPS/W를 기록했는데, 딥엑스는 10TOPS /W이상이 될 것이라는 결과가 나왔다”며 “각 성능에 적용된 구체적인 기술은 공개할 수 없지만, 전성비를 대폭 개선할 수 있을 것”이라고 말했다.

“다양한 공정 적용할 것”

현재 딥엑스는 NPU 칩 4종을 출시할 준비를 하고 있다. MPW(Multi-Project Wafer service)는 삼성 파운드리 5나노 공정으로 진행된다. 여기서 MPW란 파운드리에서 제공하는 시제품 제작 서비스로, 웨이퍼 한 장에 여러 개의 연구개발용 칩을 올려 제작해주는 것을 말한다. 웨이퍼 제작이 시작되는 팹인(Fab-in) 시점은 6월, 웨이퍼 생산이 마무리되는 팹아웃(Fab-out) 시점은 9월이 될 예정이다.

시제품 수령 이후, 딥엑스는 각 샘플을 고객사에 공급한 후, SoC(System on Chip) 칩 생산에 나설 계획이다. 이 과정을 거쳐 최종적으로 시제품이 완성되면, 제품 양산에 돌입할 예정이다. 예상 양산 시점은 2023년 4분기이며, 담당 파운드리는 현재 논의 중이다. 더불어 컴파일러와 SDK도 2분기내 공식 배포 예정이다.


다만 제품 양산 시 5나노 이하 공정에만 초점을 맞추지는 않을 전망이다. 박영섭 팀장은 “제품 양산 시에도 선단(Advanced) 공정을 적용할 예정이지만, 최선단만을 고집하지는 않을 것”이라고 말했다. 성능 향상과 전력 개선도 중요하지만, 파운드리 수요와 기업 차원의 손익 여부도 판단해 종합적으로 공정을 적용해야 한다는 것이 딥엑스 측의 의견이다.

현재 딥엑스에는 하드웨어 인재와 소프트웨어 인재가 엇비슷한 비율로 재직하고 있다. 박 팀장은 “추후 소프트웨어 인력이 많아질 것”이라고 말했다. 하드웨어 기술은 처음 플랫폼을 세팅할 때 필요하며, 이후에는 조금씩 개선해 나가는 정도로만 인력이 투입된다. 하지만 알고리즘은 점차 다양해진다. 여러 종류의 알고리즘을 감당할 수 있는 칩을 개발하기 위해서는 소프트웨어 기술을 확보해야 한다.

마지막으로 박영섭 팀장은 “각 AI기업을 지원하기 위해서는 더 많은 소프트웨어 인력이 필요하다”며 “추후 딥엑스도 소프트웨어 관련 업데이트를 진행할 예정”이라고 말했다.

글. 바이라인네트워크
<배유미 기자> youme@byline.network