멜라녹스 “머신러닝·인공지능 인프라, ‘지능형 인터커넥트’가 최적”


인피니밴드 시장 강자인 멜라녹스테크놀로지스(이하 멜라녹스)가 지능형 인터커넥트(Interconnect) 기술을 내세워 인공지능(AI) 시장으로 시야를 넓혔다.

멜라녹스는 전세계 슈퍼컴퓨터(HPC) 시장에서 높은 점유율로 인터커넥트 시장을 선도해온 회사다. 전세계에서 가장 빠른 슈퍼컴퓨터를 포함해 전세계 톱(Top) 500 HPC 플랫폼의 70% 이상이 멜라녹스의 인터커넥트 기술로 연결돼 있다.

컴퓨터와 컴퓨터를 연결하는 네트워크 기술인 ‘인터커넥트’는 서비스 지연 없이 데이터를 고속 처리·전송해야 하는 환경일수록 이더넷보다는 인피니밴드가 지배적으로 활용되고 있다.

멜라녹스는 데이터와 애플리케이션이 갈수록 증가하면서 컴퓨팅 시스템 내 CPU 성능 한계로 나타나는 병목현상을 해결하기 위한 방안으로 네트워크에서 분산 연산처리하는 지능형 인터커넥트(Smart Interconnect) 기술을 제공하고 있다.

네트워크가 ‘코프로세서(Co-Processor)’ 역할을 하는 ‘코디자인(Co-design) 전략’으로 ‘인네트워크 컴퓨팅(in-Network Computiong)’을 구현한다.

Mellanox co-design멜라녹스는 최근 이같은 방식을 머신러닝·딥러닝 AI 인프라에 적용하고 있다.

기계가 스스로 학습해 인간처럼 인지하고 의사결정할 수 있게 하는 AI 시스템은 방대한 데이터를 수집·분석·처리하고 학습하기 때문에 고속의 컴퓨팅 성능과 클러스터 구조의 확장성(Scale-out)있는 인프라가 구축돼야 한다.

AI가 부각하면서 ‘병렬컴퓨팅’이 주목받은 이유도 여기에 있다. 실제로 머신러닝·딥러닝 AI 인프라에서는 CPU뿐 아니라 병렬연산처리에 최적화된 프로세서인 GPU가 많이 활용되고 있다.

네트워크는 패킷 손실이나 서비스 지연(Latency) 없이 빠르고 효율적으로 데이터를 전송하는 기술로 검증된 인피니밴드 기술이 많이 활용되고 있다.

멜라녹스는 AI를 위한 컴퓨팅과 네트워크로 구성된 전체 인프라에 분산 아키텍처 방식을 적용해 효율적인 처리 성능을 지원한다.

Mellanox Tong - small이에 대해 통 리우(Tong Liu) 멜라녹스 아시아태평양·중국 마케팅 개발 수석디렉터는 “성능이 제한적이고 스케일이 부족한 CPU 중심 아키텍처에서 나타나는 문제를 해결하기 위해 네트워크상에서 컴퓨팅 기능 일부를 수행하는 지능형 인터커넥트를 제공한다”라며 “멜라녹스 어댑터와 스위치는 컴퓨터에서 발생하는 부하를 네트워크로 분산시켜 고속으로 데이터를 전송해 효율적으로 처리한다”고 설명했다.

멜라녹스가 제공하는 지능형 인터커넥트를 구현 기술 가운데 하나가 ‘GPU다이렉트 RDMA(GPUDirect Remote Direct Memory Access)’이다. ‘GPU다이렉트 RDMA’는 CPU에 의존하지 않고 GPU 메모리 간 직접 데이터 전송을 지원해 성능을 높인다.

멜라녹스는 GPU와 멜라녹스 인터커넥트 사이의 데이터패스와 컨트롤패스를 모두 직접 연결할 수 있는 GPU다이렉트 4.0 최신 기술인 ‘GPU다이렉트 싱크(Sync)’도 지원한다.

rCUDA라는 기술을 활용해 CPU가 탑재돼 있지 않는 컴퓨팅 시스템도 연결돼 있는 다른 시스템에 있는 GPU 기술을 사용하는 것처럼 구현하는 ‘리모트 GPU 액세스(Remote GPU Access)’도 지원하고 있다.

리우 수석디렉터는 “GPU는 CPU에 비해 가격이 높기 때문에 모든 서버에 GPU를 탑재하긴 쉽지 않다. rCUDA는 GPU가 장착돼 있지 않은 시스템도 마치 GPU를 갖고 있는 것처럼 지원해주는 ‘가상GPU’ 기술을 제공한다. 멜라녹스는 rCUDA 기술부터 기술지원 서비스까지 제공하는 유일한 기업”이라고 강조했다.

멜라녹스는 현재 머신러닝·딥러닝 시장을 선점하고 있는 GPU 업체인 엔비디아와 밀접하게 협력하고 있다. 최근 엔비디아가 출시한 DGX-1 딥러닝 전용 어플라이언스에는 멜라녹스 인피니밴드 어댑터 인터커넥트 솔루션이 탑재돼 제공된다.

AI 관련 대표적인 구축사례로는 중국의 온라인쇼핑몰 업체인 JD.com의 딥러닝·클라우드 플랫폼, 바이두 딥이미지 슈퍼컴퓨터, 야후 플리커의 딥러닝 시스템, 페이스북의 오픈컴퓨팅프로젝트(OCP) 기반 GPU AI 플랫폼 등이 있다. 알리바바, 오하이오주립대학 등에서도 AI 관련 시스템에 멜라녹스 인피니밴드 기술을 사용하고 있다.

리우 수석디렉터는 “지능형 인터커넥트 기술은 AI 외에도 자율주행차량, 에너지, 안면인식, 음성인식, 미디어 등 GPU가 사용되는 다양한 인프라에서 효율적인 데이터 처리성능을 지원하고 있다”라며 “‘코프로세서’ 방식의 CPU 오프로드 아키텍처를 제공하는 기업으로 GPU가 사용되는 환경에는 멜라녹스가 있을 것”이라고 말했다.

글. 바이라인네트워크
<이유지 기자>yjlee@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다