IBM, 반도체 내부연결 혁신…구리 대신 광섬유로

생성형 AI 시대를 위한 새로운 광학 기술 발표

IBM은 데이터센터에서 생성형 AI 모델의 학습 및 실행 방식을 획기적으로 개선할 수 있는 차세대 광학 기술을 10일 발표했다.

IBM에서 공개한 광학 기술은 기존의 전선 기반 단거리 통신을 보완하는 새로운 공동 패키지형 광학(CPO) 기술로, 데이터센터 내부 연결 속도를 빛의 속도로 대폭 향상시킬 수 있는 새로운 공정이다.

IBM은 이 기술을 구동할 수 있는 폴리머 광학 도파관(PWG)을 성공적으로 설계, 조립해  공개했다. IBM 연구진은 CPO기술이 칩, 회로 기판, 서버 간 고대역폭 데이터를 전송하는 컴퓨팅 방식에 가져올 변화를 시연했다.

광섬유 기술은 전기 대신 빛으로 장거리 데이터 전송을 빠르게 처리하기 때문에, 현재 전 세계 상업 및 통신 트래픽 대부분에 사용되고 있다. 데이터센터의 경우 외부 통신 네트워크에는 광섬유를 사용하는데 반해, 내부 통신 네트워크의 대부분에는 여전히 구리선을 사용하고 있다. 이 전선은 대규모 분산 학습 과정에서 다른 장치의 데이터를 기다리느라 절반 이상의 시간을 유휴 상태로 보내는 GPU 가속기들을 연결하고 있는데 이로 인해 상당한 비용과 에너지가 소모된다.

IBM 리서치 HQ 광학 연구실에서 광학 모듈을 테스트하고 있다.

IBM 연구진은 광학 속도와 처리 능력을 데이터센터 내부로 도입할 방법을 제시했다. IBM은 새롭게 발표된 논문을 통해, 고속 광학 연결을 가능하게 하는 새로운 CPO 모듈의 시제품을 소개했다. 이 기술은 데이터센터 통신의 대역폭을 크게 확장하고, GPU의 유휴 시간을 줄이며, AI 처리 속도를 획기적으로 향상시킬 수 있다.

새 기술을 활용하면 중급 전기 배선(interconnect) 대비 전력 소비를 5배 이상 줄임으로써 생성형AI 확장 비용을 낮추고, 데이터센터 간 케이블 연결 길이를 기존 1미터에서 수백 미터로 확장할 수 있다.

CPO 기술을 통해 기존 전기 배선(wiring)을 사용할 때보다 거대 언어 모델(LLM)의 학습 속도를 최대 5배까지 높일 수 있다. 이를 통해 일반적인 LLM 학습 시간이 3개월에서 3주로 단축될 수 있으며, 더 큰 모델과 더 많은 GPU를 활용할 경우 성능 향상의 폭이 더욱 커진다.

AI 모델 학습 시 모델 당 미국 가정 약 5000가구의 연간 전력 소비량에 해당하는 에너지를 절감함으로써 데이터센터 에너지 효율을 극대화할 수 있다.

IBM 리서치 연구 개발 총책임자 다리오 길 수석 부회장은 “생성형 AI가 점점 더 많은 에너지와 처리 능력을 요구함에 따라 데이터센터는 진화해야 한다”며 “공동 패키지형 광학(CPO) 기술은 데이터센터를 미래에 대비하도록 만들 수 있다”고 밝혔다.

그는 “이 획기적인 기술을 통해 미래의 칩은 광섬유 케이블이 데이터 센터 안팎으로 데이터를 전달하는 방식으로 통신하게 될 것”이라며 “미래의 AI 워크로드를 처리할 수 있는 더 빠르고 지속 가능한 새로운 통신 시대를 열 것”이라고 강조했다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다