케이투스, 대규모 AI 위한 차세대 V3 서버 제품군 출시
IT 인프라 제품 및 솔루션 제공업체 케이투스(KAYTUS)는 최신 V3 서버 제품군을 출시한다고 6일 발표했다.
케이투스 V3 서버 제품군은 6세대 인텔 제온 프로세서와 AMD EPYC 9005 시리즈 프로세서를 지원하며, 일반 컴퓨팅, 멀티 노드, 크리티컬 컴퓨팅, 스토리지 최적화 및 랙 스케일 시스템을 아우르는 17가지 서버 모델로 구성된다.
V3 서버는 다양한 컴퓨팅 플랫폼과 광범위한 호환성을 제공하고, 향상된 인텔리전스 및 혁신적인 냉각 솔루션을 제공하며, 다양한 AI 애플리케이션을 효과적으로 지원한다. 고도화된 컴퓨팅 및 스토리지 혁신으로 CPU 버스 대역폭과 메모리 대역폭 및 용량을 최적화해, 듀얼 소켓 서버에서 최대 576개의 코어와 최대 5.0 GHz의 클럭 속도를 구현하고 메모리 대역폭을 136% 향상시킨다.
테스트 데이터에 따르면, 라마2 대규모 모델 AI 추론 시나리오에서 V3 서버의 전체 성능은 이전 세대 제품에 비해 최대 3배까지 향상된 것으로 나타났다.
새로 출시된 V3 서버 제품군은 CPU, GPU, FPGA 등 다양한 플랫폼을 지원하며, 콤포넌트부터 펌웨어, 노드, 랙스케일 전반에 걸쳐 풀스택 개방성을 제공한다. 또 V3 서버는 통합된 컴퓨팅 기반으로 컴퓨팅 효율성을 높이며, 노드 수직확장과 네트워크 수평 확장을 모두 지원한다.
구성요소 측면에서 V3 서버는 CXL 어댑터 카드와 BOX를 통한 메모리 확장을 지원하고, CXL 사양을 충족해 컴퓨팅 성능과 데이터 전송 용량 간 균형을 최적화한다.
V3 펌웨어는 OpenBMC 기반의 개방형 펌웨어 관리 플랫폼을 도입해 여러 레이어로 나뉜 분리형 아키텍처를 바탕으로 한 모듈화된 설계를 채택한다. 이를 통해 비동기식 반복 작업과 기능별로 분리된 업그레이드가 가능하며, 여러 컴퓨팅 플랫폼에서 통합 관리를 가능하게 한다.
노드 수준에서 서버 컴퓨팅 모듈 설계 사양 OCM을 기반으로 한 모듈형 분리 아키텍처를 통해 ‘컴퓨팅 유닛 분리’를 실현했다. CPU와 메모리를 중심으로 표준 고속 및 저속 상호연결 인터페이스를 지원하는 최소 컴퓨팅 유닛이 구성된다. 이는 프로세서 컴퓨팅을 개별 콤포넌트처럼 다루도록 설계해 인텔 및 AMD 프로세서와 폭넓은 호환성을 제공하고, 통합된 컴퓨팅 아키텍처와 한 대의 장비, 다중 코어 구성을 구현한다.
사용자는 다양한 애플리케이션 시나리오에서 최적의 솔루션을 신속하게 찾을 수 있다. 예를 들어, KR2190V3 서버는 완전히 분리된 구조로 인텔 BHS 및 AMD 투린 프로세서를 지원하며, 크로스 플랫폼 및 다중 시나리오에서 빠른 구축이 가능하다. V3 서버 제품군은 UBB2.0 사양 기반의 다각화된 오픈 가속 컴퓨팅 플랫폼을 갖췄고, OCP 오픈 가속 사양에 부합하는 다양한 OAM v2.0 모듈과 호환된다. 완전한 모듈식 설계와 뛰어난 시스템 에너지 효율성으로 대형 모델 및 AI 애플리케이션의 반복 개발을 지원하며, 컴퓨팅 성능의 혁신과 통합을 더욱 가속화한다.
랙스케일 단계에서 케이투스는 미래형 아키텍처에 맞춰 설계된 일부 OCP 오픈 표준과 호환되는 랙스케일 서버를 제공한다. 이 서버는 19/21인치 노드를 수용해 다양한 컴퓨팅 유연성 및 개방형 디커플링을 가능하게 하며, 딜리버리와 동시에 신속한 비즈니스 구축을 지원한다.
V3 서버는 데이터 스토리지에 최적화됐으며 단일 드라이브에서 최대 128TB의 용량과 최대 6PB의 단일 서버 용량, 단일 랙에서 2.7배 증가된 스토리지를 제공한다. 이런 기술력은 대규모 데이터 처리 및 스토리지 성능을 극대화해 대규모 AI 애플리케이션의 다양한 요구 사항을 효과적으로 충족시킨다.
케이투스는 서버의 전체 수명 주기 동안 실시간 모니터링과 경고가 가능하도록 20개 이상의 새로운 기능을 추가해 포괄적인 오류 진단 시스템을 구축했다.
결함 예측 및 경고 기능이 지능적으로 업그레이드됐다. 메모리의 경우, 수천 대의 서버에서 수집된 방대한 결함 데이터를 AI가 학습해 메모리 오류를 실시간으로 모니터링하고, 정정 불가능 오류(UCE) 결함에 대해 85%의 정확도를 달성했다. 하드 드라이브에서 어레이 카드의 결함 경고 기술이 플래그를 설정, 주기적인 BMC 쿼리를 통해 이상 드라이브에 대한 경고를 사전에 생성하고 조기 교체를 유도한다. 독립 진단 모듈을 지원해 진단 기능을 더욱 강화했으며 서버 메인보드의 디지털 신호에서 나노초 수준의 노이즈를 실시간으로 감지할 수 있다. 이를 통해 주요 부품의 실시간 모니터링과 근본 원인 위치 추적 정확도가 95%로 향상됐다.
케이투스 V3 서버는 다양한 방식을 통해 액체 냉각의 최적화를 달성해 에너지 소비를 줄인다. 모든 케이투스 서버는 액체 냉각을 지원하며, 2단계 냉각 플레이트, 음압 기술, 메인보드 PCB 특수 코팅, 누수 발생 시 자동 전원 차단 기능 등 혁신적이고 안전한 액체 냉각 기술을 적용해 효율성을 극대화한다.
케이투스 액체 냉각 서버는 85%의 냉각 효율을 제공한다. 혁신적인 메모리 슬리퍼(sleeper) 액체 냉각 기술과 무수 열교환 솔루션을 통해 다양한 두께의 메모리 및 하드 드라이브 구성을 지원한다. 액체 냉각 랙 스케일 서버는 향상된 방열 성능, 유연한 노드 지원, 강화된 누수 방지 기능, 표준화된 액체 냉각 콤포넌트를 제공한다.
V3 서버는 콤포넌트별 온도 모니터링, 정교한 단일 팬 제어 전략 및 고성능 팬을 통해 전반적인 에너지 효율을 최적화해 팬 냉각 효율을 20% 향상시킨다. 모든 서버에 98% 이상의 변환 효율을 갖춘 티타늄 전원 공급 장치가 기본 장착된다. V3 서버는 20%에서 50%에 이르는 다양한 작업 부하에서도 높은 변환 효율을 안정적으로 유지한다.
케이투스 측은 “V3 서버 제품군을 통해 AI, 데이터 분석, 클라우드 컴퓨팅 등 다양한 애플리케이션의 요구 사항을 충족시키며, 고객이 AI 시대에 최적화된 전방위적 컴퓨팅 솔루션을 쉽게 구현할 수 있도록 돕고 있다”며 “V3 서버 제품군의 혁신적 성능과 친환경 설계는 고객에게 안정적이고 효율적인 데이터센터 운영을 가능하게 해 비즈니스 확장과 경쟁력 강화를 지원한다”고 강조했다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network