레드햇, AWS와 AI 추론 협업 발표

레드햇은 아마존웹서비스(AWS) 상에서 레드햇 AI와 AWS AI 실리콘을 통해 엔터프라이즈급 생성형 AI를 지원하기 위해 협업을 확대한다고 3일 발표했다.

레드햇은 IT 의사결정자들이 기반 하드웨어와 관계없이 고성능·고효율 AI 추론을 대규모로 실행할 수 있도록 유연성을 제공하는 데 집중한다.

레드햇과 AWS의 협업은 레드햇의 포괄적인 플랫폼 역량과 AWS 클라우드 인프라, 그리고 AI 칩셋인 ‘AWS 인퍼런시아2’와 ‘AWS 트레이니움3’을 결합함으로써 조직이 전방위적인(full-stack) 생성형 AI 전략을 구현할 수 있도록 지원한다.

vLLM 기반의 ‘레드햇 AI 인퍼런스 서버’는 AWS 인퍼런시아2 및 AWS 트레이니움3를 포함한 AWS AI 칩과 함께 실행될 수 있게 되며, 모든 세대의 생성형 AI 모델을 지원할 수 있는 공통 추론 레이어를 제공한다. 이를 통해 고객은 프로덕션 환경의 AI 배포를 확장함에 있어 더 높은 성능, 더 낮은 지연 시간, 비용 효율성을 달성할 수 있다. 기존 GPU 기반 아마존 EC2 인스턴스 대비 최대 30~40% 향상된 가격 대비 성능을 제공한다.

양사는 AWS 상에서 제공되는 포괄적인 완전 관리형 애플리케이션 플랫폼인 ‘AWS 레드햇 오픈시프트 서비스’와 ‘레드햇 오픈시프트’, ‘레드햇 오프시프트 AI를 위한 ‘AWS 뉴런’ 오퍼레이터를 개발했다. 이를 통해 고객은 AWS 가속기를 활용해 AI 워크로드를 더욱 원활하고 지원되는 방식으로 실행할 수 있는 경로를 제공받게 된다.

AWS AI 칩 지원을 통해 레드햇은 AWS 환경의 레드햇 고객에게 수요가 높고 용량이 큰 가속기에 대한 향상되고 쉬운 접근성을 제공할 예정이다. 또한 레드햇은 최근 ‘레드햇 앤서블 오토메이션 플랫폼’을 위한 ‘아마존.ai 인증 앤서블 컬렉션’을 출시했으며, 이를 통해 AWS 상에서 AI 서비스를 오케스트레이션할 수 있도록 지원한다.

레드햇과 AWS는 vLLM에 업스트림(up-stream)된 AWS AI 칩 플러그인을 최적화하기 위해 협력하고 있다. vLLM의 최대 상업적 기여자로서, 레드햇은 AWS 상에서 vLLM을 활성화함으로써 사용자의 AI 추론 및 학습 역량을 가속화하는 데 기여하고 있다. vLLM은 대규모 추론 제공을 목표로 하는 오픈소스 프로젝트인 llm-d의 기반이 되며, 현재 레드햇 오픈시트프 AI 3에서 상업적으로 지원되는 기능으로 제공된다.

레드햇은 데이터센터에서 엣지 환경에 이르기까지 고객을 지원하기 위해 AWS와 오랜 기간 협력해 왔다. 이번 최신 성과는 조직이 하이브리드 클라우드 전략에 AI를 통합하는 과정에서 진화하는 요구사항을 해결하고, 최적화되고 효율적인 생성형 AI 성과를 달성하는 것을 목표로 한다.

AWS 뉴런 커뮤니티 오퍼레이터는 현재 레드햇 오픈시프트 또는 AWS 레드햇 오픈시프트 서비스를 사용하는 고객을 위해 레드햇 오픈시프트 오퍼레이터허브에서 이용할 수 있다. AWS AI 칩을 지원하는 레드햇 AI 인퍼런스 서버는 2026년 1월 개발자 프리뷰로 제공될 예정이다.

조 페르난데스 레드햇 AI 사업부 부사장 겸 총괄 매니저는 “혁신적인 vLLM 프레임워크를 기반으로 구축된 엔터프라이즈급 레드햇 AI 인퍼런스 서버를 AWS AI 칩과 함께 구현함으로써, 우리는 조직이 보다 향상된 효율성과 유연성을 기반으로 AI 워크로드를 배포하고 확장할 수 있도록 지원하고 있다”며 “레드햇의 오픈소스 유산을 바탕으로 한 이번 협력은 하이브리드 클라우드 환경 전반에서 생성형 AI의 접근성과 비용 효율성 제고를 목표로 한다”고 밝혔다.

콜린 브레이스 AWS 안나푸르나 랩 부사장은 “기업들은 미션 크리티컬 AI 워크로드를 위해 탁월한 성능과 비용 효율성, 운영 옵션을 제공하는 솔루션을 원한다”며 “레드햇과 협력을 통해 고객은 오픈소스의 유연성과 AWS 인프라, AI 가속기 기반의 기능을 결합해 파일럿에서 프로덕션까지 생성형 AI를 대규모로 배포하는 과정을 더욱 빠르게 가속화할 수 있는 지원 체계를 갖추게 됐다”고 강조했다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network