클로드 투자한 아마존, 자체 생성AI 모델 ‘노바’ 공개

“세상을 지배하는 단 하나의 도구는 존재하지 않는다”

앤트로픽 클로드에 80억달러(약 10조원)를 투자했던 아마존이, 이번엔 자체 파운데이션 모델을 공개했다. 생성AI 시장에서 강력한 영향력을 갖고 있는 오픈AI의 GPT나, 메타의 라마(LLAMA)에 비견하는 모델이다. 텍스트 중심부터, 동영상을 생성하는 제품까지 총 6종류나 선보였다. 이들 서비스는 한국어를 포함, 200개 언어를 지원한다.

앤디 제시 아마존 최고경영자(CEO)는 3일(현지시각) 미국 라스베이거스에서 열린 아마존웹서비스(AWS) 클라우드 컨퍼런스 ‘리인벤트 2024’에서 노바를 발표하면서, 새 서비스의 존재 이유를 “고객의 다양한 선택지”를 꼽았다. 기업이 쓰는 여러 생성AI 모델 중에, 강력한 경쟁력이 있는 또 다른 선택지를 시장에 내놓았다는 뜻이다.

노바에 어떤 제품이 있는지, 아마존은 노바로 어떤 시장을 겨냥하고 있는지 알아보자.

노바 6형제, 각각의 특징은?

아마존 노바는 총 여섯 가지 모델로 나왔다. 텍스트로 묻고 답하되, 속도를 빠르게 한 ‘아마존 노바는 지연이 적고 가격이 저렴한 가장 보급형 모델이다. 그 위부터는 기능이 조금씩 추가되는데, 예를 들어 아마존 노바 라이트는 텍스트와 이미지, 비디오 등의 멀티 모달을 지원하고 저렴한 대신에 정확성 측면에서는 이보다 한단계 위인 ‘아마존 노바 프로’가 낫다. 노바 프리미어는 이중 가장 강력한 멀티모달 모델인데, 내년 1분기 공개될 예정이다. 노바 캔버스는 이미지를, 노바 릴은 동영상을 생성한다.

아마존 노바 마이크로(Amazon Nova Micro)

텍스트 전용이다. 챗GPT를 생각하면 쉽다. 빠른 응답과 비용 효율이 강조됐다. AWS는 메타 라마 3.1 8B나 구글 제미나이 1.5 플래시-8B와 비교해 모든 벤치마크에서 동등하거나 우수하다고 설명했다.

아마존 노바 라이트(Amazon Nova Lite)

멀티모달 모델로, 텍스트, 이미지, 동영상을 이해하고 생성한다. 뒤에 나오는 프로, 프리미어 등과 비교하면 성능의 차이가 있다. 예컨대 라이트는 GPT-4o 미니와 비교하는 19개 벤치마크 중에서 17개 영역에서 동등하거나 우수한 성능을 보였다. 또, 구글 제미나이 1.5 Flash-8B와 비교하면 21개 벤치마크 영역 중 17개에서, 앤트로픽 클로드 하이쿠 3.5와 비교해선 12개 중 10개에서 동등하거나 우수한 성적을 냈다.

아마존 노바 프로(Amazon Nova Pro)

텍스트나 이미지, 동영상을 이해하고 생성하는데 라이트보다 높은 정확도와 성능을 보인다. GPT-4o나  제미나이 1.5 프로와 비교해서 대부분의 벤치마크에서 동등하거나 우수한 성적을 보였다는 것이 AWS 측의 공식 발표다.

아마존 노바 프리미어(Amazon Nova Premier)

이날 발표된 멀티모달 모델 중 가장 높은 성능을 가졌다. 복잡한 추론 작업, 사용자 맞춤 모델 교육에 최적화했다. 하지만, 아직 일반에 공개되어 사용할 수 있는 것은 아니다. 2025년 1분기 출시가 예정되었다.

아마존 노바 캔버스(Amazon Nova Canvas)

텍스트나 입력된 이미지 프롬프트를 기반으로 전문가 수준의 이미지를 생성한다. 텍스트 입력으로 이미지를 쉽게 편집할 수 있는 기능과 색상 구성(color scheme), 레이아웃을 조정할 수 있는 제어 기능이 들어갔다. 이미지 출처를 추적할 수 있게 워터마킹을 제공하고, 유해한 콘텐츠 생성을 제한하는 콘텐츠 검열 기능을 넣었다. 오픈AI 달리 3(DALL-E 3)나 스테이블 디퓨전과 비교해서 주요 자동화 지표에서 더 우수한 성능을 보였다고 아마존 측은 설명했다.

아마존 노바 릴(Amazon Nova Reel)

텍스트와 이미지를 기반으로 고품질 동영상을 쉽게 생성할 수 있다. 회전, 줌 등의 시각적 동작 제어를 할 수 있는 카메라 모션을 지원한다. 광고, 마케팅, 교육 등의 콘텐츠 제작에 적합하며, 자연어 프롬프트를 사용해 시각적 스타일과 속도를 제어할 수 있다. 런웨이의 젠-3 알파와 비교, 품질과 일관성 면에서 경쟁력이 있다고 판단했다. 역시 워터마킹과 콘텐츠 검열을 지원한다. 현재는 6초 길이의 동영상 생성이 가능한데, 향후 몇 달 안으로 최대 2분 길이의 동영상 생성을 지원할 예정이다.

노바로 어떤 시장을 겨냥하나

기업 시장이다. 기업이 아닌 일반인 사용자는 아직 노바를 쓸 수 없다. 대신, 기업에서는 노바 프리미어를 제외하고서는 지금 당장 베드록에서 노바를 선택해 볼 수 있다.

기본적으로 현재 노바는 AWS의 베드록 위에서 돌아간다. 베드록은 기업에 제공되는 생성 AI 서비스 플랫폼이다. 베드록을 통해서 기업은 원하는 생성AI를 골라 쓰게 되어 있다. 기업들은 통상 여러 생성AI를 혼합해 쓰는 걸 선호하는데, 베드록은 이용자가 스위치를 켜고 끄듯, 여러 생성AI 중에서 필요한 것만 스위치를 켜서 쓸 수 있도록 서비스를 제공한다.

이미 여러 생성AI 모델이 있고, 투자한 앤트로픽 클로드나 이미 자체적으로 만든 생성AI 모델 ‘타이탄’이 있는데도 아마존이 노바를 내어놓은 것은, 새 모델이 다른 모델 대비 강력한 경쟁력을 갖고 있다고 판단했다는 뜻이 된다. 이날 AWS 측은 노바가 대다수의 동급(?) 경쟁 모델 대비 같거나 더 좋은 성능을 내고 있으며, 가격이 75% 가량 더 저렴하다고 주장했다. 아울러, 이 모델들이 베드록의 여러 기능과 깊이 통합되어 있기 때문에 기업이 원하는대로 파인튜닝 하는 것이 훨씬 수월하다고도 말했다.

글. 바이라인네트워크
<라스베이거스(미국)=남혜현 기자, smilla@byline.network>

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다