알리바바클라우드, AI 활용한 이미지 생성 모델 ‘통이 완샹’ 공개

알리바바클라우드는 최근 ‘세계 AI 컨퍼런스 2023’에서 최신 AI 이미지 생성 모델인 ‘통이 완샹(Tonyi Wanxiang)’을 공개했다고 11일 밝혔다.

완샹은 ‘수만 개의 이미지’라는 뜻을 지닌 중국어다. 현재 중국 내 기업 대상으로 베타 테스트가 진행 중인 통이 완샹은 중국어나 영어 텍스트 명령에 따라 수채화, 유화, 중국화, 애니메이션, 스케치, 평면 일러스트레이션, 3D 만화까지 다양한 스타일의 이미지를 생성할 수 있다.

통이 완샹은 알리바바클라우드가 보유한 지식 구조화, 시각 AI, 자연어 처리(NLP) 분야 기술을 기반으로 다국어 자료를 활용해 학습을 강화하고 있다. 어떤 이미지든 유사한 스타일의 새로운 이미지로 변환해주고, 스타일 전송(style transfer) 기능을 통해 원본의 내용을 유지하면서도 다른 이미지 스타일을 입힐 수 있다는 게 알리바바클라우드의 설명이다.

알리바바클라우드는 또한 모델스코프(ModelScope)의 다양한 AI 모델을 활용해 언어, 시각, 음성 영역에서 복잡하고 전문적인 AI 작업을 수행할 수 있도록 지원하는 ‘모델스코프GPT(ModelScopeGPT)’도 발표했다. 모델스코프GPT는 대규모 언어 모델(LLM)을 사용해 오픈소스 커뮤니티의 분야별 전문 모델을 연결해주는 프레임워크다.

앞서 알리바바클라우드가 지난해 공개한 오픈소스 서비스형모델(MaaS) 플랫폼 모델스코프는 900개 이상의 AI 모델을 제공하는 것이 특징이다. 기업들은 이를 바탕으로 한 모델스코프GPT를 무료로 활용해 다국어 동영상 제작 등 정교한 AI 작업을 수행할 수 있다.

징런 저우(Jingren Zhou) 알리바바 라우드 인텔리전스 최고기술책임자(CTO)는 “통이 완샹은 고급 생성형 AI 모델을 추구하는 알리바바 클라우드의 중요한 이정표”라며 “고품질 생성 AI 이미지에 대한 접근성을 높이고 전자상거래, 게임, 디자인, 광고 등 다양한 분야에서 혁신적 AI 아트와 창의적 표현의 개발을 가능하게 할 것”이라고 말했다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network