알리바바클라우드, 70억개 파라미터 갖춘 LLM 오픈소스로 공개

알리바바클라우드가 70억개의 파라미터를 갖춘 초거대언어모델(LLM) ‘Qwen-7B’와 ‘Qwen-7B-Chat’을 오픈소스로 공개했다.

알리바바클라우드에 따르면 Qwen-7B는 2조개 이상 토큰을 사전 학습했다. 중국어를 비롯해 영어, 기타 다국어 자료, 코드, 수학 등 전문 지식도 학습했다. Qwen-7B은 대규모 다중작업 언어이해(MMLU) 벤치마크에서 56.7점을 기록해 메타의 라마(LLaMA) 보다도 높은 수치를 기록했다.

Qwen-7B와 Qwen-7B-Chat은 클라우드와 온프레미스 모두에서 배포된다. 특히 알리바바클라우드는 AI 기술 민주화를 위한 노력의 일환으로 오픈소스로 개방할 예정이라고 밝혔다.

월간 활성 이용자(MAU) 수가 1억명 이하인 기업들은 해당 모델을 상업적 용도로 무상 사용할 수 있고, 1억명 이상의 사용자를 보유한 경우 알리바바클라우드에 라이선스를 요청해 사용해야 한다.

징런 저우(Jingren Zhou) 알리바바클라우드 최고기술책임자(CTO)는 “독자적인 LLM을 오픈소스로 공개해 많은 개발자와 중소기업이 생성AI의 이점을 누릴 수 있도록 지원한다”며 “개방적인 접근 방식으로 집단지성을 발휘해 오픈소스 커뮤니티 활성화에 기여할 수 있기를 희망한다”고 밝혔다.

한편, 알리바바클라우드는 지난달 개발자와 중소기업의 창의적 이미지 표현을 지원하는 AI 이미지 생성기통이 완샹(Tongyi Wanxiang)’을 공개했다. 언어시각음성 영역에서 복잡하고 전문화된 AI 작업을 수행하는 데 활용할 수 있는 다용도 프레임워크 ‘모델스코프GPT(ModelScopeGPT)’를 선보이기도 했다

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다