알리바바클라우드, 오픈소스 LLM 공개…음성인식 강화 모델도 선봬

알리바바클라우드가 자체 개발한 거대언어모델(LLM) ‘통이치엔원(Tongyi Qianwen)’의 새로운 버전인 ‘큐원-72B(Qwen-72B)’와 ‘큐원-1.8B(Qwen-1.8B)’를 오픈소스로 5일 공개했다. 음성인식 성능을 높인 새로운 모델도 소개했다.

이번 모델 공개는 알리바바의 인공지능(AI) 모델 커뮤니티인 ‘모델스코프(ModelScope)’와 개발자 협업 플랫폼 ‘허깅페이스(Hugging Face)’에서 이뤄졌다.

큐원-72B는 720억개 파라미터를 갖춘 LLM이다. 10가지 벤치마크 부문에서 주요 오픈소스 모델들의 벤치마크 결과를 뛰어 넘었다는 게 회사의 설명이다. 특히 대규모 다중작업 언어이해, 코드 개발, 수학 문제 해결 등에서 높은 성능을 보였다. 상업적 용도라도 월간 활성 사용자 수가 1억명 미만인 기업은 무료로 사용할 수 있다.

또한, 알리바바클라우드는 엣지에서 실행할 수 있는 18억개의 파라미터로 구성된 LLM ‘큐원-1.8B’도 오픈소스화 했다. 경량 버전인 큐원-1.8는 컴퓨터 리소스가 제한된 모바일 같은 엔드 장치에서도 원활한 추론이 가능하다. 큐원-1.8B는 현재 연구 목적으로만 활용할 수 있다.

‘큐원-72B’는 10가지 벤치마크에서 다른 주요 오픈소스 모델들보다 뛰어난 성능을 보인다는 게 회사의 설명이다. (자료=알리바바클라우드)

알리바바클라우드는 이 밖에도 오디오 이해 성능을 강화한 모델인 ‘큐원-오디오(Qwen-Audio)’와 이를 기반으로 한 대화형 버전인 ‘큐원-오디오-챗(Qwen-Audio-Chat)’도 공개했다.

큐원-오디오는 사람의 음성, 자연음, 음악 등 다양한 형식의 텍스트와 오디오 투입 자료를 해석해 텍스트로 출력할 수 있다. 특히 큐원-오디오-챗은 오디오 기반 질의응답을 지원하며 사람의 감정과 톤을 감지하는 능력도 있다고 알리바바클라우드는 설명했다.

징런 저우(Jingren Zhou) 알리바바클라우드 최고기술책임자(CTO)는 “오픈소스 생태계를 구축하는 것은 LLM과 AI 애플리케이션 개발에 매우 핵심적인 일”이라며 “알리바바 클라우드는 가장 개방적인 클라우드로서 모든 사람이 생성AI 역량을 활용할 수 있도록 하는 것이 목표다. 이를 위해 자사의 최첨단 기술을 공유하고 파트너들과 함께 오픈소스 커뮤니티의 발전을 촉진해 나갈 것”이고 밝혔다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network