알리바바클라우드, 자체 개발한 새로운 LLM ‘통이치엔원 2.0’ 공개

알리바바클라우드는 1일(현지 시간) 중국 항저우에서 개최한 연례 플래그십 기술 행사인 압사라 컨퍼런스(Apsara Conference)에서 자체 개바한 최신 대규모언어모델(LLM) ‘통이치엔원(Tongyi Qianwen) 2.0’을 공개했다. 지난 4월 통이치엔원을 처음 공개한 뒤 반년 만에 베일을 벗은 새 버전이다.

알리바바클라우드는 파라미터 수가 수천억개 수준이라고 언급했다. 언어 이해, 산술 문제 해결, 질문 답변 등 다양한 영역의 벤치마크에서 타사의 LLM 성능을 능가한다는 게 회사의 설명이다. 특히 복잡한 지시 이해나 카피라이팅, 추론, 암기, 환각(hallucination) 방지 등에서 높은 성능을 보인다.  일반 사용자는 웹사이트와 모바일 애플리케이션을 통해 이용할 수 있으며, 개발자는 응용프로그래밍인터페이스(API) 방식으로도 적용할 수 있다.

알리바바클라우드는 언어 이해 종합 능력(MMLU), 산술 문제 해결(GSM8K), 질문 답변(ARC-C), 다중 작업 언어 이해(BBH), 수학 언어 문제 해결 등의 벤치마크에서 통이치엔원2.0이 일부 주요 LLM을 능가했다고 밝혔다. (자료=알리바바클라우드)

알리바바클라우드는 이 밖에도 새로운 AI 모델 트레이닝 플랫폼과 클라우드 제품군 등을 공개했다. 급증하는 생성 AI 수요에 부응하기 위해 AI 모델 개발과 애플리케이션 구축 과정을 줄여주는 올인원 AI 모델 구축 플랫폼인 ‘GenAI’ 서비스 플랫폼을 도입했다. 알리바바클라우드 측은 “이 플랫폼은 데이터 관리, 모델 배포와 평가, 신속한 엔지니어링을 위한 포괄적인 도구 모음을 제공해 기업별 AI 모델을 더 쉽게 개발할 수 있도록 지원한다”고 설했다.

LLM 모델 학습과 추론 효율성을 높이는 AI 플랫폼(PAI) 또한 업그레이드했다.  맞춤형 생성 AI 애플리케이션 구축을 지원하기 위해 클라우드 네이티브 데이터베이스인 ‘폴라DB(PolarDB)’, 클라우드 네이티브 데이터웨어하우스 ‘애널리틱DB(AnalyticDB)’, 클라우드 네이티브 다중 모델 데이터베이스 ‘린돔(Lindorm)’을 포함한 모든 데이터베이스 솔루션을 강화했다.

또한 지능형 데이터 분석 어시스턴트인 데이터 관리 서비스(DMS) 데이터 코파일럿을 포함한 LLM 기반 데이터베이스 에코시스템 툴을 도입했다.

컨테이너 서비스와 클라우드 컴퓨팅 리소스를 통합하는 서버리스 솔루션인 ‘알리바바클라우드 컨테이너 컴퓨트 서비스(ACS)’도 공개했다. ACS를 통해 기업과 개발자는 컨테이너 중심 관리 소프트웨어인 쿠버네티스(Kubernetes)의 리소스를 보다 비용 효율적이고 사용자 친화적인 방식으로 배포할 수 있다.

한편 알리바바클라우드는 넓은 AI 생태계를 위해 오픈소스 AI 커뮤니티 ‘모델스코프(ModelScope)’를 비롯한 오픈소스 커뮤니티에 대한 지원을 약속했다. 올해 말에는 720억개 파라미터 버전의 통이치엔원을 오픈소스화할 계획이다.

조 차이(Joe Tsai) 알리바바 그룹 회장은 “현재 중국 기술기업의 80%와 대형 모델 기업의 절반이 알리바바클라우드를 사용한다”며 “우리는 AI 시대에 가장 개방적인 클라우드가 되는 것을 목표로, 특히 중소기업을 비롯한 다양한 고객들이 클라우드를 통해 더 쉽고 경제적으로 AI를 개발하고 사용해 생산성을 높일 수 있기를 바란다”고 밝혔다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다