“중소형 AI언어모델, 우리가 최고” 엔씨, ‘바르코’ 성능 자신
엔씨소프트, 자체 AI 언어모델 ‘VARCO’ 공개
“한국어 특화 기존 언어모델보다 성능 앞서” 주장
KOBEST 데이터셋 이용한 벤치마크 테스트
하반기 언어모델 쏟아져, 진검승부 앞둬
“VARCO(바르코)는 현재까지 공개된 유사한 크기의 한국어 언어모델 대비 최고의 성능을 보여주고 있다. 앞으로 VARCO를 통해서 게임 콘텐츠 개발은 물론 다양한 도메인에서 새로운 가치와 경험을 제공하겠다”(이제희 엔씨소프트 최고연구책임자·CRO)
16일 엔씨소프트(대표 김택진, 엔씨)가 국내 게임사 최초로 자체 개발한 거대언어모델(LLM) ‘VARCO(바르코)’를 공개했다. ‘VARCO’는 “AI를 통해 당신의 독창성을 실현하세요(Via AI, Realize your Creativity and Originality)”라는 의미를 가진 엔씨(NC) 인공지능(AI) 언어모델의 통합 브랜드 명칭이다.
이번에 엔씨가 공개한 LLM은 중소형급이다. 매개변수(파라미터)는 각각 13억, 64억, 130억개다. 매개변수 규모가 작을수록, 구동이 쉽다는 장점이 있다. 엔씨는 매개변수가 130억개 이하인 모델은 구동을 위해 슈퍼컴퓨팅 능력이 필요 없고, 그래픽처리장치(GPU) 서버 1대에서도 가능해 특정 도메인에 특화한 맞춤형 모델을 만들기가 용이하다는 설명이다.
성능 비교 LLM 중엔 카카오브레인이 앞서 공개한 ‘코지피티(ko-gpt)’도 포함돼 있다. 국내 학계 최초의 LLM은 고려대의 ‘구름’과 오픈소스 모델 ‘코알파카(ChatKoAlpaca)’도 포함했다. <성능 비교 평가 페이지: 클릭 시 연결>
‘VARCO’ 브랜드로 운영되는 자체 언어모델(LLM)의 종류는 크게 ▲기초 모델(Foundation) ▲인스트럭션 모델(Instruction) ▲대화형 모델(Dialogue) ▲생성형 모델(Generative)로 나뉜다.
엔씨(NC) AI언어모델들은 국내 기업 최초로 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 배포된다. 아마존 세이지메이커 점프스타트는 기초 모델, 기본 제공 알고리즘과 사전 구축된 머신러닝 솔루션이 포함된 머신러닝 허브다. 아마존과 협업을 통해 이용자들은 전세계에서 어디서든 한달 간 무료로 ‘VARCO LLM’을 사용할 수 있다.
엔씨(NC)는 한국어와 영어 모두 사용할 수 있는 이중언어(bilingual) 모델도 이달 안에 선보일 예정이며, 이후 순차적으로 규모별 언어모델을 종류에 맞춰 공개할 계획이다.
이날 엔씨(NC)는 ‘VARCO LLM’ 기반 생성 AI 플랫폼 3종도 추가로 소개했다. ▲이미지 생성툴(VARCO Art) ▲텍스트 생성 및 관리툴(VARCO Text) ▲디지털휴먼 생성 및 편집, 운영툴(VARCO Human)이다. 생성 AI 플랫폼 3종은 ‘VARCO Studio’라는 명칭으로 서비스된다. ‘VARCO Studio’는 게임 개발에 필요한 기획과 아트 등의 분야에서 효율성을 끌어올리는 것이 목표다.
엔씨(NC)는 ‘VARCO LLM’을 기반으로 디지털 휴먼, 생성형 AI 플랫폼, 대화형 언어모델 등 다양한 AI 연구와 사업에 본격 나선다. 이외에도 교육, 금융, 바이오 분야 등의 파트너들과 협업을 통해 전문지식을 결합한 도메인 전용 모델도 선보일 계획이다. 상세 설명은 테크 블로그 ‘NC Research’ 웹페이지를 통해 확인할 수 있다.
글. 바이라인네트워크
<이대호 기자>ldhdd@byline.network