크래프톤, 자체 AI 모델 브랜드 ‘라온’ 출범…4종 공개
크래프톤은 2일 인공지능(AI) 모델 브랜드 ‘라온(Raon)’의 첫 모델 4종을 글로벌 오픈소스 플랫폼 허깅페이스에 공개했다고 밝혔다.
공개된 모델은 ▲라온-스피치(Raon-Speech) ▲라온-스피치챗(Raon-SpeechChat) ▲라온-오픈TTS(Raon-OpenTTS) ▲라온-비전인코더(Raon-VisionEncoder) 등 4종이다. 텍스트를 넘어 음성과 시각 정보를 아우르는 멀티모달(Multimodal) AI 라인업이다.
라온-스피치는 90억(9B) 파라미터 규모의 음성 언어 모델이다. 자체 종합 평가 결과 파라미터 100억개 이하급 오픈소스 음성 언어 모델 중 영어와 한국어 모두 글로벌 1위 성능을 기록했다.
라온-스피치챗은 국내 최초로 실시간 양방향 통신(Full-duplex) 기술을 적용한 음성 언어 모델이다. 대화 도중 자연스럽게 끼어들거나 맞장구가 가능하다. 맞장구, 끼어들기 처리, 응답 지연 시간 등 주요 13개 태스크 평균 순위 기준 글로벌 최상위권 성능을 달성했다.
라온-오픈TTS는 공개된 음성 데이터만으로 학습한 텍스트-음성 변환 모델이다. 전체 학습 데이터를 공개해 누구나 동일한 환경에서 학습을 재현할 수 있도록 개방성을 높였다. 사람이 직접 비교하는 블라인드 청취 평가에서 비공개 데이터로 학습한 기존 글로벌 연구용 모델들과 비교해 최상위 수준의 성능을 보였다.
라온-비전인코더는 이미지를 인공지능이 이해 가능한 정보로 바꿔주는 비전 인코더 모델이다. 공개 데이터만 활용해 처음부터 자체 학습했으며, 일부 시각 인식 태스크에서 구글의 대표 비전 인코더 모델(SigLIP2)을 상회했다.
이강욱 크래프톤 최고AI책임자(CAIO)는 “이번 라온 모델 시리즈 공개는 AI 기술 역량을 축적해 나가는 과정의 중요한 이정표”라며 “대규모 학습 데이터와 핵심 모델을 오픈소스로 공유해 연구자와 개발자들이 자유롭게 활용할 수 있도록 하고, 멀티모달 기술 발전과 국내 AI 생태계의 성장에 기여하기를 기대한다”고 전했다.
한편 크래프톤은 파운데이션 모델 설계부터 AI 에이전트 개발, 게임 적용까지 전 주기에 걸친 자체 밸류체인을 구축하고 있다. 지난해 개인용 AI 비서 ‘키라(KIRA)’를 선보인 데 이어, 지난달 AI 에이전트 성능을 개선하는 ‘터미누스-키라(Terminus-KIRA)’를 오픈소스로 공개했다.
글. 바이라인네트워크
<이슬찬 기자>seulbae@byline.network



