“라마, GPT 넘었다”…데이터브릭스, 오픈소스 LLM ‘DBRX’ 공개

데이터브릭스가 오픈소스 대형언어모델(LLM) ‘DBRX ’를 출시했다. 기존 오픈소스 모델을 비롯해 오픈AI의 GPT 모델을 뛰어넘는 성능으로 기업의 맞춤형 생성 인공지능(AI) 제작을 지원하겠다는 게 회사의 설명이다.

28일 데이터브릭스는 DBRX를 공개하고 “DBRX는 최신 업계 벤치마크에서 기존 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는다”고 밝혔다.

데이터브릭스에 따르면 DBRX는 표준 업계 벤치마크에서 메타의 라마(LLaMa)2 70B, 미스트랄(Mistral) 8x7B와 같은 기존 오픈소스 LLM보다 뛰어난 성능을 제공한다. DBRX는 또 일부 벤치마크에서 GPT-3.5보다 높은 성능을 냈다. 언어 이해(MMLU), 프로그래밍(HumanEval) 및 수학(GSM8K) 벤치마크에서 GPT 3.5보다 뛰어난 성능을 보이는 것으로 확인됐다.

(자료=데이터브릭스)

데이터브릭스에 따르면 DBRX는 전문가 혼합(MoE) 아키텍처로 DBRX를 최적화했다. 이로 인해 DBRX는 다른 주요 LLM 대비 최대 2배 높은 컴퓨팅 효율을 갖췄다는 게 데이터브릭스의 설명이다.

DBRX는 깃허브(GitHub)와 허깅 페이스(Hugging Face)를 통해 연구와 상업적 용도로 무료 사용이 가능하다. 아마존웹서비스(AWS)와 구글클라우드, 마이크로소프트 애저(Azure)에서도 직접 사용할 수 있다.

알리 고드시(Ali Ghodsi) 데이터브릭스 공동창립자 겸 최고경영자는 “데이터브릭스는 데이터와 AI를 보편화하겠다는 사명 아래 기업의 데이터를 이해하고 이를 활용해 자체적인 AI 시스템을 구축할 수 있도록 지원하고 있다”며 이번 DBRX 출시는 이러한 노력의 결과물”이라고 밝혔다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다