LG CNS, 코히어와 추론형 LLM 개발

LG CNS(대표 현신균)는 코히어와 협력해 1110억개 매개변수를 갖춘 추론형 대형언어모델(LLM)을 개발했다고 10일 밝혔다.

해당 LLM은 한국어, 영어 등 23개 언어를 지원하며, 추론 등 핵심 성능에서 글로벌 상위 모델을 뛰어넘는 결과를 보였다. LG CNS는 지난 5월 코히어와 70억개의 매개변수로 구성된 한국어 특화 경량 모델을 출시했었다.

LG CNS는 금융, 공공 등 민감한 데이터를 다루는 국내 고객의 비즈니스 혁신을 위해 추론형 LLM을 개발했다. 추론형 LLM은 AI가 복잡한 문제에 대해 여러 변수를 고려한 논리적인 해답을 도출한다.

LG CNS는 코히어와 공동 개발한 초대형·경량형 2종의 LLM과 LG AI연구원의 ‘엑사원’ 등 LLM 라인업으로 기업의 에이전틱 AI 서비스 수요를 공략한다.

LG CNS는 LLM 개발을 위해 코히어의 기업용 LLM인 ‘커맨드’ 모델에 LG CNS의 IT전문성과 AI 기술력을 결합했다. 코히어 커맨드 모델은 캐나다 최대은행 RBC 등에서 온프레미스와 클라우드 방식으로 사용되고 있다.

LG CNS는 LLM을 온프레미스 방식으로 제공해 고객사들이 민감한 데이터의 외부 유출 없이도 자체 인프라 내에서 안전하게 처리할 수 있도록 할 계획이다. 이번에 선보인 LLM은 모델 압축 기술을 통해 2장의 GPU만으로 구동 가능하다.

이 LLM은 한국어와 영어에서 우수한 추론 능력을 보였다. 양사의 자체 테스트 결과, 추론 능력 검증 대표 벤치마크 테스트인 ▲Math500과 ▲AIME 2024 영역에서 한국어, 영어 모두 GPT-4o, GPT4.1, 클로드 3.7 소넷 등 글로벌 LLM보다 높은 점수를 기록했다.

‘Math500’은 대학 수준 이상의 수학문제 500개로 구성된 테스트로 AI가 얼마나 논리적으로 문제를 풀 수 있는지를 검증하며, ‘AIME 2024’는 미국의 수학 경시대회 문제를 활용해 AI의 수학적 추론 능력을 평가한다.

양사의 LLM은 한국어·영어·일본어·중국어는 물론 히브리어·페르시아어 등 소수 언어까지 총 23개 언어를 지원한다. 이 중 한국어 평가 테스트인 ▲KMMLU ▲KO-IFEval에서 글로벌 LLM 대비 최고점을 달성했다. 매개변수 규모 2배 이상인 큐원3보다 우수한 성능을 보였다.

‘KMMLU’는 한국어 이해 능력을 종합적으로 평가하는 지표다. 인문학·사회과학·응용과학 등 45가지 분야 전문가 수준의 지식을 담은 3만5천여개의 객관식 문제로 구성됏다. ‘KO-IFEval’는 구글과 예일대학교가 만든 ‘IFEval’을 한국어로 번역한 벤치마크 테스트로 LLM이 대화 내용을 얼마나 잘 이해하고 지시사항을 잘 따르는지를 평가한다. LG CNS는 코히어와의 지속적인 협력을 이어가며 LLM의 성능을 고도화해나갈 계획이다.

LG CNS AI클라우드사업부장 김태훈 전무는 “차별화된 AI 역량과 경쟁력을 바탕으로 고객의 비즈니스에 특화된 에이전틱 AI 서비스를 제공하고, 고객의 AX를 선도하는 최고의 파트너로 자리매김할 것”이라고 밝혔다.

글. 바이라인네트워크
<김우용 기자>yong2@byline.network