SKT, 7년 간 쌓은 LLM 기술로 한국어 특화 AI 확장
SK텔레콤(대표 유영상)은 과학기술정보통신부 추진 ‘독자 AI 파운데이션 모델’ 프로젝트 참여를 통해, 지난 2018년부터 지속한 한국어 특화 AI 기술 연구를 통한 AI 자립 노력을 구체적으로 실현할 수 있다는 기대를 24일 밝혔다.
SKT는 “한국어에 최적화된 초거대언어모델(LLM)을 독자 기술로 개발 및 운영하면서, 국내 AI 생태계의 기술 자립을 이끌어 왔다”며 “산업 전반에서 실질적으로 활용하기 위한 기반을 꾸준히 구축해 왔다”고 덧붙였다.
코버트를 시작으로 한국어 AI 기술을 쌓다
SKT는 지난 2019년 한국어 딥러닝 언어 모델 ‘코버트(KoBERT)’를 자체 개발해 공개하고, 고객센터 챗봇 등에 적용한 바 있다. 코버트는 한국어의 조사, 어순, 띄어쓰기 등 언어 구조를 반영해, 문맥 이해와 의미 분석에서 높은 정확도를 보였다.
지난 2020년에는 GPT-2를 한국어로 구현한 ‘코지피티2(KoGPT2)’를 공개하고, 같은 해 10월에는 뉴스 및 문서 요약에 특화된 ‘코바트(KoBART)’를 출시하는 등 자연어 처리 역량을 지속적으로 높여왔다.
SKT는 이러한 과정을 통해 한국어 기반 생성형 언어 모델의 초석을 다졌다. 회사는 코버트, 코지피티2, 코바트 등 주요 모델을 오픈소스로 공개하며 기술 경쟁력을 확보했다고 강조했다. 국내 AI 생태계 발전에 기여해 왔으며, 한국어 고유의 언어 구조와 표현 방식을 정밀하게 분석해 국내 언어 환경에 최적화된 AI 역량을 꾸준히 강화하고 있다.
일상 속의 AI, 고객과 함께 발전한 에이닷 엑스
SKT는 개발 기술을 상용 환경에 적용해 왔다. 지난 2022년에는 자체 개발 GPT-3 기반 한국어 특화 버전을 에이닷(A.) 서비스에 적용했다. 사용자 요청에 따라 일상 대화와 다양한 작업 수행이 가능하도록 구현했다. 감성 대화에 특화된 ‘에이닷 엑스 1’ 모델 추가로 정서적 교감 기능을 강화하기도 했다.
지난 2023년에는 복잡한 문맥 이해와 지식 기반 응답이 가능한 ‘에이닷 엑스 2’를 선보였다. 에이닷 엑스 2는 표준형과 경량형으로 구성했고, 대화 흐름을 보다 깊이 있게 파악하고 정보 제공 능력을 고도화했다.
지난해에는 새로운 아키텍처를 기반으로 추론 속도와 전반적인 성능을 향상시킨 ‘에이닷 엑스 3.0’을 선보였다. 에이닷 엑스 3.0은 340억(34B) 파라미터의 표준형과 70억(7B) 파라미터의 경량형으로 구성했다. 같은 해 4월 에이닷 전화의 통화 요약 기능에 적용하고, 8월에는 AI 에이전트 기능에 적용해 상용 서비스에 활용했다.
SKT는 에이닷 엑스 1부터 3.0까지의 모든 모델을 구조 설계부터 데이터 수집, 학습까지 모든 과정을 직접 수행한 ‘프롬 스크래치’ 방식으로 개발했다. 대규모 한국어 데이터를 기반으로, 단순한 질의응답을 넘어 사용자 의도와 맥락을 파악해 보다 논리적이고 유용한 대화가 가능하다.
프롬 스크래치와 CPT 방식 ‘투 트랙 전략’… AI 포트폴리오 확장
올해 7월 공개한 ‘에이닷 엑스 4.0’은 외부 지식 기반 추론 기능을 강화했다. 대규모 사전 학습(CPT) 방식으로 학습해, ▲데이터 보안 ▲로컬 운영 가능성 ▲한국어 처리 효율성 등에서 강점을 갖췄다. 에이닷 엑스 4.0은 현재 에이닷 통화 요약 등 실제 서비스에 적용해 정확성과 응답 신뢰도를 높이고 있다.
SKT는 비슷한 시기에 70억(7B) 및 340억(34B) 파라미터 규모의 두 가지 ‘에이닷 엑스 3.1’ 모델을 프롬 스크래치 방식으로 개발해 공개했다. 두 모델 모두 추론 모델로의 확장 가능성을 고려해 코드와 수학 성능을 높였다.
SKT는 독자 기술을 기반으로 한 에이닷 엑스 3 계열의 프롬 스크래치 모델과 CPT 방식의 외부 지식 학습을 적용한 에이닷 엑스 4 계열의 대규모 모델을 병행 개발하는 ‘투 트랙 전략’을 추진한다. 다양한 서비스 환경과 용도에 최적화된 AI 모델 포트폴리오를 지속적으로 확장해 나가고 있다.
SKT 측은 “앞으로도 한국어에 최적화된 LLM 기술을 지속적으로 고도화해 나가며, 초거대 AI의 산업화와 일상화를 선도할 것”이라며 “국내 AI 생태계 활성화를 위한 기술 공유와 협력을 확대해 나갈 계획”이라고 밝혔다.
글. 바이라인네트워크
<최가람 기자> ggchoi@byline.network