초거대 AI를 위한 KT의 세 가지 전략

“기업 고객에 컨설팅과 서비스를 잘 해온 조직은 자사 거대언어모델(Large Language Model, LLM)을 안 가지고 있는 경우가 있고, 자사 LLM을 가진 경우에는 반대로 B2B 노하우나 역량이 부족할 수 있다. KT는 (양쪽을 모두 갖고 있어서) 종합적으로 가장 나은 솔루션과 품질의 LLM을 기업 고객에 제공할 수 있는 역량이 있다고 확신한다”

KT가 자체 개발한 초거대언어모델(LLM) AI ‘믿음(Mi:dm)’을 일반에 공개했다. 핵심은 ‘돈 되는 AI’다. 초거대 AI를 기업 고객에게 잘 팔아서 수익을 내겠다는 목표를 세웠다. KT는 이미 자체 콜센터인 100번이나 기가지니 등에 믿음을 적용해 써왔다. 이제는 자신들이 만든 초거대 AI가 기업 고객에게 팔 만큼, 수준이 올라왔다고 판단한 것으로 보인다.

최준기 KT AI/빅데이터 사업본부장은 31일 온라인으로 개최한 ‘믿음’ 공개 간담회에서 “기업이 라지 AI를 쓸 때 ▴내 데이터로 만든 나만의 모델을 갖고 싶다 ▴만드는 과정은 쉽고 쓰는 것 역시 편하면 좋겠다 ▴비용은 저렴하길 원한다는 요구가 있더라”면서 “기업 고객이 라지 AI에 느끼는 불편(pain point)을 해소하는 솔루션을 해결하려 한다”고 강조했다.

[참고기사: KT는 왜 초거대 AI를 만드나]

◼ 믿음, 어떤 특징 가졌나

기본적으로 믿음은 파라미터 수와 핵심 임무, 그리고 추론 인프라 등에 따라 ‘베이직’ ‘스탠다드’ ‘프리미엄’ ‘엑스퍼트’ 등 네 가지 모델로 나온다. 베이직 믿음의 경우 파라미터 수가 수억개 수준으로, 비교적 단순한 이해 중심의 임무를 수행하는 대신 가격이 저렴하다. 반대로, 가장 비용이 비싼 엑스퍼트 모델의 경우 수천억개(이날 간담회에서는 2000억개 까지 이야기 됐다) 수준의 파라미터 수를 갖춰 고성능 멀티 태스킹을 수행할 수 있는 정도의 성능을 제공한다.

모델을 여럿으로 나눈 것은 기업마다 원하는 수준의 라지 AI가 다르기 때문이다. 예컨대 어떤 곳은 간단한 클릭 만으로 모델을 선택, 학습하길 바랄 것이고 또 어떤 곳은 보다 복잡한 수준의 기술 구현을 원할 수 있다. KT는 이날 모든 기업에게 믿음의 파운데이션 모델(Foundation Model, 초거대 AI 핵심 기반 모델)을 개방하고, ‘KT 믿음 스튜디오(KT Mi:dm Studio)’라는 전용 포털을 연다고 밝혔다. 어떤 기업이나 고객 상관 없이 누구나 쉽게 라지 AI를 학습시키고 배포, 운영할 수 있게 한다는 목적이다.

KT 측은 “초거대 AI를 사용하고 싶지만 수십억에서 수천억에 달하는 파라미터 모델을 직접 만들 여력이 없는 대다수 기업들의 경우, 기존에 공개된 파운데이션 모델을 튜닝해 활용하는 방법이 가능하지만 데이터 자주권(Sovereign AI) 차원에서 빅테크에 데이터가 종속될 수 있다는 보안 우려가 있고, 무엇보다 기존 상업용 파운데이션 모델은 풀 파인 튜닝(FFT)을 제공하지 못한다는 한계가 있었다”고 지적하면서 “조(兆)단위 데이터의 사전 학습을 완료한 자체 파운데이션 모델 믿음을 개방해 LLM(거대언어모델)의 B2B 사업화를 가속하고, 궁극적으로 기업들이 원하는 AI 사업 모델과 응용 서비스의 폭발적 확산을 이끌어낸다는 계획”이라고 강조했다.

KT가 강조한 믿음의 또 다른 특징은 그간 챗GPT와 같은 생성형 AI 모델의 난점으로 지적되어 왔던 환각현상(할루시네이션, 거짓 정보를 사실처럼 제공하는 것)을 일부 해결할 수 있도록 검색과 추론, 답변의 모든 단계에서 신뢰성을 높이도록 ‘신뢰 패키지’를 개발해 적용했다는 점이다.

이 패키지는

♦다큐먼트 AI(Document AI)는 도식화된 복잡한 문서도 모델이 정확히 이해할 수 있도록 변환하는 기술
♦서치 AI(Search AI)는 목표 도메인과 문서에 최적화된 최신 정보를 찾아내는 딥러닝 기술
♦팩트가드 AI(FactGuard AI)는 원문에 근거한 응답만 생성하도록 강화학습을 적용

으로 꾸려진다. KT 측은 “생성형 AI의 가장 큰 문제점인 할루시네이션 현상을 일반 생성형 AI 서비스 대비 최대 70% 가까이 줄일 수 있다”고 신뢰패키지를 설명했다.

KT 측에 따르면 ‘믿음’의 4종 모델 중 외부에 완전히 개방하는 70억 파라미터 규모의 경량 모델은 한국어 LLM 평가 리더보드인 ‘Open Ko LLM’에서 최상위를 기록하기도 했다. KT 측은 “‘Open Ko-LLM’은 역사 왜곡이나 형태소 오류, 환각, 혐오 표현 등 광범위한 항목을 평가하고 AI가 주어진 조건에 대해 생성해 낸 결과물이 한국어 사용자의 일반 상식에 부합하는지를 평가한다”면서 “여기서 최상위를 기록한 KT 믿음은 신뢰성과 성능 면에서 공식적으로 인정을 받게 된 것”이라고 강조했다.

비용 절감과 관련해서는 기존 대비 약 27% 가까운 GPU 학습 비용 절감이 가능한 KT Cloud의 HAC(Hyperscale AI Computing) 서비스, 추론 비용을 기존 대비 50% 절감한 리벨리온의 NPU 인프라 등 ‘AI 풀스택’을 효율적인 AI 개발 환경을 위한 맞춤형 통합 패키지로 함께 제공할 예정이다.

◼ 세 가지 전략- B2B, 오픈 생태계, 돈 되는 사업 케이스 발굴

최준기 사업 본부장은 믿음의 세 가지 사업 전략을 “▴B2B 시장에 집중하겠다 ▴믿음 모델을 개방해 라지 AI를 대중화하는 시대를 열겠다 ▴라지 AI를 가지로 할 수 있는 새로운 수익화 모델과 사업 혁신 케이스를 지속 발굴하겠다”라고 꼽았다.

이 말은 기업전용 LLM 사업화, 새로운 AI 혁신 사업 발굴 등으로 돈을 버는 방법을 찾겠다는 뜻이다. 이후 글로벌, 제조, 금융, 공공, 교육의 5대 영역으로 초거대 AI 사업 영역을 확장하고, 스타트업 개방 생태계를 통해 초거대 AI 기반 비즈니스 혁신에 나선다는 계획도 공개했다.

KT는 기업전용 LLM 사업화에 ‘업스테이지’, Math-GPT를 비롯한 교육 영역에선 ‘콴다’와 ‘에누마’, 기업용 업무 개인비서 영역에는 ‘비아이매트릭스’ 등 다양한 AI 스타트업들과 ‘믿음’을 활용한 AI 사업모델을 공동으로 개발하고, 국내 및 글로벌 시장을 공략한다. 업스테이지와 협력한 모델은 이르면 오는 11월에 공개될 예정이다.

KT 측은 믿음 출시 이전부터 금융권, 지자체, 기업솔루션 등 100개 이상의 기업과 기관과 사전 논의를 진행 중이라고 밝혔다. 이날 설명회에선 KT가 기업은행에 믿음을 적용해 만든 전문 상품지식 제공 서비스를 선보였다. 지난 22일엔 태국 자스민 그룹과 함께 믿음을 활용한 태국어 대형언어모델 구축 및 동남아 공동 사업화 협력 추진을 밝히면서 글로벌 시장 확장 가능성을 타진하기도 했다.

KT는 AICC와 지니TV, AI통화비서 등 기존 AI 사업들의 인공지능을 믿음으로 고도화하고, KT의 무선서비스, IVI, 로봇 등에도 초거대 AI를 적용한 사업화를 계획하고 있다고 설명했다. 기존 서비스가 룰베이스(Rule Based) 모델을 통해 정해진 답변만을 제공하는 한계가 있었지만, 앞으로는 생성형 AI의 창의적 답변에 신뢰성 있는 정보를 더해 제공할 수 있을 것이라고 의의를 강조했다.

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다