똑똑해질 ‘클로바X’를 둘러싼 관전 포인트
네이버의 새로운 생성 인공지능(AI) 모델 ‘하이퍼클로바X’가 모습을 드러낸 지 1주일. 이를 기반으로 한 챗봇 ‘클로바X’는 아직도 대기자를 받을 만큼 관심이 식지 않는 모습이다. 강점으로 ‘가장 우수한 한국어’ 능력을 내세운 클로바X는 내∙외부의 다양한 서비스 응용프로그래밍인터페이스(API)를 연결하는 시스템 ‘스킬(skill)’을 통해 확장성까지 노린다.
뭐니뭐니해도 생성AI 챗봇의 핵심은 다양한 학습데이터를 통해 정확한 답변을 내는 능력이다. 클로바X는 어떤 곳에서 어떻게 배우고 어떻게 답변을 내놓을까. 내 말을 그대로 네이버가 들여다보는 것은 아닐까. 향후 추가 기능은 어떻게 구현할까. 관전 포인트를 짚어봤다.
1.. GPT-3.5와 GPT-4 사이?
네이버는 클로바X의 엔진인 하이퍼클로바X의 구체적인 파라미터 수나 명확한 학습 데이터 소스를 밝히지 않았다. 대신 ‘팀 네이버 콘퍼런스 단 23’의 질의응답 시간에서 성능에 대한 힌트를 일부 얻을 수 있다.
GPT 모델과의 우위 여부를 묻는 질문에 GPT-3.5에 비해서는 75%의 승률을 기록했다는 게 네이버의 답변이었다. 하지만 최신 LLM인 GPT-4에 비해서는 확실한 우위를 점하지 못한 것으로 보인다.
성낙호 네이버클라우드 기술 총괄은 하이퍼클로바X를 공개한 ‘팀 네이버 콘퍼런스 단 23’ 질의응답 세션에서 “GPT-4 같은 경우는 굉장히 높은 수준의 성능을 보이지만 굉장히 고비용 구조여서 지속가능하지 않다”며 “모든 영역에 많은 양의 데이터를 들이부어 그 정도의 AI를 만들어 유지하는 건 쉽지 않다”고 말했다.
GPT-4와의 비교에서는 한 수 접는 기류가 관측된다. 언급만 종합하면 GPT-3.5와 GPT-4 사이의 성능을 보이는 것으로 추정된다.
2. 그냥 넘기기에는 중요한 선택약관
클로바X를 더 똑똑하게 만들 수 있는 건 역설적으로 사용자다. 클로바X 웹사이트에 로그인하면 약관 선택창이 뜬다. 쉽게 넘어갈 수 있는 부분이지만 사실 이게 클로바X를 더 똑똑하게 만드는 핵심이다. 기본 체크박스는 해제로 되어 있지만, 추후 설정에서 동의로 바꿀 수 있다.
해당 약관은 네이버가 이용자의 대화 데이터 등을 수집한다고 명시했다. 이용 로그와 입력·결과값을 수집해 서비스 품질 개선 등에 활용하는 게 골자다. 사용자가 입력한 프롬프트에 담긴 정보를 다시 AI 학습에 활용한다는 뜻이다. 네이버 관계자는 “서비스를 고도화하기 위해 클로바X를 추가적으로 학습하는 것으로 보면 된다”고 말했다.
반면 이 부분이 클로바X의 약점이 될 수도 있다. 약관 동의의 벽을 넘어야 한다. AI 모델 학습에서 다량의 데이터 확보는 기본이다. 사용자들이 약관에 동의하지 않으면 필연적으로 학습할 수 있는 요소는 줄어든다.
보안에 대한 우려도 있다. 해당 선택 약관에 동의했을 때 네이버가 사용자의 이용 내역을 속속들이 들여다볼 수 있다는 우려다. 하지만 이 같은 우려를 네이버는 일축했다.
클로바X는 네이버 로그인 후 이용하는 형태인데, 로그인 주체를 비식별화한다는 게 네이버의 설명이다. 아이디를 비식별화해 질문의 주체를 가리는 형태다. 또한 사용자 입력값의 경우에도 전화번호나 계좌번호 등 개인정보와 관련한 부분은 마스킹 처리해 비식별화한다고 설명했다.
3. 핵심 무기 ‘스킬’ 시스템
가장 관심을 끄는 건 스킬 시스템이다. 모양새 자체는 챗GPT와 구글의 ‘바드(Bard)’와 다르지 않은 상황에서 기능적으로 가장 도드라지는 강점이다. 클로바X에 다른 기업의 API를 연결해 해당 기업의 도메인에 특화한 답변을 받는 기능이다. 현재 초기 스킬 파트너로는 폴라리스오피스를 비롯해 컬리, 캐치테이블, 야놀자, 쏘카, 배달의민족 등이 논의를 이어가고 있다.
지금 쓸 수 있는 스킬은 네이버 여행과 네이버 쇼핑이다. 결과로도 쉽게 스킬의 장점을 확인할 수 있는데 같은 프롬프트를 쳐도 다른 모습의 결과를 낸다.
일례로 부산 근처의 호텔 소개를 요청하자 일반 답변 버전에서는 유명 호텔 위주 추천이 가볍게 이뤄졌지만 네이버 여행 스킬을 활성화하니 더 자세한 답변이 나온다. 동선을 비롯해 근처 명소까지 짚어주고, 이곳을 예약할 수 있는 네이버 링크도 함께 제시한다. 테마에 맞춰 더 자세한 정보를 얻고 구매까지 쉽게 할 수 있다.

현재 스킬 파트너가 늘어나는 만큼에 따라 클로바X의 쓰임새는 고도화될 수 있다. 네이버는 제휴처를 계속 확대해 나갈 예정이다. 서비스를 운영하는 네이버 입장에서도 해당 기업의 데이터를 가져와 적용하면 돼 모델 학습에 드는 공수가 줄어든다. 기업이 특화 AI 모델이 만들 수도 있다. 새로운 광고 상품에선 검색 결과 중간에 새로운 버튼을 볼 수 있다. 이 버튼을 누르면 하이퍼클로바X를 활용해 기업이 만든 특화 AI모델이 답변을 이어간다. 일종의 특화 생성AI가 무수히 만들어질 수 있는 판을 깔았다.
여행과 쇼핑을 먼저 스킬에 적용한 건 네이버 입장에서도 묘수다. 구매와 예약 전환의 끝 단까지 물 흐르듯 연결하는 것이 네이버 전략이다. 사용자가 클로바X를 통해 유입되면 트래픽 상승은 물론 판매까지 이어졌을 때 수수료 수익이 발생한다. LLM 개발 과정에 투자한 비용을 일부 회수하면서 네이버의 덩치를 키울 수 있는 구조를 노린다.
글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network
[컨퍼런스 안내]
◈ 2025 이커머스 비즈니스 인사이트 : 생존을 넘어 성장으로
일시 : 2025년 2월 18일 오후 12:30~17:30
장소 : 서울 강남구 테헤란로7길 22 ST Center (과학기술컨벤션센터) 지하 1층 대회의실 1