네이버가 음성검색에 자체 개발한 초대규모 AI ‘하이퍼클로바(HyperCLOVA)’ 기술을 적용할 계획이라고 21일 밝혔다.

하이퍼클로바는 2040억개의 파라미터를 갖춘 초거대 AI로, 블로그, 지식IN, 뉴스 등 네이버 서비스 내의 한국어 데이터를 기반으로 텍스트가 포함한 표현들을 스스로 인식한다. 네이버 검색, 쇼핑, 네이버 녹음 앱인 클로바노트에서도 하이퍼클로바를 적용하고 있다.

네이버 측에 따르면, 하이퍼클로바 기술은 네이버 앱 음성검색 질의의 약 30%에 적용, 사용자 발화 맥락에 대한 이해도를 높였다. ▲대용어 포함 모든 발화에 연속 발화 적용 ▲긴 구어체나 어려운 질의를 키워드형으로 자동 변환 ▲음성인식 오류 감소 등으로 음성검색 성능을 크게 개선했다.

먼저 대용어가 포함된 연속 발화의 범위를 확대해 주어가 생략된 연속 대화에서도 자연스러운 음성검색이 가능하다고 회사 측은 설명했다. 기존 음성검색에서는 날씨, 번역 등 일부 조건 아래서만 대용어 포함 연속 발화가 가능했는데, 하이퍼클로바 적용 후에는 주제와 관계없이 질의의 전후 맥락을 파악해 끊김 없는 검색 흐름을 제공한다고 전했다.

예를 들어, “코로나 확진자 수”라고 검색 후, “미국은 몇 명이야?”라고 질문해도 미국 인구 수가 아닌 미국 내 코로나 확진자 수가 결과로 나온다. 길 안내에도 적용이 가능하다. “분당구 보건소”를 검색하고, “거기 가는 길 알려줘”라고 연속 질문하면 현재 위치에서 목적지까지 가는 길을 교통수단 별로 안내한다.

 

긴 구어체나 어려운 질의도 키워드형 질의로 자동 요약·변환해 정답형 검색 결과를 바로 찾아주는 방식으로 개선했다.


예를 들어, “메이저리그 LA다저스가 어떻게 되십니까?”라고 모호하게 질문해도, “LA다저스 경기 일정”으로 질의를 변환하고 안내한다. 사용자가 검색어를 잘 알지 못해, 서술형으로 풀어서 발화해도 질의를 적절하게 추천해 주기 때문에, “배를 타고 바다위를 다니는 것”이라고 질문하면 하이퍼클로버가 “크루즈 여행”이라는 질의를 추천해 다양한 검색결과를 찾아준다.

하이퍼클로바는 음성검색에서 음성인식 오류나 무의미어가 포함된 질의에 대해서도 학습 결과를 토대로 검색 결과를 안내한다.

가령, ‘춤법검사기’만 인식해도 ‘맞춤법검사기’로 변환해 검색 결과를 찾아준다. 또 ‘제고 186회 로또 번호’처럼 순서가 섞이고 무의미어를 포함한 문장이라도 ‘로또 186회 당첨번호’로 질의를 변환해 결과를 안내한다.

아울러, 네이버는 음성검색에 하이퍼클로바 뿐만 아니라 자체 개발한 서비스 필터도 함께 적용해, 하이퍼클로바가 사용자의 발화를 잘못 인식하거나, 부정확한 답변 생성 가능성까지 최소화했다.

네이버 클로바 CIC 김현욱 대화서비스리더는 “네이버는 ‘모두를 위한 AI’가 되겠다는 하이퍼클로바의 방향성에 맞게, 기술 개발에 그치지 않고 이를 통해 새로운 서비스 가치를 창출해 내는데 앞장서고 있다”며 “앞으로도 사용자에게 혁신적인 서비스를 제공할 수 있도록 하이퍼클로바 적용 범위를 확대하며 기술 상용화를 선도할 것”이라고 밝혔다.

글. 바이라인네트워크
<윤희성 기자> heecastle@byline.network


[바이라인플러스 7월 무료 웨비나 ]
  • 진화된 클라우드 보안 방안과 제로트러스트 업무환경 구현
    날짜 : 2022년 7월 6일 (수)
    시간 : 13:10 ~ 17:30
    자세히보기