네이버 “세계 최고 수준의 비주얼 서치 만들겠다”

#1

들판을 지나다 처음 보는 꽃을 발견했다. 스마트폰 애플리케이션을 열어 이미지를 찍어 검색한다. 사진을 찍는 것만으로 무슨 꽃인지 알 수 있다.

#2

길거리를 지나다 분위기 좋아보이는 레스토랑을 발견했다. 분위기는 좋아보이는데 음식의 맛은 어떤지, 다른 사람들의 평가가 궁금하다. 스마트폰을 열어 사진을 찍었더니 그 레스토랑에 가본 사람들의 평점과 블로그 글들이 검색된다.

#3

지하철에 낯선 이의 신발이 멋져 보였다. 어디에서 샀는지 얼마인지 궁금하다. 신발을 사진으로 찍었더니 온라인에서 판매하는 사이트가 검색됐다.

얼마전까지 이미지 검색이란 이미지를 검색대상으로 하는 것을 의미했다. 이용자가 텍스트 검색어를 입력하면 이미지의 제목, 태그 등 메타데이터에서 같은 키워드를 찾는 것이 이미지 검색이었다.

그러나 딥러닝이 등장하면서 이미지는 단순히 검색 대상이 아니라 쿼리(검색어) 역할을 하기 시작했다. 앞에 언급한 사례들처럼 이미지를 직접 쿼리로 집어넣어 필요한 정보를 검색할 수 있는 시대가 열렸다.

이미지 검색은 아직 활용도가 높지 않지만, 앞으로 다양하게 활용될 것으로 전망되는 분야다. 특히 상품검색 등과 연계되면 수익성도 높을 것으로 전망된다. 구글을 비롯한 글로벌 기술 기업들이 이 분야에 뛰어드는 이유다.

국내에서는 네이버가 이런 서비스를 선보인 바 있다. 네이버 모바일 애플리케이션 검색창 옆에는 마이크, 카메라, 지도 아이콘이 있는데 이중 가운데 있는 카메라 아이콘을 터치하면 이미지 기반의 검색이 가능하다.

이 서비스는 네이버가 자체 개발한 비주얼 인공지능(AI) 기술인 ‘스코픽(SCOPIC)’을 기반으로 하고 있다. 스코픽은 딥러닝 기반의 이미지 분석 기술로, 이미지 자체의 정보와 이미지와 함께 있는 텍스트 정보를 함께 학습에 활용하는 것이 특징이다.

스코픽은 스마트렌즈, 쇼핑렌즈 등 응용서비스의 기반 기술로 활용된다. 스마트렌즈는  모바일에서 검색어 대신 이미지를 통해 검색을 진행할 수 있는 서비스다. 네이버 앱의 스마트렌즈로 사진을 찍으면 관련 문서나 상품을 보여준다. 최근에는 거리에서 상점의 외관을 찍으면 영업시간 이용자리뷰 등 해당 상점의 정보가 담겨있는 플레이스를 찾아 제공하는 기능도 추가됐다.

아직 서비스의 품질은 높지 않다. 서비스 개발팀도 이를 인정하고 있다. 강유훈 스마트렌즈 테크리더는 25일 서울 역삼동 D2스타트업팩토리에서 열린 ‘테크 포럼’에서 자사 서비스 완성도 점수를 “50~70점 사이”라고 평가했다. 아직 완성도가 높지 않다는 것이다.

낮은 완성도에도 불구하고 운영 서비스에 붙인 것은 데이터 때문이다. 이용자로부터 들어오는 데이터를 통해 니즈와 패턴을 알 수 있기 때문이다. 모든 AI 기술은 데이터를 먹고 발전하는데, 실제 서비스에서 나오는 데이터를 통해 발전해 나가겠다는 취지다.

강 리더는 “(구글렌즈 등과 비교하면) 지금은 어느정도 기술 격차는 있겠지만 심하다고 보지 않는다”면서 “세계 최고 수준의 기술을 개발하는 것이 목표”라고 말했다.

어려움은 역시 데이터다. 학습 데이터셋을 구축하기 위해서는 하나의 사물을 다른 여러 각도에서 찍은 다수의 이미지가 필요한데, 이와 같은 데이터셋 구축은 자동화하기 어렵다. 어느 정도 자동화한다고 하더라도 결국 사람이 일일이 분류해야 하기 때문이다.

검색으로 보여줄 데이터를 모으는 것도 쉽지 않은 일이다. 네이버는 블로그 카페 등의 UGC(사용자제작콘텐츠)와 쇼핑 등에서 많은 이미지 데이터를 보유하고 있지만, 이 역시 검색 결과로 보여주기에는 부족하다.

그런 점에서 네이버가 주목하는 회사는 중국의 타오바오다. 타오바오(알리바바 그룹의 쇼핑몰)에는 10억 개 이상의 상품이 있기 때문이다. 데이터 기반이 네이버보다 훨씬 우위에 있다. 여기에 중국 회사의 경우 저작권 등의 개념이 별로 없기 때문에 마구잡이로 이미지를 가져가 데이터로 쌓는 경우도 있다.

강 리더는 “네이버가 보유한 기술 수준을 70점이라고 할 때 타오바오가 75점 정로 조금 앞서 있는 것으로 보인다”면서 “어쩌면 구글보다 중국기업이 더 무서울 수도 있다”고 말했다.

글. 바이라인네트워크
<심재석 기자>shimsky@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다