카카오는 이미 당신의 얼굴을 알고 있다? – 카카오 비전 AI

카카오가 비전 엔진에 대한 성과와 앞으로의 계획을 발표했다. 티는 나지 않지만 카카오는 착실하게 인공지능을 준비하고 있다. 그중 AI의 꽃인 비전 엔진에 관한 이야기를 미디어 스터디 자리에서 밝혔다. 이 기술은 거의 마이너리티 리포트에서 범죄자 잡아내는 정도로 발전해 있다.

 

“나 말고”(출차=IMDB)

 

비전 AI가 인공지능의 꽃인 이유는 사람과 마찬가지다. 사람이 시각에서 가장 많은 정보를 받아오기 때문이다. 컴퓨터 비전은 사람이 사물을 보는 것처럼 사물을 인식해 사람에게 알려주는 역할을 하는 엔진이다. 이를 인공지능화하면 비전 AI가 된다. 방법은 당연히 딥러닝이다. 물론 딥러닝이 활발할 경우 인공지능은 순간적으로 사람보다 더 많은 정보를 캐치하게 되므로 사람의 보는 방법과 실제로는 조금 다르다.

 

분노와 역겨움도 섞여있을 줄 몰랐는데…흔히 짤방용으로 자주 쓰는 MS이모션 API도 딥러닝의 결과다

 

예를 들어서 사람은 웃는 얼굴을 보면 ‘기분 좋아 보이네’라고 생각한다. 그런데 컴퓨터는 이런 사진을 보면 기존에 입력된 사진 수십억개로 학습한 사진과 대조해 기분 좋음 90% 보통5% 비열함5% 이런 식으로 판단한다. 곧 그 사진은 ‘기분 좋을 확률이 높은’ 사진으로 판단하다. 인간의 단순한 정보 정리에 비해 복잡하지만, 다시 인간에게 맞춰 단순한 정보로 전달하는 것이다.

 

숫자 8 보여줬을 뿐인데 신경망은 저렇게 엄청나게 움직인다

 

학습은 기존에 있었던 뉴럴 네트워크와 딥러닝이 합쳐진 방식이다. 딥 뉴럴 넷이라고 불러도 된다. 정보를 점-선-면의 형태로 확장해가는 뉴럴 네트워크의 수를 무한대(현재는 약 200개 이상의 레이어를 사용한다고 한다)로 늘리면 딥 뉴럴 넷이 된다. 이미지 인식 기술에서 딥러닝은 대세 기술이 아니었지만 알렉스넷이 2012년 딥러닝을 들고나오면서 인식 오류를 크게 개선해 대세가 됐다. 동시에 GPU, 딥러닝의 기초 학습 자료가 되는 이미지넷 등이 등장하며 이미지 인식 기술은 큰 발전을 이뤘다.

 

다음 꽃 검색(제공=카카오)

 

카카오 역시 딥러닝을 도입해 꽃의 이름을 알려주는 서비스를 하고 있으며, 정확도도 94%로 상당히 높은 편이다. 이 기술은 성인물을 걸러내는 데도 쓰인다. 컬러, 모양 등을 판단해 이것이 성인물인지 아닌지를 판단하며 정확도는 92% 정도.

이 과정에서 사용되는 기술 중 앞서 말한 것은 이미지 분류 기술이며, 객체 검출 기술도 있다. 사진 내에서 사람, 고양이, 개, 자동차 등을 골라내는 것이다. 성인물로 의심할 수 있는 사진을 업로드한다면 신체 부위나 속옷 등도 검출해낼 수 있다는 이야기다.

 

객체 검출은 이렇게 다음 로드뷰의 번호판을 찾아내 자동으로 블러 처리하는 데 쓰였다(제공=카카오)

 

유사이미지 검색 – 메트릭 러닝과 검색 시스템

메트릭 러닝과 검색 시스템은 흔히 하는 말로 ‘이미지로 검색’이라고 생각하면 된다. 흔히 구글에서 많이 하는 검색이지만 다음에도 탑재돼 있다. 이미지를 업로드하면, 다음카카오 서버 내 수십억장의 이미지 중 가장 비슷한 백 개만 딱 보여준다. 속도는 30ms로 사람이 인식할 수 없는 속도다.

 

얼굴인식과 윤리적 문제

얼굴 인식의 경우 특별히 더 많은 실험과 연구를 한다. 포털에 올라오는 이미지 절반 이상이 사람의 얼굴을 담고 있기 때문이다. 사진을 업로드하면 얼굴의 위치, 방향(각도), 얼굴의 특징 등을 파악해 성별이나 나이 등을 파악한다.

얼굴인식은 인식하는 걸로만 끝나는 게 아니다. 스마트 섬네일 기능이라고 해서, 화면에 맞게 이미지를 자르는 데도 쓰인다. 세로로 긴 사진의 경우 위에서 자르면 얼굴이 잘리게 되는 경우가 많아서 얼굴을 중심으로 잘라야 하는데, 이걸 비전 엔진으로 처리하면 정확하게 얼굴 근처를 자른다.

 

스마트 섬네일 사례지만 사진은 스마트하게 못 찍었다

 

유명인의 경우 얼굴을 학습하고 기억하고 있다가 태깅할 수 있다. 유명인이 아닌 경우에는 어떻게 할까. 여기서 윤리적인 문제가 발생한다. 다음과 카카오가 우리의 얼굴을 분류할 자격이 있는가. 이건 역차별 논란이 될 수도 있다. 페이스북은 이미 사용자 얼굴을 파악하기 때문. 이 문제에 대해 발표자인 최동진 AI부문 멀티미디어처리파트 파트장에게 물어보니 “유명인 외에는 얼굴과 실명을 대조하는 태그를 하지 않는다”고 답했다. 깔끔한 대답이다. 다음이나 카카오는 당분간 믿어도 되겠다. 그런데 너무 믿지는 말자. 이 부분에서 페이스북은 그냥 믿지 말자.

 

YouTube video

 

윤리적 문제가 발생하는 이유는 이들이 특정 국가에 귀속돼 있고 언제든 각국 정부의 수사 요구에 협조해야 하기 때문이다. 이 과정에서 죄 는 사람이 데이터 오류로 인해 조사를 받을 수도 있다. 먼 이야기 지만 먼 이야기가 아니다.

 

앞으로의 계획

카카오는 앞으로 비전 엔진을 활용해 다음과 같은 서비스를 할 것으로 발표했다.

  1. 유사 상품 검색 기능 도입: 객체 검출, 이미지 분류 기술을 활용해 이미지 안에 있는 옷/가방 등 상품을 추출/분석해 유사한 상품을 찾아주는 서비스. 연내 시행된다.
  2. 유명인 얼굴 인식시스템 구축: 연내 연예인 등 유명인 얼굴 인식시스템을 구축해 포털 다음 등 카카오의 서비스에 적용할 계획이다. 동명이인을 구별해 잘못 올라온 섬네일이나 인물 정보를 자동으로 수정하고, 유명인 관련 콘텐츠를 찾아내는 등 다양하게 활용한다.
  3. 카카오헤어샵 가상 염색 서비스: 올 7월 헤어샵 예약 서비스인 ‘카카오헤어샵’에 사용자에게 어울리는 염색 컬러를 가상으로 경험해볼 수 있는 서비스를 도입한다.
  4. 시각 엔진 중심의 신규 서비스: 사진/동영상 검색 등을 포함, 시각 엔진을 활용해 일반 이용자들이 유용하게 사용할 수 있는 서비스를 연내 선보인다.
  5. IoT 적용 분야 확장: 제휴사 등 카카오I 생태계에서 구현될 카카오의 IoT에서 시각 엔진이 사용될 예정이다. 방문자 식별 등 보안을 비롯해 IoT 환경을 구축에 활용된다.
비슷한 옷을 검색해주는 서비스를 곧 시행한다(제공=카카오)

글. 바이라인네트워크

<이종철 기자> jude@byline.network

 

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다