애플 홈팟 음성인식 팀장, SKT AI 연구 이끈다
최근 유행하는 음성비서라는 서비스를 처음 선보인 곳은 애플이다. 2011년 10월 애플이 아이폰4s에 ‘시리’라는 음성인식 기반의 가상비서 소프트웨어를 처음 탑재했다. 이후 음성을 인터페이스로 하는 비서 서비스는 IT업계 최대 격전지가 됐다.
SK텔레콤 김윤 인공지능(AI) 리서치센터장은 애플에서 ‘시리’ 개발을 담당했던 인물이다. 최근에는 애플의 AI 스피커라고 볼 수 있는 홈팟의 음성인식 팀장을 맡았다. 그는 홈팟 개발을 완료한 이후 실리콘밸리를 떠났다. SK텔레콤 AI 리서치센터를 이끌기 위해서다.
김 센터장이 SKT에서 맡은 역할은 회사의 AI의 역량을 강화하는 것이다. SKT는 현재 30명 규모로 AI리서치 센터를 구성했으며, 연말까지 규모를 두 배 정도로 키울 예정이다. 구글이나 아마존과 같은 글로벌 기업은 물론, 네이버나 카카오와 같은 국내 기업보다도 연구소 규모가 크지 않다.
이 때문에 김 센터장은 “선택과 집중”을 강조했다. 김 센터장은 “유수한 기업이 세계에 많고, 훌륭한 연구자를 보유한 기업이 많다”면서 “저희는 잘할 수 있는 몇 개 분야를 선택해 집중적으로 연구, 투자하겠다”고 밝혔다.
김 센터장이 우선적으로 선택과 집중하겠다고 밝힌 것은 DiscoGAN(디스코갠)이라는 기술이다. DiscoGAN은 딥러닝과 GAN(Generative Adversarial Networks)이라는 방법론을 이용해 AI가 스스로 이미지를 생성할 수 있다. 예를 들어 남성 사진을 여성 사진으로 바꿀 수 있다. AI가 여성적인 헤어스타일, 피부톤, 얼굴 윤곽 등을 생성해내는 것이다.
김 센터장은 “DiscoGAN을 이용하면 내 스타일에 맞는 자동차나 신발 이미지를 만들 수 있다”고 말했다.
DiscoGAN은 SK텔레콤의 AI 리서치 센터에 소속된 ‘T브레인’ 팀에서 개발했다. 삼성전자에 근무하다 SK텔레콤 최연소 임원으로 이름을 올린 김지원 상무가 이끌고 있다. ‘T브레인’ 팀을 이끌고 있다.
김 센터장은 이와 함께 ‘비지도학습’에 대한 자신감도 드러냈다. 비지도학습이란 연구자가 데이터에 이것이 무엇인지 설명할 필요 없이 AI 스스로 데이터와의 상관관계 통해 학습해 나가는 기술이다.
예를 들어 최근 처음의 이세돌 9단과 대결을 펼친 알파고는 프로 바둑기사의 기보를 통해 바둑을 배웠다. 지도 학습이다. 그러나 지난 해 선보인 알파고제로는 바둑기사의 기보 없이 실전대국을 통해 바둑을 학습했다. 알파고제로는 모든 버전의 알파고를 이긴 AI 바둑의 최고 실력자로 성장했다. 비지도학습으로 배운 알파고제로가 지도학습으로 배운 알파고를 넘어선 것이다. 김 센터장이 자랑한 DiscoGAN도 비지도 학습을 통해 개발됐다고 한다.
김 센터장은 AI 분야에서 SKT가 가진 장점에 대해 “데이터”라고 답했다. 그는 “SKT는 기지국 네트워크 기반의 방대한 데이터를 가지고 있다”면서 “SKT의 자산인 데이터를 어떻게 활용해서 사용자 경험을 향상시키고, SKT가 추구하는 사업에 도움이 될지 연구해보겠다”고 말했다.
애플은 최근 홈팟을 공식 출시했다. SKT텔레콤은 ‘누구’라는 AI 스피커를 출시했다. 김 센터장 입장에서 보면 두 제품이 어떻게 다를까?
김 센터장은 “(해외) 언론에서는 지금 홈팟의 부족한 기능을 욕하지만 애플은 선택과 집중을 통해 하나씩 기능을 강화해 나갈 것으로 본다”면서 “반면 ‘누구’는 홈팟에 비해 재미있는 기능이 많다”고 말했다.
글. 바이라인네트워크
<심재석 기자>shimsky@byline.network