[구글I/O] 머신러닝의 시대, 구글은 무엇을 말하고 있나
순다 피차이 구글 CEO가 키노트를 통해 꺼내놓은 구글의 새 비전은 ‘Mobile first to AI first’였습니다. 어렵게 볼 것도 아닙니다. 말 그대로 모바일에서 AI로 중심을 옮기겠다는 겁니다. ‘컴퓨터’ 그 자체가 의미를 갖던 세상이 ‘인터넷’을 만나 발칵 뒤집어졌고, 다시 ‘모바일’을 만나면서 완전히 우리의 삶이 바뀐 것처럼 다음 변화의 중심은 인공지능에 있다는 게 요즘 실리콘밸리 기업들의 생각입니다.
실제로 2년쯤 전부터 각 기업들의 개발자 컨퍼런스는 너나 할 것 없이 머신러닝을 중심에 두었습니다. 머신러닝의 기술 성숙도는 곧 기업의 가치로 이어졌습니다. 갑자기 치솟기 시작한 엔비디아의 주가나 모바일의 성장이 위기가 됐던 마이크로소프트의 반등 역시 그 뿌리는 머신러닝에서 찾을 수 있습니다.
에릭슈미트 알파벳 회장은 2015년에 “지금 노트북과 5천 달러만 주어진다면 머신러닝에 전부 투자할 것”이라고 말한 바 있다. 실제로 그 즈음 구글은 머신러닝 프레임워크 ‘텐서플로(Tensor Flow)’를 오픈소스로 공개했고, 관련 기술들을 검색부터 사진, 클라우드 등에 접목했다. 이후 알파고의 바둑을 통해 기술적, 대중적으로 머신러닝을 알리기도 했다.
과연 머신러닝은 어떤 의미를 갖는 걸까? 사람을 대신해서 일자리를 빼앗고, 터미네이터의 스카이넷처럼 우리 세상을 위험에 빠뜨리는 기술일까? 그게 아니라는 이야기는 이미 많은 기업들이 반복해서 설명했던 바 있다. 현재 머신러닝이 실질적으로 쓰이는 용도는 반복적인 데이터 분류 작업을 대신해주는 데에 있다. 사람이 하기 싫은 단순 반복 업무를 대신한다는 말이다.
2017년 구글I/O는 머신러닝의 가치를 아주 쉽게 풀어서 보여주는 자리였다. 구글이 첫날 키노트를 통해 쉴 새 없이 쏟아놓은 이야기들의 핵심은 ‘머신러닝이 서비스를 어떻게 바꾸어 놓았는가’에 있다. 따져보면 이날 구글이 꺼내놓은 것들 중 완전히 새로운 것은 단 하나도 없다. 모두 기존 서비스들에 새로운 기능을 더하거나 확장한 것이다. 그리고 그 확장의 구심점은 모두 머신러닝이다.
▲구글은 왜 막대한 자원을 쏟아 인공지능을 개발할까. 그에 대한 답이 이날 키노트에 담겨 있다.
머신러닝은 마치 PC에 초고속 인터넷을 연결했던 것처럼 구글의 서비스들을 바꾸어놓고 있었다. 어떻게 보면 새로운 게 없는 것 같기도 하지만 기존 서비스에 머신러닝을 접목하면서 완전히 다른 가치를 만들어내는 것을 눈여겨볼 필요가 있다. 그리고 “우리는 왜 인공지능 기술을 연구해야 하나”라는 근본적인 질문을 되짚어 볼 필요가 있다. 다시 구글이 내놓은 서비스들을 보자.
가장 큰 충격을 준 ‘구글 렌즈’는 구글이 오랫동안 공들여온 컴퓨터 비전, 이미지 분석 기술을 확장한 서비스다. 스마트폰 등장 초기에 구글이 내놓았던 ‘구글 고글(Google goggle)’의 발전된 형태라고 보면 크게 다르지 않다. 다만 구글 고글이 사진을 통해 사물을 골라내는 게 전부였다면 구글렌즈는 움직이는 사물을 읽을 수 있고, 머신러닝을 통해 그 정확도를 놀랍도록 끌어올렸다.
기본적으로 기기가 사람의 눈처럼 사물을 파악하고, 내용을 이해하게 되면 그 다음 단계는 상대적으로 쉽다. 이미지가 텍스트 기반의 메타데이터로 정리되면 그 뒤는 그저 웹브라우저에서 구글 검색창에 글자를 치는 ‘구글링’과 다르지 않다. 키노트에서 시연된 공연정보, 캘린더 입력, 공유기 로그인 정보 등 이미지가 어떤 의미를 갖고 있는지에 따른 결과물을 연결하면 된다. 구글은 이미 검색엔진에 부가적인 정보를 보여주는 ‘지식 그래프’를 서비스하고 있는데 구글렌즈는 이미지를 글자로 풀어 지식 그래프에 입력하는 과정이라고 보면 된다.
핵심은 카메라를 통해 입력되는 이미지에서 맥락을 얼마나 잘 읽느냐에 달려 있다. 그 부분이 바로 머신러닝의 역할이다. 구글이 직접 이야기하진 않았지만 구글이 이미지를 읽어낼 수 있는 능력은 구글 포토를 통해 얻었을 가능성이 높다. 머신러닝으로 이미지를 골라낼 수 있는 능력을 갖게 되면 구글에게 그 뒤 과정은 상대적으로 쉽다. 구글이 잠깐 시연하고 넘어간 사진 노이즈 제거나, 펜스 이미지를 지우는 것은 기술적으로 조금 다른 문제지만 결국 사진에서 담고자 하는 것이 무엇인지에 대해 사람처럼 이해할 수 있게 되면서 가능해진 일이다.
▲이야기를 읽어낸다는 것, 그 변화만으로도 구글의 모든 서비스는 달라진다.
구글 포토의 진화도 머신러닝과 관련있다. 올해 구글 포토의 핵심 변화는 공유에 있다. 구글 포토의 사진 공유 시나리오는 우리가 사진을 함께 찍은 사람에게 공유해주거나, 가족 사진을 함께 나누어 본다는 데에서 출발한다. 사진을 찍고 보관하는 것은 디지털로, 클라우드로 전환됐지만 공유는 상대적으로 예전 기술에 의존한다. 해당 인물에게 ‘직접’ 전달하는 것이다.
구글은 여기에 해당 인물에 대한 시나리오를 더했다. 구글 포토는 이미 얼굴을 읽을 수 있기 때문에 이를 통해 미리 정해 놓은 인물 사진에 대해, 혹은 이벤트 사진에 대해 당사자에게 자동으로 공유해주는 것이다. 내가 나온 사진을 내가 받아볼 수 있다는 이야기다. 단순해 보이지만 컴퓨터가 사람을 알아보는 것 하나에 사진을 전송해주는 기능을 붙이는 것으로 구글 포토는 이전과 전혀 다른 서비스가 된다. 구글이 머신러닝을 연구하는 이유로 주로 언급하는 ‘단순한 작업을 대신한다’는 것과도 잘 맞아 떨어진다.
▲머신러닝은 공격적인 변화처럼 보이지만 사실 사진 분류처럼 사소한 일에서부터 변화가 시작된다.
구글 홈의 진화 역시 머신러닝과 관계가 있다. 구글 홈은 그 동안 구글이 만들었던 제품들 중에서 거의 유일하게 개인화되지 않은 제품이다. 가족이 공용으로 쓰는 기기다. 하지만 이와 연결되는 모든 구글 서비스는 개인화되어 있다. G메일이나 일정 정보, 콘텐츠 보관함 등 모두 사생활이 담기는 것이다. 이를 풀어내는 방법은 의외로 간단하다. 목소리를 학습하면 된다.
그래서 구글 홈은 최대 6명의 목소리를 학습해서 구분하고, 해당 목소리의 계정과 서비스를 연결한다. 사람이 목소리만으로 누구인지 구분하는 것처럼 목소리 정보를 학습하는 것 역시 머신러닝의 역할이다. 개인화 문제가 해결되니 전화를 걸어주는 ‘핸즈프리 전화’ 같은 기능도 추가할 수 있고, 더 개인화된 서비스를 던져줄 수 있다. 물론 목소리, 즉 성문은 그 자체로 지문이나 홍채 만큼이나 치밀한 생체 보안 수단이기도 하다.
▲기기의 변화도 점차 클라이언트에서 클라우드로 이동한다.
구글은 사실상 머신러닝과 관련된 모든 기술을 개방했다. 텐서플로는 무료인 데다가 이번 구글I/O를 통해 1.2 버전으로 업데이트했다. 텐서플로를 효율적으로 쓸 수 있는 시스템 환경을 클라우드로 구축하고, 이를 위한 FPGA(프로그램 프로세서)인 TPU(Tensor Processor Unit)도 성능을 높인 2세대 제품을 꺼내 들었다. 게다가 인공지능의 대중화를 언급하면서 연구 목적을 위해서는 일정 수준의 인공지능 리소스를 개방하기도 했다.
앞서 소개한 구글 렌즈나 구글포토, 구글 어시스턴트 역시 직접적으로 구글에게 수익을 주는 것은 아니다. 하지만 결과적으로 머신러닝과 해당 서비스를 통해 구글의 서비스를 풍성하게 만들고, 관련 기술들이 더 나은 검색 결과를 만들어내는 것만으로도 구글의 비즈니스 모델은 더 탄탄해진다. 그게 지금까지 클라우드, 안드로이드, 콘텐츠 등으로 구글을 유지해 온 기본 전략이기도 하다.
머신러닝은 그 자체보다도 이를 받아들인 서비스가, 또 제품이 어떻게 변하는지를 지켜봐야 한다. 일단 완전히 새로운 변화다. 그리고 이용자들이 그에 따라 감당해야 하는 리소스도 크지 않다. 구글 홈은 지난해 발표됐을 때와 똑같은 기기지만 1년 사이에 완전히 다른 수준의 기기로 진화했다. 게다가 개개인의 하드웨어가 해야 하는 일은 별로 없다. 뒤에서 머신러닝이 만들어주는 무형의 역할들이 기기의, 또 서비스의 가치를 완전히 새로 만드는 셈이다.
결국 구글이 긴 키노트를 통해 세상에 준 메시지는 이전과 다르지 않다. ‘머신러닝이 더해진 서비스와 그렇지 않은 서비스는 천지 차이’라는 것이다.
▲결국 구글의 근본적인 경쟁력, 즉 검색의 진화를 위해 모바일 다음 기술로 인공지능이 꼽히는 것은 자연스러운 일이다.
글. 바이라인네트워크
<최호섭 기자>hs.choi@byline.network