김영욱 마이크로소프트 부장

김영욱 마이크로소프트 부장

‘부스트’라는 공상과학(SF)소설의 첫 장은 ‘2072년 3월 6일 일요일: 전국적 두뇌지능 업데이트 열흘 전’으로 시작한다. 이 소설의 주인공은 사람 뇌 속에 심는 작은 칩의 업데이트를 담당하는 엔지니어다. 뇌 업데이트 과정은, 보안이 조금 더 강화됐다는 것 외엔 지금의 스마트폰 OS와 유사하다. 그런데 이 주인공이 뇌 업데이트 전 날 심각한 문제를 하나 발견한다. 통신과 데이터를 보호하는 칩의 감시 게이트 하나가 활짝 열려 있는 것. 정부 고위층에 줄을댄 어느 기업이 칩에 접근할 구멍을 남몰래 만들었다. 이 소설에는 지금 세계 IT를 이끄는 기업의 이름이 실명 그대로 등장한다. 이야기에서 눈 여겨 볼 것은 두 가지다. 하나는 인공지능의 대중화, 나머지 하나는 인공지능을 이끌어가는 기업의 윤리적 책임이다.

마이크로소프트(MS)는 인공지능 기술 대중화를 이끄는 리더 중 하나다. 이 회사가 최근 ‘인공지능 윤리 가이드’를 발표하는 등 인공지능의 민주화 이야기를 자주 꺼내는 것은, 기술에 대한 기업의 책임을 강조해 소수가 혜택을 독점하는 것을 막자는 취지에서다.

MS가 인공지능 기술 개발에 앞서 내 건 세 가지 전제조건이 있다. 첫째 모든 기술은 사람에게 도움이 되어야 한다, 둘째 보편적인 기술로 디자인 하라, 셋째 신뢰성 있는 기술로 구현하라. 이 때문에 올해 업데이트 된 MS의 인공지능 기술 전반에는 ‘어떻게 인간의 삶을 윤택하게 하고, 소외되는 사람이 없게 하는가’라는 고민을 담았다.

이러한 철학이 지금까지 발표된 MS의 인공지능 기술엔 어떻게 반영이 되어 있을까. 이 회사 김영욱 부장을 최근 서울 광화문 한국마이크로소프트 사무실에서 만나 이야기를 나눴다. 그는 “누구나 쉽게 접근할 수 있는” AI를 강조했다. 인공지능이 돈 있는 소수의 전유물이 되면 안 된다는 것, 그래서 일반적으로 MS라고 하면 바로 떠오르는 사무용 프로그램 ‘오피스’에도 AI가 들어가 있다는 것, ‘오피스 365’를 쓰면 MS의 AI 기술을 가져다 쓰는 셈이라는 것 등이 그가 말한 사례다.

마이크로소프트는 어떤 인공지능 기술을 가졌나

“마이크로소프트는 인공지능과 관련한 모든 걸 다합니다. 일종의 항공모함 모델이죠. 머신러닝 오픈소스 라이브러리나 이를 돌릴 수 있는 클라우드 플랫폼, AI 서비스 등 어느 하나로만 접근해선 아무것도 안 됩니다. 구축함이든, 순양함이든 관련해서 모두 가져갑니다.”

인공지능 기반 마이크로소프트 제품과 서비스 [출처=마이크로소프트]

인공지능 기반 마이크로소프트 제품과 서비스 [출처=마이크로소프트]

김 부장의 말대로 MS는 음성인식 서비스인 코타나부터 오피스365, 다이나믹스365와 같은 애플리케이션, 그리고 코그니티브 서비스와 애저 머신러닝 같은 인프라까지 인공지능 전반에 걸친 모든 구성요소를 제공하고 있다. 인공지능과 관련한 여러 서비스가  MS 애저 머신러닝 위에서 돌아간다. 눈에 띄는 점은 일반인이 비교적 쉽게 접근할 수 있는 AI 기술이 꽤 많아 보인다는 점이다.

대표적인 예로  ‘비디오 인덱서(Video Indexer)’를 들 수 있다. 비디오 인덱서는 영상 속 인물의 발언을 자막으로 바로 나타낸다. 지원하는 언어 안에서 번역도 가능하다. 발언의 내용 중 주요 키워드를 뽑아 주고, 해당 키워드가 나온 구간을 선택해 골라 볼 수 있게 했다. 아울러 영상에 누가 나오는지를 분류해서 나타내며, 각 발언자의 시간 점유율도 그래프로 보여준다. 만약 해당 영상이 스포츠 경기라면 볼 점유율 등을 나타낼 수 있으며, 폭력성이나 선정성 등 영상의 성격을 분석해 나타내기도 한다.

비디오 인덱서는 마이크로소프트 코그니티브 서비스의 일환이다. 코그니티브 서비스는 시각, 언어, 음성, 검색, 지식 등 다섯가지 분야로 나뉘며 필요한 부분을 꺼내어 바로 쓸 수 있도록 되어 있다.

김 부장은 코그니티브 서비스를 일컬어 “서비스의 양과 질, 한국어 지원 여부 등 마이크로소프트가 경쟁사 대비 가장 앞서 나가고 있는 분야”라고 설명했다.

비디오 인덱서 이외에 ‘맞춤형 비전 서비스(Custom Vision Service)’ ‘빙 맞춤형 검색(Bing Custom Search)’ 등이 지난 빌드 컨퍼런스에서 소개됐다.   실험적인 기능들을 테스트 할 수 있는 코그니티브 서비스 랩(Cognitive Service Lab)과 개선된 ‘루이스(LUIS: Language Understanding Intelligent Service)’ 등도 있다.

비디오 인덱서 예시

비디오 인덱서 예시

이 외에 자연어 처리가 필요할 경우 랭귀지 관련 기술을 사용하면 말하는 사람이 누군지 해당 인물의 목소리만 뽑아내는 것도 가능하다. 유명인의 경우, 목소리만 듣고 해당 인물을 맞출 수 있다. 사진에 찍힌 글자를 뽑아내는 OCR 기능도 랭귀지 서비스 안에 포함된다.

OCR과 자연어 분석은 한국어가 지원된다. 국내 한 쇼핑몰에서는 고객센터에서 MS의 OCR 기술을 활용한다. 쇼핑몰 이용자가 찍어 올리는 사진을  분석해서 처리하는데, 인공지능이 적용되기 전보다 낮은 가격에 서비스를 제공한다. 해당 기술은 국회도서관 등에서도 활용되고 있다.

사진이나 영상  자료에서 특정 나이의 인물을 검색하거나 해당 인물의나이를 알아맞추는 기술이 적용된 사이트 ‘하우올드닷넷’도 MS의 인공지능 기술이 적용되어 있다. 하우올드닷넷은 마이크로소프트가 개발자 컨퍼런스인 빌드 2015에서 공개한 웹사이트로, 사용자가 사진을 올리면 머신러닝 기술이 적용돼 사진 속 인물의 얼굴을 판독해 예상 나이를 제시해준다. 마이크로소프트연구소가 연구개발하고 있는 이미지 인식 기술을 바탕으로 개발된 하우올드닷넷은 이미지에서 객체를 인식하는 기술로, 사람, 동물, 물체 등이 각각 무엇인지 구분해내는 것이 핵심이다.

[광 to the 고] 웃긴데 알찬 유튜브 채널 '스튜디오 바이라인'에 놀러오세요


김 부장은 “동양인의 얼굴을 검색하면 처음에는 10살 씩 어려 보였다. 그런데 지금은 동양인 데이터가 많이 집적이 되어 거의 정확한 나이를 맞추고 있다”고 말했다.

하우올드닷넷에서 '연상 연하 커플'로 검색된 사진으로 성별과 나이 예측

하우올드닷넷에서 ‘연상 연하 커플’로 검색된 사진으로 성별과 나이 예측

“기술 상향 평준화됐다, 누가 더 많은 데이터를 가지고 있나”

인공지능 업체들은 누가 더 빠르게 의미 있는 데이터를 확보할 것인지 경쟁을 벌이고 있다.

김 부장은 “딥러닝 기술은 거의 상향 평준화되었다고 보면 된다”며 “이제부터는 누가 더 양질의 데이터를 갖고 강력한 인프라로 학습을 시켜놓느냐가 관건”이라고 강조했다. 그런면에서 보면 ‘마이크로소프트 그래프’라는 기술이 눈에 띈다. 전세계에서 오피스를 사용하는 인구가 12억 명이다. 어마어마한 수치다. 이 사람들의 활동을 AI로 분석해보니, 파워포인트(PPT)에 평균 2시간을 활용하고, 이메일을 보내더라는 것이다. 이걸 밑단에서 하나로 묶어서 개인이 자기만의 서비스를 만들 수 있게 하는 것이 ‘그래프’다.

자사 인공지능 기술을 얼마나 빨리 대중화하느냐도 관건이다. MS가 제공하는 챗봇 기술이 한 사례가 될 것 같다. 김영욱 부장이 이날 직접 시연한 것 중 기억에 남는 것은 마이크로소프트 홈페이지에 있는 Q&A를 가져와, 이를 ‘질문과 답’ 형태로 풀어 말해주는 챗봇을 순식간에 만드는 일이었다. 그는 MS가 최근 공개한 AI 기술 면면이 사람들이 쉽게 생활에서 이 기술을 가져다 쓸 수 있게 하는데 초점을 맞췄다고 설명했다.

“국내 100대 기업 중에 50곳의 챗봇을 MS가 만들었습니다. 그 중 제가 직접 만든 것이 4개 정도 되죠. 기업의 챗봇을 쉽게 만드는데, 그 뒷단에서는 MS의 인공지능 기술을 쓰는 것입니다.”

마지막으로, 김영욱 부장은 인공지능을 만드는 기업과 개발자의 책임을 다시 한 번 강조했다. 현재 MS에는 AI 분야에만 6000명이 일하고 있다. 계속해 새로운 것을 만들고 시도한다. 그는 IT 기업이 어떠한 선택을 하느냐에 따라 사람들의 미래상은 많이 달라질 것이라고 강조했다.

“코딩을 잘못하면 원전 폭발이 나거나 자동차 사고가날 수 있죠. 예전에는 ‘1+1’은 1이라는 답이 나왔지만, 인공지능도 반드시 같은 답이 내리란 보장이 없어요. 어떻게 학습시키느냐에 따라 결과가 다르게 나올 수 있는 거죠. MS가 기술 얘기를 할 때마다 ‘철학’을 먼저 말하는 이유입니다.”

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network