김일호 AWS 솔루션즈 아키텍트

김일호 AWS 솔루션즈 아키텍트

스마트폰이 활성화 된 배경에는 앱 생태계 활성화가 한몫했다. 구글이나 애플이 API(Application Programing Language)를 열어주면, 이를 바탕으로 여러 개발자가 응용 프로그램을 만들어 냈다. 최종 소비자는 그 다양한 응용 프로그램 중 자신에 맞는 걸 골라서 쓰면 됐다. 수백만 앱 생태계가 없었다면 스마트폰이 지금처럼 일상을 파고들긴 어려웠을 거다.

인공지능(AI)도 마찬가지다. 아마존 에코에 탑재된 인공지능 알렉사는 단순히 인공지능 스피커를 위한 기술이 아니다. 알렉사는 플랫폼이다. 아마존은 ASK(Alexa Skills Kit)와 AVS(Alexa Voice Service)라는 서비스 를 제공하는데, 이는 외부 개발자들이 자신의 하드웨어나 서비스에 알렉사를 탑재할 수 있도록 만든 API(Application Programing Interface), 도구, 문서, 코드 샘플 집합이다.

이를 이용해서 외부 개발자들은 아마존 에코와 유사한 기능을 하는 디바이스를 만들 수 있다. 알렉사가 탑재된 TV, 냉장고, 세탁기, 자동차 등 무수히 많은 디바이스가 나올 수 있다. 아마존은 인공지능을 플랫폼화 하는데 성공한 대표적인 회사라고 꼽을 수 있다.

그러나 알렉사가 아마존 AI 전략의 전부는 아니다. 알렉사는 완성된 서비스 형태다. 파트너들은 아마존이 만든 모델로 아마존이 학습시킨 결과를 API로 가져다 쓸 수 있을 뿐이다.

기업들이 아마존의 AI 기술을 자유자재로 사용하기 위해서는 좀더 유연한 플랫폼이 필요하다. 개발자 자신이 갖고 있는 데이터로 비교적 쉽게 기계 학습 모델을 만들거나 목적에 맞는 알고리즘 설계를 돕는 플랫폼이다. 그것도 각 단계별로 편의성과 자유도를 각각 다르게 주는 도구라면 더욱 환영 받을 것이다.

아마존에서 이런 역할을 맡은 곳은 AWS다.

지난 13일 서울 강남 역삼동에 위치한 AWS코리아 사무실에서 김일호  솔루션 아키텍트를 만나 AWS가 만드는 AI에 대한 설명을 들었다. 김 아키텍트는 지난 2013년 1월 AWS코리아에 합류했다. AWS코리아가 생긴 이래 가장 오래 근무한 사람으로 다섯 손가락 안에 꼽힌다.

“아마존닷컴, 넷플릭스 등 세계에서 가장 트래픽 많이 잡아먹는 회사들이 AWS를 씁니다. 고객 데이터와 경험을 쥐고 있고, 이를 분석할 수 있는 컴퓨팅 자원을 갖춘 회사가 이 시장에서 유리합니다”

김 아키텍트가 말하는 AWS의 강점은 수많은 고객사의 요구사항이다. 크고 작은 기업들이 AWS의 클라우드 플랫폼과 AI 서비스를 이용하면서 제기하는 요구사항을 그때그때 가장 빠르게 반영, 새로운 기술로 업데이트해 제공할 수 있다. 그에 따르면 지난해 AWS가 내놓은 새 기능은 총 1017개에 달한다. 올해도 지난 5월 말 기준 총 322개의 새 기능이 나왔다. 이중 95%가 고객이 준 피드백이 반영됐다.

AWS의 AI 비즈니스 전략은 ‘백화점’이다. 단순히 몇 개의 서비스를 제공하는 것이 아니라, 개발자라면 누구나 쉽게 쓸 수 있는 서비스부터 데이터 사이언티스트가 쓸만한 프레임 워크까지 여러 층위의 서비스를 모두 제공한다는 전략이다. 김 아키텍트는 “굉장히 많은 서비스를 빠르게 혁신(innovation)하는 것이 강점”이라고 말했다.

“AWS가 내놓는 AI는 ‘서비스’와 ‘플랫폼’ ‘프레임워크’ 등 세 가지가 있어요. ‘서비스’는 개발자 누구나 쉽게 응용 프로그램을 만들 수 있게 하는 거고요, 플랫폼은 기존데이터로 맞춤형 추론 모델 구축에 집중하려는 고객에게 AI 플랫폼 세트를 제공하는 거죠. 이보다 자유도가 높은, 예컨대 ‘알파고’와 같은 기술을 만들고 싶다면 프레임워크를 사용해야 하고요.”

AWS에서 내놓는 AI는 난이도에 따라 세 가지 종류의 기술로 나뉜다. AWS 인프라 위에서 새로운 서비스를 개발하고 싶어하는 이들이 많은데, 각자가 보유한 데이터 양이나 혹은 기술 수준이 다르니 각각의 층위에 맞는 기술을 제공하겠다는 것이다.

최근 발표된 AWS AI 서비스 중 대표적인 것이 ‘폴리’와 ‘리코그니션’, 그리고 ‘렉스’다. 폴리는 개발자가 쉽게 가져다 쓸 수 있는 TTS(문자에서 음성으로 변환) 서비스다. 사실 TTS는 흔해 보이는(?) 서비스다. 여기에 ‘인간다움’을 입힌 것이 폴리의 강점이고 김 아키텍트는 설명했다.

“폴리는 딥러닝으로 문장 전체의 문맥을 파악해요. 그래서 끊어 읽을 부분, 억양 높낮이를 조절할 부분, 음율 등을 고려해 가장 사람다운 목소리로 읽어주죠. 전화번호 같은 경우, 사람처럼 네자리에 맞춰 끊어 읽거나 약어 같은 경우 풀어 읽을지 말지를 미리 결정해서 읽어줍니다.”

이 외에 리코그니션은 이미지 인식 기술이다. 사진을 찍어서 리코그니션에 올리면 그걸 분석해 정보를 제공한다. 풍경 사진을 찍어서 올리면 그 안에 있는 여러 사물을 추적(detection)해 결과를 알려주고, 그 결과값과 실제 사물이 일치할 확률을 함께 제공한다. 사진 속 얼굴을 인식해 성별과 표정 등을 읽는 기술도 리코그니션에 들어간다. 최근 업데이트에는 ‘사진 속 인물의 나이’를 찾아주는 기술이 포함됐다. 동양인의 얼굴도 비교적 정확한 나이대로 맞춘다.

렉스는 알렉사 같은 음성 비서 프로그램을 누구나 만들 수 있게 한, ‘알렉사의 원형’이라 생각하면 쉽다. 이름도 ‘알렉사(Alexa)’에서 맨 앞과 뒤의 알파벳을 제거해 지었다. 일반 기업이 자신의 브랜드로 알렉사와 유사한 서비스를 만들고 싶을 때 렉스를 가져다 쓰면 된다. 들어가는 기반 기술은 알렉사와 같으나, 서비스 되는 브랜드명은 개별 기업의 것을 가져다 쓸 수 있다. 예컨대 배달음식이나 환자 예약 등, 정형화된 질문을 음성으로 주고받는 서비스에다가 렉스를 활용한 챗봇을 가져다 붙일 수 있다.

세 서비스 모두 아직 한국어 지원은 안 되며, 국내 공식 출시된 것은 아니다. 다만, 미국에 있는 리전을 사용해 세 서비스를 국내 이용해도 아주 민감한 작업을 제외하고는 큰 무리가 없다는 것이 김 아키텍트의 설명이다. AWS는 모든 상품을 세계에서 사용하게 하겠다는 전략을 갖고 있는 만큼, 곧 한국어도 지원될 것으로 보인다.

세 서비스를 비롯한 여러 아마존 AI 에 다양한 ‘스킬 셋’이 존재, 생태계를 조성한다. 스킬 셋이란, 기존 기술에 붙여 응용할 수 있는 도구다. 생각보다 많은 이가 AWS AI에 관심을 갖고 사용하고 있다는 증거이기도 하다.

이는 앞서 김 아키텍트가 말한 ‘고객과 파트너십’ 덕에 가능한 일이다. 현재 AWS의 액티브 고객은 190여 개 국 수백만 기업과 개인이다. 지난 2006년부터 시작해 클라우드 플랫폼으로서 기업 파트너와 일한지 10년이 넘었다. 그 이전엔 아마존닷컴에서 쌓은 경험과, 필요 역시 AWS에 녹아들었다. 이것이 지금 AWS가 AI 분야에서 리더를 넘볼 수 있는 힘이다.

“AWS가 2006년 만들어졌으니까, 벌써 11년 차입니다. 클라우드 컴퓨팅을 제공하는 회사 중 가장 오랜 경력을 가졌어요. 수많은 고객의 요구사항을 듣고 특정 서비스나 기능을 개발합니다. 아마존에서 일하는 수천명의 AI 전문가가 내부에서 만든 기술을 고객이 쉽게 쓸 수 있도록 서비스로 내놓는 것, 그게 AWS가 가진 최고 경쟁력이죠.”

글. 바이라인네트워크

<남혜현 기자> smilla@byline.network