이스트소프트, 외국어 뉘앙스까지 표현하는 ‘AI 앵커’ 출시

인공지능(AI) 서비스 기업 이스트소프트는 글로벌방송 아리랑TV의 대표 앵커로 활약했던 ‘데빈’을 모델로 다국어 발화가 가능한 AI 휴먼을 출시했다고 19일 밝혔다.

이스트소프트가 만든 ‘AI 휴먼 앵커 데빈’은 북미, 유럽, 중동, 아시아 권역 110여개국의 언어 75종을 말할 수 있고, 450여명의 목소리를 구현했다.

이는 자사의 AI 클론 기술에 마이크로소프트의 기술이 더해진 결과라는 게 이스트소프트의 설명이다. 인물의 외모를 비롯해 발화 능력과 목소리, 말투와 동작을 그대로 복제해 생성하는 이스트소프트의 AI 클론 기술인 STF(Speech-To-Face)에 마이크로소프트의 음성합성 기술인 TTS(Text-To-Speech)를 접목했다.

이를 통해 AI 휴먼의 다국어 발화 기능을 향상하고, 다양한 목소리도 구현해 냈다. 이스트소프트 관계자는 “특히 다국어 발화는 같은 언어라도 사용하는 국가 간 다른 뉘앙스까지 표현해 낸다”고 말했다.

또한 AI 휴먼 앵커 데빈은 한층 더 완성도 높은 서비스를 제공하기 위해 글로벌 시장에 통용되는 수준의 영어를 발화할 수 있도록 제작했다.

이스트소프트는 아리랑TV 전 대표 앵커 데빈의 음성을 글로벌 최고 수준 스펙으로 구축한 자사 AI 스튜디오에서 고품질의 정제된 데이터로 추출해 발화 기능을 고도화했다고 설명했다.

한편, AI 휴먼 앵커 데빈은 이스트소프트의 AI 휴먼 영상제작 솔루션인 ‘AI 스튜디오 페르소’에 탑재해 제공한다. 이스트소프트는 앞서 이달 초 마이크로소프트의 비전 얼라이언스에 합류하며 AI 휴먼 서비스의 글로벌 확장을 위한 기반을 다지기도 했다.

변계풍 이스트소프트 AI 사업본부 이사는 “완벽한 다국어 발화가 가능한 AI 휴먼 개발로 자사의 AI 휴먼 서비스인 ‘AI 스튜디오 페르소’가 글로벌 경쟁력을 확보한 만큼, 국내를 넘어 해외로 빠르게 사업을 전개해 나갈 계획”이라고 밝혔다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다