시스코, 음성·영상에 최적화한 생성AI ‘RMM’ 개발…‘웹엑스 AI 어시스턴트’ 공개

시스코가 협업 솔루션 ‘웹엑스(Webex)’를 필두로 생성형 인공지능(이하 생성AI) 전략과 개발 기술을 공개했다. 오디오(음성)와 비디오(영상) 커뮤니케이션과 협업에 적합한 생성AI 기술을 개발해 웹엑스 제품군에 대거 적용한다.

시스코는 현재 개최 중인 연례 행사인 ‘웹엑스원(WebexOne) 2023’에서 독자 개발한 새로운 ‘실시간 미디어 모델(Real-Time Media Models, RMM)’과 더불어 ‘웹엑스 AI 코덱(AI Codec)’, ‘웹엑스 AI 어시스턴트’를 선보였다. 텍스트나 문서에만 초점을 맞춘 AI 제품들과 달리 실시간 통신을 바탕으로 낮은 대역폭에서도 선명한 음성·화상 통화와 미팅을 지원하는데 최적화된 AI 기술들이다.

26일 시스코는 웹엑스원 2023 아시아태평양지역(APJC) 미디어 간담회를 웹엑스(온라인)로 개최해, 이같은 웹엑스 AI 전략과 새로운 기술을 공개했다.

LLM과 결합되는 실시간 미디어 모델(RMM) 개발, 적용

시스코가 이번에 공개한 RMM은 대규모 언어모델(LLM)이 지원하는 언어와 텍스트를 넘어 음성과 영상 인텔리전스까지 접목해 풍부한 맥락(Context) 정보를 제공할 수 있도록 자체 개발했다. 여러 미디어 스트림을 기반으로 사람과 사물 인식, 제스처를 포함해 움직임 분석 등 다양한 아웃풋을 제공한다.

웹엑스에 탑재된 미디어 모델은 텍스트 기반의 미팅 요약과 미팅 하이라이트에서 대화 맥락을 이해하는 데 음성과 영상 채널을 활용한다. 텍스트, 음성과 영상 AI를 모두 활용함으로써 웹엑스 사용자는 풍부한 실시간 정보를 얻을 수 있다. 이를 바탕으로 웹엑스는 앞으로 미팅 참가자가 잠시 자리를 비우거나 나갔을 때 퇴장한 것을 인식해 미팅 메모를 캡처하고, 참가자가 돌아왔을 때 신속하게 업데이트된 미팅 정보를 제공할 수 있게 된다.

산딥 메라(Sandeep Mehra) 시스코 APJC 협업 부문 매니징 디렉터는 “시스코는 텍스트 외에 음성, 말투, 제스처같은 신호나 소소한 부분이 모든 커뮤니케이션의 맥락을 형성하는 데 있어 중요한 요소라고 보고 있다”며 “RMM은 자체 생성형 AI 모델로, 텍스트에 최적화된 LLM과는 다른 언어모델이 필요하다고 보고 시스코가 RMM을 독자 개발한 것이다. 챗GPT가 텍스트를 커버하듯이 텍스트뿐 아니라 영상, 제스처를 다 커버하고 있다”고 말했다. 이어 “시스코는 RMM과 LLM의 역량을 모두 다 결합해 매우 풍부한 음성과 영상 맥락 정보를 놓치지 않도록 해 최고의 경험을 제공할 것”이라고 밝혔다.

깨끗한 음성과 영상 품질 보장하는 ‘웹엑스 AI 코덱’

시스코는 실시간 음성 통화나 회의 때 발생할 수 있는 품질 이슈를 해결하기 위해 새로운 생성AI 솔루션인 ‘웹엑스 AI 코덱’을 발표했다. 먼저 개발한 것은 AI 오디오 코덱이다.

회의 참석자들은 네트워크 장애로 인한 영향을 자주 받는다. 예를 들어 사용자들이 음성이나 영상 회의에 참여하기 위해 신호가 좋지 않은 장소나 외부 지역에서 접속할 때 연결이 끊기는 현상을 경험할 수 있다. 고르지 못한 음성과 영상은 원활한 대화를 방해하고 큰 불편을 야기한다. 웹엑스 AI 코덱은 이처럼 연결이 불안정한 지역에서도 네트워크 상태와 상관없이 선명한 오디오를 제공한다.

웹엑스는 AI 코덱을 바탕으로 네트워크 패킷 손실을 복구할 수 있도록 대규모 중복 전송을 허용한다. 또한 웹엑스 AI 코덱에 소음 제거, 에코 제거, 대역폭 확장과 같은 음성 향상 기능이 내장돼 있어 탁월한 음성 명도를 제공한다.

시스코에 따르면, 웹엑스 AI 오디오 코덱은 일반적으로 최적의 음성 통화나 회의에 필요한 대역폭의 16분의 1 수준으로도 끊김이나 잡음 없는 품질을 지원한다. 네트워크 패킷 손실이 발생하더라도 AI가 바로 복구해 음성 품질을 유지시킬 수 있다.

이날 시스코는 AI 오디오 코덱을 바탕으로 영상을 위한 생성AI 기술인 ‘슈퍼 레졸루션(Super Resolution)’도 발표했다. 한 공간에서 대역폭 사용량이 많아 부족하거나 낮은 대역폭 환경에서 낮아진 영상 해상도를 복구해 이미지를 다시 생성해줄 수 있다. 머신러닝(ML) 기술을 바탕으로 초해상도를 사용해 영상 품질을 향상시키며, 대역폭에 관계없이 높은 영상 품질의 고화질 회의도 제공할 예정이다.

근무자와 고객 돕는 ‘웹엑스 AI 어시스턴트’

새롭게 출시된 ‘웹엑스 AI 어시스턴트’는 언어와 음성, 영상 기능을 결합해 근로자의 효율적인 업무 수행을 위한 다양한 기능을 제공한다. 예를 들어 사용자는 “내가 놓친 미팅에 대해 업데이트해 줘”와 같은 문장을 입력해 질문할 수 있다. AI어시스턴트는 이 질문을 바탕으로 실시간 답변을 생성한다.

웹엑스 AI 어시스턴트는 사용자의 웹엑스 메세지와 슬라이도(Slido)를 바탕으로 메세지의 어조, 형식, 문구 변경 사항을 제시해준다.

디지털 채널에서 고객들과 소통하는 컨택센터 상담원을 위해 기존 맥락과 인텔리전스에 기반한 답변도 제안할 수 있다.

서로 다른 언어를 사용하는 미팅 참가자들이 저마다 사용하는 언어로 메시지를 입력하면 바로 영어로 번역해 보여주는 기능도 AI 어시스턴트가 할 수 있는 기능이다.

아울러 사용자가 읽지 않은 메시지 등을 요약해 가장 최신 정보를 업데이트 받는 데 도움을 준다. 예를 들어 사용자는 웹엑스 AI 어시스턴트에게 여러 사람의 메시지가 포함된 미팅 내용에서 상사의 메시지만을 요약하도록 요청할 수 있다.

시스코 AI 어시스턴트

이같은 AI 어시스턴트 기능은 시스코 협업 장비에 기본 포함된다.

이날 발표한 세 가지 기술은 웹엑스 스위트(Webex Suite), 시스코 협업 장비, 웹엑스 컨택센터, 웹엑스 커넥트(Webex Connect) 및 웹엑스 컨트롤 허브(Webex Control Hub)를 포함한 웹엑스 모든 제품군에 적용된다. 현재는 상용화 단계로, 2023년 연내 출시될 예정이다. AI 어시스턴트를 포함한 웹엑스의 새로운 AI 기능은 맥라렌(McLaren) 레이싱과 팀 DSM(Team DSM)이 시범 활용 중에 있다.

한편, 시스코는 이날 수년간 자연어, 오디오 및 비디오 인텔리전스 및 분석 기능을 갖춘 AI를 활용해 왔으며, 처음부터 보안, 개인정보, 인권을 침해하지 않도록 주의를 기울여 설계되고 있다는 점을 강조했다. 시스코는 현재 AI 기술을 활용해 제품에 적용하기 위해 투명성, 공정성, 책임성, 개인정보 보호, 보안 및 신뢰성에 대한 표준을 준수한다는 ‘책임감 있는 AI 체계(Responsible AI Framework)’를 채택해 이행하고 있다.

글. 바이라인네트워크
<이유지 기자>yjlee@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다