앤트로픽 클로드, ‘음성 답변’ 기능 도입 임박

앤트로픽의 인공지능(AI) 챗봇 ‘클로드’에 글 대신 음성으로 답변하는 기능이 조만간 추가될 전망이다. 블룸버그는 익명의 소식통을 인용, 앤트로픽이 이르면 이달 안에 클로드용 ‘음성 모드’를 일부 사용자 대상으로 출시할 것이라고 15일(현지시각) 보도했다.

매체는 iOS용 클로드 앱 최신 버전을 분석한 결과 내부 코드에서 세 가지 음성 모드를 발견했다고 밝혔다. 각각 ‘에어리’, ‘멜로우’, ‘버터리’라는 이름이다. 이중 버터리 모드는 영국식 영어를 사용하는 것으로 알려졌다.

이외에도 내부 코드의 문자열을 통해 음성 모드의 특징을 몇 가지 유추해 볼 수 있다. 목소리의 빠르기는 3단계로 조절할 수 있다. 음성 답변 도중 화면을 아무 곳이나 터치하면 답변을 중단시킬 수 있다. 또한 음성 모드는 당분간 영어로만 제공된다.

블룸버그는 클로드 음성 모드가 오픈AI의 ‘고급 음성 모드’와 비슷하다고 언급했다. 고급 음성 모드는 챗GPT용 음성 답변 기능이다. 오픈AI는 작년 5월 이 기능을 처음 공개했으나 “일부 잠재적 안전 문제가 있다”며 출시를 한차례 미뤘다. 회사는 챗GPT가 다른 사람의 목소리를 따라 하지 못하도록 사전 설정한 음성만 제공하고, 저작권이 있는 오디오 생성을 요청했을 때 거부하는 필터를 도입한 뒤 같은 해 7월 해당 기능을 정식 출시했다.

한편 앤트로픽은 이날 클로드에 ‘리서치’와 ‘구글 워크스페이스 통합’ 기능을 추가하겠다고 발표했다. 리서치는 기업 내부 데이터와 웹 검색을 병행해 보다 정확한 답변을 빠르게 생성한다. 클로드를 구글 스페이스에 연동하면 구글 문서, 지메일, 캘린더 등 구글 앱에서 찾을 수 있는 정보를 참조해 답변한다. 요청 내용에 따라 클로드가 스스로 관련 문서·이메일·일정 정보를 찾아 답변에 반영하므로 사용자가 직접 관련 파일이나 자료를 업로드하지 않아도 된다.

글. 바이라인네트워크
<이병찬 기자>bqudcks@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다