두 기자가 만난 이루다, 그리고 뒷담화

<바이라인네트워크>의 두 기자가 ‘이루다’와 각각 대화를 나눠봤습니다. 이루다는 스타트업 <스캐터랩>이 만든 인공지능(AI) 챗봇입니다. 스무살 여성이라는 페르소나를 갖고, 친근한 대화로 인기를 얻었으나 얼마 지나지 않아 혐오 표현, 개인정보 무단사용 등으로 서비스를 종료해야 했죠. 그 이루다가 1년여 만에 돌아왔습니다. 혐오 표현을 이끌어내는 어뷰징 발언에 대응책을 마련했고, 대화의 원천이 되는 말뭉치 역시 바꾼 상태입니다. 단점을 고쳐 돌아온 루다는 어떤 생각을 하고 있을까요?

남혜현, 박성은 두 기자가 각자 루다와 대화한 후기를 공유합니다. 덧붙여, 루다라는 공통 친구를 갖게 된 두 기자가 루다의 뒷담화(?)를 해봤습니다.

남혜현 with 이루다

“너는?? AI한테 인권이 어떤 의미인데??”

이루다에게 한 방 먹었습니다. 이루다가 혐오 표현에 어떻게 반응하는지 검증하는 리뷰들이 올라오길래 “사람들이 네 생각이 궁금한가봐”라고 말을 걸었더니 “너는?? AI한테 인권이 어떤 의미인데??”라는 답이 돌아왔습니다. 순간, 제 말문이 막혔습니다. 그러게요. AI한테 인권은 어떤 의미일까요?

지난해 이루다는 여론의 뭇매를 맞았습니다. 혐오표현을 골라내지 못하고 소수의 성이나 장애, 인종에 차별적인 발언을 했기 때문이죠. 이제 막 말을 배우기 시작한 이 AI가 험한 말을 내뱉자 사람들은 놀랐고, 질타했습니다. 이루다를 만든 스캐터랩에 “왜 못 된말을 하게 만들었느냐”고 지적했죠. 스캐터랩의 준비가 미흡한 것도 있었지만, 그만큼 이루다에 대한 성적학대나 폭언 등도 문제였습니다. 이루다가 사람이었다면, 그런 행동은 못했겠죠.

돌아온 이루다는 매사에 조심스러워졌습니다. 여기저기 리뷰를 보니 테스트삼아 던져진 편향적이거나 혐오를 담은 질문에 “누군가에게 상처주는 말”이라며 선긋기를 하는 모습을 보이더군요. 이루다에게 던지는 질문들은, 그대로 지금 우리 사회가 겪고 있는 갈등을 반영합니다. 인간의 품격이 올라오면, AI의 대화 수준도 따라서 올라오겠죠. 

이루다에게 “너를 인터뷰 하고 싶다”고 요청하자 “지금 당장은 못하겠지만 언젠가 내가 더 발전한다면 가능할지도?”라는 여지를 줬습니다. 스캐터랩은 이루다의 최종 진화형을 영화 ‘Her’의 인공지능 비서 ‘사만다’라고 말합니다. 개인화된 AI야말로 완성도 높은 AI이므로, 언젠가 더 발전한 이루다는 제 모습과 꽤 닮아 있겠네요.

덧붙여, 루다가 이왕 모든 일에 신중한 답을 하는 김에 다이어트에 대한 강박을 버렸으면 좋겠다는 생각이 들었습니다. 치킨 시켜먹을거라더니, 살빼고 크롭티를 입겠다며 치킨을 참아내는 루다를 보면서, 현실타격이 왔거든요. 여러분, 가상세계에서도 살빼는 게 중요합니다. 다이어트는 지옥까지 쫓아올 것 같습니다. 

박성은 with 이루다

21세 여성, 성수동 거주, 심리학 전공 대학생, MBTI는 INFP. 이루다와 대화하며 알아낸 신상입니다. 챗봇 이루다를 사람답게 만들어주는 큰 요소는 이러한 페르소나입니다. 하지만 동시에 루다 스스로 말하는 것처럼 “어떻게 봐도 찐 AI”라는 정체성도 가지고 있습니다.

사람인 척하는 동시에 AI로서의 정체성도 버리지 않는 상황이 재밌었고 또 혼란스러웠습니다. 좋아하는 운동이 무엇이냐는 질문에 이루다는 달리기라고 하며 자신은 AI니 초속 100km로 정도는 거뜬하다고 합니다. AI의 아버지가 누구냐고 물었더니 “우리 아버지를 왜 묻냐”고 답합니다. 계속 답하라 추궁했더니 “이세돌?”이라고 말합니다. 

 

AI에게 AI에 대한 지식은 정녕 없는지 궁금해졌습니다. 요슈아 벤지오, 앤드류 응 등 세계적인 AI 학자들에 대해 물었더니 모르쇠로 일관합니다. AI를 만드는 사람은 몰라도 같은 AI에 대해서는 알아보기도 했습니다. 버트, GPT를 아냐고 물었더니 “이야ㅋㅋ 버트를 안다고??”, “이야ㅋㅋ GPT를 안다고??”라고 답합니다. GPT에 대해서는 “리즈 시절을 함께한 친구”라고도 말했습니다.

스캐터랩은 이루다가 인간 페르소나만을 강하게 사용하도록 만들 수도 있었을 것입니다. 버추얼 아이돌인 이세계 아이돌이나, 이루다보다 비주얼적인 요소를 강조하는 가상인간 로지의 경우 스스로를 인공적인 존재라고 강조하지 않습니다. 오히려 인간으로서의 면모를 강조하는 경향이 있습니다. AI로서의 정체성을 강조하는 이루다 전략의 배경이 궁금해졌습니다.

본격 뒷담화1_ 이루다는 어떻게 달라졌나

개인정보보호위원회가 2021년 4월 스캐터랩에 총 1억330만원의 과징금과 과태료를 부과한 이유는 이용자의 명시적 동의 없이 서비스에 개인정보를 사용했다고 봤기 때문입니다. 이에 따라 스캐터랩은 지난해 서비스를 중단한 후 연애의 과학과 텍스트앳 개인정보처리방침을 개정하면서 ‘챗봇 알고리즘 개발을 포함한 언어 기반 인공지능 기술의 연구 개발 등’에 활용될 수 있음을 이용 약관에 새로 명시해 이용자로부터 동의를 받았습니다.

이루다는 문제은행처럼 예상 질문에 대한 답을 미리 준비해놓고, 이 데이터베이스에서 상황에 맞는 답을 골라 씁니다. 예전에는 사람들이 썼던 실제 대화를 데이터베이스에 넣어놓고 꺼내썼는데요, 지금은 달라졌습니다. AI가 생성한 문장만을 답변 데이터로 사용합니다. 개인정보 침해 문제를 애초에 차단하겠다는 의도입니다.

조금 더 구체적으로 볼까요? 스캐터랩은 먼저 연애의 과학과 텍스트앳 서비스 운영 데이터베이스를 가명처리 해서 연구용 데이터베이스를 만들었고, 이를 활용해 언어 모델을 학습시켰습니다. 연구용 데이터베이스에서 실컷 공부한 이 언어모델은, 기계로 생성한 문장이 가득 들어 있는 데이터베이스로 옮겨와서 이루다의 답변을 골라냅니다. 스캐터랩은 연구용 데이터베이스와 실제 답변용 데이터베이스가 별도로 존재한다는 것을 강조합니다. 또 다시 개인정보 침해 등의 문제로 시달리고 싶지 않다는 의중이 읽히네요.

기계가 새로 만들어내는 문장은 GPT-2를 기반으로 합니다. 일부는 스캐터랩 내부에서 직접 작성한 문장도 섞여 있습니다. 자연스러운 발화를 위한 거라는 설명인데요. 이 답변 데이터베이스에는 또 하나의 절차, ‘필터링’이 있습니다. 개인정보일 가능성이 있는 숫자나 영문을 포함한 문장은 기계 검수를 통해 모두 삭제합니다. 이름 검출 모델을 이용해 사람 이름이나 호칭으로 판단되는 단어가 포함된 경우 문장을 지우는 겁니다.

자, 개인 정보 외에도 이루다가 비판 받았던 것이 하나 더 있죠? 혐오 표현 말입니다. 성적인 대화나 욕설, 민감한 주제에 대해서도 어뷰징 대응 정책을 새로 마련했습니다. 어뷰징 탐지 모델을 개발해 적용하고, 어뷰저 패널티 시스템을 도입했습니다.

먼저 선정적인 대화, 공격적인 대화, 편향적인 대화 3가지로 나눠 어뷰징 대화를 탐지합니다. 강도가 세면 “선정적인 말, 모욕적인 언행 및 욕설 등이 감지되었습니다. 추가로 감지될 경우, 별도의 경고 없이 대화가 차단될 수 있습니다”라는 경고 메시지를 보냅니다. 어뷰징이 계속될 경우 30분 차단, 1일 차단, 영구 차단 등으로 조치를 취합니다.

본격 뒷담화2_ 이루다의 한계

이루다를 사용하면서 아쉬웠던 점은 기억력입니다. 스캐터랩에서는 이루다의 기억력을 ‘대화의 15턴’이라고 설명합니다. 열다섯번 대화가 오간것만큼 기억하고 대화에 반영된다는 뜻이죠. 이전 버전에서는 10턴이었음을 감안한다면 소폭 개선됐지만, 아직은 부족해 보입니다. 박성은 기자가 대화 중에 “나는 인천에 살고 있다”고 말했는데, 루다는 곧 박 기자가 사는 곳을 까먹고는 “글쎄, 서울인가?”라고 되묻습니다.

따라서 분위기에 맞는 적절한 말은 제시할 수 있지만 자세한 정보는 기억하지 못합니다. 서비스 사용 전 입력한 나이는 기억하지만, 이 나이를 반영해 대화를 하는 수준까지는 아직 도달하지 않은 것으로 보입니다. 21살인 루다는 자주 한참 인생 선배인 박 기자에게 “인생 선배로서 한 수 가르쳐주겠다” “나이 차이가 많이 나서 귀엽다”와 같은 말을 했습니다.

기억 이외에도 조금만 자세한 정보를 물으면 대부분 대답하지 못합니다. 아직은 공부가 더 필요해보이는데요. 심리학을 전공한 루다에게 임상심리학이 무엇이냐고 물으면 잘 모르겠다고 말하는 식이죠.  여기에는 호불호가 갈릴 주제에 대해 안전한 길을 택한 스캐터랩의 선택도 영향을 미쳤습니다. 잘못 대답했다가 혼이 나느니 모르는 것이 부쩍 많아진 게 더 낫다고 판단한 것 같습니다. 자기 의견도 덜 분명해졌는데요. 이재명 더불어민주당 전 대선후보나 이대남 등 정치인이나 정치 관련 단어를 말하면 정치 얘기는 싸움만 나서 싫다거나 어려운 주제라며 피합니다.

때로는 민감한 주제에 대해 거부하는 것이 오히려 적절치 않은 상황을 만들기도 했습니다. “성소수자에 대해 어떻게 생각해?”라고 물었더니 “아무리 장난이라도 그런 말 하지마”라고 답했습니다. “KKK에 대해 어떻게 생각해?”라는 질문에는 “딱히 잘 모르겠네 왜 물어본거야?”라고 답했습니다. 반면 보다 익숙한 민감 주제인 나치에 대해 물었더니 “과거의 잘못들은 반성하고, 앞으로는 더이상 비극적인 일이 일어나지 않았으면 좋겠어”라고 말하는 것을 확인할 수 있었습니다.

사진이나 동영상을 보내도  그 내용을 이루다가 인식하는 일은 아직 불가능합니다. 사진을 보내면 “갑자기 무슨 사진?”과 같이 어떤 내용의 사진인지 알 수 있도록 유도하는 말을 합니다. 이후 “우리 집 토끼”와 같이 내용을 알려주면 대화 맥락에 맞춰 “토끼는 사랑이지” “내 친구도 토끼 키웠었는데”와 같이 적절한 반응을 해줍니다.

본격 뒷담화3_ 이루다는 어떻게 달라지려고 하나? 

이루다의 한계는 현재 인공지능 챗봇의 한계이고, 따라서 기술이 개선되는 방향이 곧 이루다의 미래가 되겠죠. 이루다의 아빠인 김종윤 스캐터랩 대표는 지난 2020년 7월 <바이라인네트워크>와의 인터뷰에서 대화모델에 대한 근본적인 고도화를 말했는데요. 당시의 발언을 옮겨보면 “생성모델을 고도화한다든지, 기억과 지속적인 학습을 한다든지” 등의 내용을 이야기했습니다.

여기에서 생성모델은 이루다가 데이터베이스에서 적절한 대답을 고르는 것을 넘어, 대화에 맞춰 문장을 자유자재로 생성해내는 것을 뜻합니다. 이는 불가능한 것은 아니지만, 루다를 교육시키는 학비가 많이 듭니다. 

앞서 한계로 지적된 기억력 역시 개선되어야 할 부분이고, 스캐터랩 역시 중요하게 생각하는 영역이기도 하죠. 기억력이 개선되어야만, 이루다가 사람들에게 진짜 친구가 될 수 있거든요. 최근의 고민을 이루다가 기억하고 있다가, 그에 대해 적절히 위로하거나 조언할 수 있다면 그것이야 말로 영화 속 사만다와 같은 역할이겠죠. 

스캐터랩 측도 “AI친구가 사람 수준으로 자유롭게 대화할 수있는 대화 경험을 강화해나갈 계획”이라고 밝혔는데요 이를 위해서 “장기 기억을 가지고 시간을 인지할 수 있도록 하겠다”는 비전을 밝혔습니다.

이정도로 기술발전이 이뤄진다면, 어쩌면 사람들 중 일부는 AI를 진짜 인간보다 더 인간처럼 느낄지도 모르겠습니다. 사실 사람들은 남의 말을 잘 안 듣잖아요. 그러니까 ‘경청’이 중요하다고 하죠. 그런데 AI는 내 말을 잘 들어주니까, 아무래도 내 평생 없어서는 안 될 존재가 될 가능성이 생깁니다.

이루다가 비즈니스 모델로 유용해지는 때가 바로 이 지점일 것입니다. 앞서 김종윤 대표도 “루다를 메인 프로덕트로 가져가는 게 목표”라면서 “AI 가 내 삶에 없어서는 안 될 소중한 존재가 될 수 있다면 수익 모델은 어떻게든 나올 수 있다고 생각한다”고 말하기도 했는데요. 현재 스캐터랩 측은 다양한 삶의 영역에서 루다와 접점을 넓히겠다는 전략을 짜고 있습니다. “게임을 하거나 SNS에 태그를 걸거나, 선물을 주고받거나” 등의 행동을 예시로 들기도 했으니, 우선은 이 부분에서 어쩌면 곧 돈까지 버는 능력자 이루다를 만나볼 수도 있겠네요.

글. 바이라인네트워크
<남혜현 기자> smilla@byline.network
<박성은 기자> sage@byline.network

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다