정말 ‘Deep’한 딥엘…이미지 번역은 파파고
미국이나 영국에서 태어났다면 얼마나 좋을까. 영어를 만든 사람은 누굴까. 아니 왜 우리 부모님은 날 한국에서 낳아 이 고생을 시키나. 아니 뭐 어디서 태어나도 마찬가지겠지. 신은 왜 지구를 낳고 서로 다른 언어를 낳았나… 쓸데없고 애 먼 원망을 해보지만 섭리를 바꿀 수 없는 일이다.
“우리는 방법을 찾을 것이다. 늘 그래 왔듯이”
인터스텔라의 명대사처럼 인간은 정말 우주와 같은 인공지능(AI) 기술로 방법을 찾았다. 파파고와 구글 번역이라는 기술의 총아에 머리를 조아린다. 더 말할 필요도 없는 글로벌 시대. 우리나라 또한 한글을 다른 나라 언어로 번역하는 일이 필요한 상황. 기업은 물론이고 리포트나 공부에까지 AI 번역 솔루션이 활용된다.
현재 우리나라 AI 기반 번역 서비스 시장은 네이버 파파고와 구글 번역의 양강 체제다. 이 중에서도 2017년 출시한 파파고는 토종 프리미엄을 등에 업고 번역 서비스의 대명사로 자리 잡았다. 네이버 또한 국내에서만큼은 1위라고 자신 있게 주장하는 상황.
그러던 중 올 초부터 한 독일 기업의 이름이 들려오기 시작했다. 사람이 말하는 것처럼 번역해 준다는 소문이 퍼졌다. 낯선 이름의 독일기업 ‘딥엘(DeepL)’이 만든 동명의 서비스가 삽시간에 파파고의 자리를 넘본다.
“파파고 돌리면 되지”라는 구글도 깨지 못한 심리적 마지노선을 “딥엘 한 번 더 해봐”로 바꾸고 있는 비결은 무엇일까. 정말 파파고보다 나을까? 아님 그냥 신선해서 좋아 보이는 걸까?
다른 신경망 모델
딥엘은 지난 1월부터 한국어를 지원하기 시작했다. 4개월 남짓 시간이지만 ‘파파고보다 자연스럽다’는 이야기가 쏟아지며 단숨에 핫한 솔루션이 됐다. 뉘앙스나 맥락을 파악하는 성능이 뛰어나다는 게 다수의 평가다.
우선 번역에 사용하는 신경망 모델을 들여다봐야 한다. 딥엘은 최근 한국 미디어 대상 간담회에서 트랜스포머(Transformer) 아키텍처의 일부 어텐션(Attention) 매커니즘을 차용했다고 밝혔다.
야렉 쿠틸로브스키(Jarek Kutylowski) 딥엘 최고경영자(CEO)는 세밀한 기술 스택에에 대한 질문에는 입을 닫았지만, 시장은 합성곱 신경망(CNN·Convolutional Neural Network) 방식을 고도화해 적용한 것으로 본다. 문장을 병렬로 번역하고 서로 거리가 떨어진 단어의 연관성을 분석해 이해 능력을 높인 모델이다. 단어 하나하나의 의미를 적확하게 인식한 뒤 다시 조합하는 형태다.
파파고는 문장을 순서에 따라 읽어내려가며 단어 간 연결 고리를 파악해 번역하는 순환신경망(RNN·Recurrent Neural Network) 방식을 쓴다. 쉽게 이야기하면 사람처럼 눈으로 글을 쭉 따라가며 번역하는 형태다. 구절이나 어순 정보 등을 종합적으로 고려해 번역한다.
문장 반영은 파파고, 자연스러움은 딥엘
백문이 불여일견. 영한, 한영 번역을 각각 돌려봤다. 비즈니스 문구를 시험해 봤다. 행사 준비를 한다고 치고 참석 요청문을 적었다.
파파고는 풍성한 프로그램을 ‘Rich Program’으로, 딥엘은 ‘great program lined up’으로 번역했다. 사전적으로 모두 크게 문제가 없지만, 준비한(또는 짜놓은) 뛰어난 프로그램을~이라고 답한 딥엘이 조금 더 자연스럽다. 리치에도 풍요롭다는 뜻이 있긴 하지만 부유한, 돈이 많은 느낌이라 다소 어색하다.
또 파파고는 참석해 자리를 빛내 주시면 감사드린다 부분을 ‘if you could attend and shine(당신이 참석하고 빛내준다면)’으로 세세하게 적었고, 딥엘은 ‘we hope you’ll join us(당신이 저희와 함께 해주시길 바라)’로 담백하게 번역했다.
문법 반영도 조금 달랐는데, 파파고 답변의 if you could~’는 완곡한 톤의 “오는 게 가능하면 와 달라“정도의 느낌이고 빛내다를 shine으로 그대로 붙인 터라 다소 딱딱하다. 함께하길 hope하는 딥엘이 더 자연스럽다.
정리하면 단어 자체의 뜻을 살린 번역은 파파고가 낫고, 딥엘은 글맛(또는 말하는 맛)을 살린 형태다. 문장을 쭉 읽어나가는 RNN 모델과 단어간의 연관성을 따져 톤을 조절하는 CNN모델의 특성이 드러나는 부분이다.
반대로 영한 번역은 어떨까. 업무환경이라면 영작보다는 해외 자료를 우리말로 번역해 보는 경우가 더 많다. 상단 사진은 최근 마이크로소프트가 ‘업무동향지표(Work Trend Index) 2023’을 발표하며 담은 샤티아 나델라 마이크로소프트 CEO의 워딩이다. 주목할 것은 아래와 같은 후반부 워딩이다.
“디지털 부채를 완화하고, AI 적성을 구축하고, 직원들에게 권한을 부여하는 데 도움이 되는 AI 기반 도구에 대한 엄청난 기회가 있습니다.”_파파고
“AI 기반 도구가 디지털 부채를 완화하고, AI 적성을 키우고, 직원의 역량을 강화하는 데 도움이 될 수 있는 엄청난 기회가 있습니다.”_딥엘
주어(AI 기반 도구)가 앞에 온 딥엘이 훨씬 우리말 같다. AI가 일하는 힘을 키운다는 게 골자기 때문에 파파고 버전의 ‘권한’보다는 ‘역량’이라고 분석한 딥엘이 이 또한 적확하다.
실제 한국마이크로소프트는 공식 보도자료에서 “AI 기반의 도구들은 디지털 부채(Digital Debt)를 완화하고, 직원들의 AI 적성과 역량 강화를 돕는 등 막대한 기회를 제공한다”라고 번역한 보도자료를 제공했다.
번역 품질 관리는 어떻게?
딥엘과 파파고의 품질 개선 모델에는 차이가 있다. 딥엘의 쿠틸로브스키 CEO는 간담회에서 “인터넷상에 공개된 한국어 데이터를 크롤링해 AI모델 학습에 사용했다”며 “절대적 데이터량보다는 어떤 번역이 맞는지 집중하고, 어떤 데이터가 우리 모델을 학습하는 데 적합한지 파악하는 데 많은 투자를 했다”고 말했다.
번역 데이터를 자동으로 찾아 품질을 평가하는 자체 크롤러 활용을 비롯해, 번역 데이터를 반복 대조하고 가중치를 조절해 지도학습을 한다는 설명이다. 쿠틸로브스키 CEO는 또 “한국어에 능통한 직원과 에디터를 채용해 원어민 느낌을 살린 번역을 제공한다”고 설명했다.
파파고는 네이버가 자체 개발한 자동화 품질평가(QE) 모델을 적용한다. 패러럴마이닝(PM)을 통해 대규모 텍스트에서 번역 문장쌍(원문-번역문)을 자동으로 추출, 번역 데이터를 구축하는 데 활용한다. 네이버 관계자는 “단순히 좋고 나쁜 번역인지를 넘어서 성별, 시제, 명사, 숫자, 환각 등 구체적인 오류 유형까지 다방면으로 평가한다”고 말했다.
편의성은 파파고 Win…이미지 강점
번역은 실생활에서도 중요하다. 급히 번역 서비스가 필요할 때가 있다. 낯선 해외 여행지에서 메뉴판을 못 읽거나, 출장길에 이정표를 잘못 보면 낭패다. 딥엘과 파파고는 모두 애플리케이션에서 이미지 번역을 지원한다. 둘 다 앱에서 바로 찍는 방식과 먼저 찍어놓은 이미지 업로드 방식 두 가지를 지원하는데, 편의성은 파파고가 훨씬 앞선다.
이미지에서 빠르게 텍스트를 인식해 바로 번역하고, 해당 이미지 위에 덮어준다. 반면 딥엘은 텍스트 영역을 손으로 직접 드래그해 영역을 줘야 한다. 번역 내용도 한 번 더 터치해 텍스트 창으로 들어가 확인해야 해 불편하다.
이처럼 파파고가 이미지 번역에 강한 건 네이버가 자체 개발한 HTS, 인페인팅, 텍스트 렌더링 기술 때문이다.
HTS는 이미지 내의 디자인과 문장 구조를 분석, 번역해야 하는 텍스트를 찾는 딥러닝 모델이다. 딥엘처럼 따로 글자 영역을 지정할 필요 없이 바로 인식한다. 단순히 문자를 검출하는 게 아니라 문맥 요소를 고려하기 때문에 높은 번역 성능을 낸다는 게 네이버의 설명이다.
인페인팅 기술은 번역 결과를 자연스럽게 합성하기 위한 이미지 배경색을 만드는 데 쓰인다. 텍스트 렌더링은 인페인팅이 만든 배경 위에 원본과 색상과 폰트가 흡사한 텍스트를 덮어 최대한 원본 느낌을 살리는 데 활용한다.
네이버 관계자는 “다양한 변수를 고려해 자연스러운 배경 이미지를 만들어 낼 수 있다”며 “원문 스타일을 최대한 살린 번역 결과를 선보이는 것이 특징”이라고 말했다.
한편 딥엘과 파파고 모두 웹 버전에서 문서 파일 번역을 지원한다. 딥엘이 지원하는 문서 포맷은 PDF와 워드(.doc), 파워포인트(.pptx) 세 가지다. 파파고는 워드와 파워포인트를 비롯해 엑셀(.xlsx), 한글(.hwp)까지 지원한다. PDF는 앱의 이미지 번역 모드에서 불러와 번역할 수 있다.
파파고는 또 웹 버전에서 필기입력을 제공하는 한편, 외국어로 번역했을 때는 해당 문장의 한글 발음을 제공해 토종 번역 서비스의 이점을 잃지 않는다.
글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network