텍스트를 편집했는데, 저절로 영상까지 편집된다고?

인공지능을 활용해 집에서 누구나 할 수 있는 꿀알바를 바이라인네트워크 독자에게만 특별히 소개합니다.

먼저 브류(VREW)라는 프로그램을 알아야 합니다. 브류는 ‘보이저엑스’라는 회사에서 개발 중인 영상 편집 프로그램입니다. 세이클럽과  B612 개발에 참여한 남세동 씨가 창업한  회사입니다.

브류를 한국어 버전으로 열면 나오는 이 아조씨가 남세동 개발자입니다.

꿀알바는 뒤에서 설명할게요.

브류는 영상에 있는 음성을 인공지능으로 인식하고 텍스트로 옮겨줍니다. video를 맥주처럼 brew한다는 뜻으로 VREW라고 이름을 붙였답니다. 묘하게 아재 같으면서 힙한 느낌입니다. 음성인식률이 유튜브 자동 한글자막보다 나은 것 같습니다. 구글 뭐합니까?

가장 중요한 건 공짜라는 점입니다.

제가 지금 직장으로 이직하기 직전 6명을 각각 40분 정도 인터뷰하고 5분 분량 콘텐츠 2편을 제작할 일이 있었습니다. 약 4시간 분량의 인터뷰를 5분으로 압축하려면 긴 인터뷰 중에서 어떤 부분을 인터뷰로 내보낼지 결정하는 것이 중요합니다.

4시간짜리 영상을 여러 번 다시 보면서 편집점을 찾는 건, 시간이 많이 걸리고 집중력도 계속 떨어져 정말 고된 노동입니다. 그래서 인터뷰이의 말을 전부 글로 받아 적고 여러 번 읽으면서 거기서 편집점을 찾는 게 효율적입니다. 근데 받아 적는 일이 두 배는 더 고된 노동입니다.

방송사에선 아예 이런 일을 막내작가를 갈아 넣거나 알바를 씁니다. 전문성보단 시간과 끈기가 필요한 막노동이죠. 구성작가협회 게시판에 들어가면 영상 내 소리를 스크립트로 받아 적는 프리뷰 알바를 구하는 글이 계속 올라옵니다.

첫 번째 편은 혼자서 인터뷰이의 말을 모두 받아 적었습니다. 몇 시간 동안 가만히 앉아 영상을 구간 반복하면서 타이핑을 하다 보니 정신이 혼미해지고 손목은 저려오고 다 때려치우고 싶어 졌습니다. 4시간 영상을 이틀에 나눠 받아 적었습니다.

두 번째 편을 편집할 때는 브류를 썼습니다. 인식률이 훌륭했습니다! 점심시간 전에 오타까지 수정하고 받아 적는 일을 끝냈습니다. 체증이 내려가는 기분입니다.

다 받아 적으면 A4 19장 밖에 안 나온다. 별 거 아니다.

사실 영상 내 소리를 텍스트로 옮겨주는 서비스는 브류말고도 더 있습니다. 인식률도 큰 차이가 없습니다.

하지만 브류의 목표와 진가는 단순히 소리를 텍스트로 옮겨주는 데만 있지 않습니다. ‘영상’을 소리로 옮긴 ‘텍스트’ 자체로 ‘영상’을 편집할 수 있죠. 텍스트를 지우면 영상에서 바로 그 부분이 지워집니다. 텍스트의 위치를 바꾸면 해당 텍스트로 옮겨진 영상도 옮겨집니다.

 

이게 왜 대단하냐고요?

기존의 편집 방식은 시간순으로 가로로 늘어선 타임라인을 편집자가 따라가며 편집해야 하는 방식입니다. 말을 버벅거리거나 영상 속 발화자가 말을 쉬는 쓸모없는 구간을 편집자가 시간을 되돌려 재생해 다시 확인하며 하나하나 찾아 편집해야 합니다.

하지만 브류는 영상 속 소리를 텍스트로 보여줍니다. 재생할 필요 없이 말실수한 부분을 텍스트로 바로 확인해 지우면 영상도 편집됩니다. 굳이 재생하지 않아도 어느 부분에서 어떤 말을 했는지 바로 확인할 수 있습니다. 가로축으로 이동하던 편집 방식이 세로축으로 이동하며 직관적으로 편집이 가능한 겁니다. 영상 속 발화자의 언어가 중심인 1인 미디어 영상과 인터뷰 편집에 이보다 더 직관적이고 편리한 편집 방식은 없습니다.

브류는 기존 영상편집 작업 방식을 바꿀지도 모릅니다. 오버하는 거 아니냐고요?

실제로 제 작업 방식이 브류 덕분에 쾌적하게 바뀌었습니다. 프리미어에서 편집 후 애프터 이펙트로 넘어가던 작업 흐름에 브류는 이제 필수입니다.

사실 바이라인네트워크의 모든 영상은 브류의 도움을 받아 제작했습니다.

한 선배가 대학에서 영상 테이프 편집기를 공부했는데 지금 와서 쓸모가 없어졌다고 한탄했습니다. 늦게 태어나서 다행이네요. 테이프 데크와 테이프로 물리적인 방법으로 영상 편집을 하다니. 얼마나 야만적인 방식입니까?

그런데 프리미어 같은 편집 프로그램으로 강을 거슬러 올라가는 연어처럼 영상을 구간 반복하며 타임라인을 몇 번이고 거슬러 올라가는 편집 방식이 미래엔 야만적으로 보일지도 모릅니다. 너무 빨리 태어났습니다. 피처폰과 포토샵 8.0을 썼던 기억과 함께 지우고 싶네요.

이쯤 되니 브류의 비즈니스모델이 궁금해집니다. 브류의 장재화 개발자는 이렇게 말합니다.

“사용자의 단순 노동 시간을 줄여주지도 못 했는데 돈을 벌 생각을 먼저 하는 건 어불성설이라고 생각한다. 지금은 사용자에게 도움이 되는 걸 목표로 하고 있다. 도움이 된다면 자연스레 비즈니스 모델로 연결될 거라 생각한다.”

BM 얘기를 쏟아내다 혼자 신난 장재화 개발자는 브류의 목표를 이렇게 말합니다.

“기존의 영상 편집 프로그램의 양대산맥 파이널 컷과 프리미어는 빵집의 거대한 오븐이라고 생각한다. 대용량에 성능도 훌륭하다. 그러나 어느 정도 숙련되지 않으면 누구나 쓸 수 없다. 그래서 브류의 경쟁상대는 파컷, 프미가 아니다. 브류는 작지만 누구나 쉽게 쓸 수 있는 에어프라이어 기를 지향한다. 방송국 퀄리티는 못 따라가더라도 브류로 누구나 쉽게 영상을 만들어 올리는 세상을 꿈꾼다.

기존 편집 프로그램과 양자택일을 강요하고 싶지 않다. 파컷과 프리미어가 신경 쓰지 않던 곳을 브류로 보완해 사용자에게 도움이 되고 싶다. 브류에서 짧은 시간 동안 컷 편집을 하고, 기획 단계와 영상미를 올리는 섬세한 작업 단계에 더 많은 시간을 투자해 더 좋은 영상을 만드는 것. 단순 노동 시간을 줄이고 더 중요한 창의력에 시간을 투자하도록 도와주는 게 브류의 가장 큰 목표다.”

드디어 인공지능을 이용한 꿀알바를 공개합니다!

당장 위에서 말했던 구성작가협회 게시판에 들어가서 프리뷰 알바를 받읍시다. 그리고 브류에 영상을 넣어 자막을 받으세요. 어색한 부분들을 좀만 더 수정해 보냅시다. 아무도 이런 생각을 안 할 때인 지금이 적기입니다!

혹시 내가 브류에 이용한 영상이 브류의 데이터베이스에 저장되고 인공지능 학습에 쓰이는 게 아닌가 걱정되시나요? 걱정 마세요. 브류는 음성만 추출해 자막 파일을 만들고 로컬에 있는 영상에 붙여 보여준다고 합니다. 사용자의 영상 데이터를 저장도 안 하고 학습에도 쓰지 않는다고 합니다.

하지만 추후에 사용자의 수정 패턴과 데이터를 인공지능 학습에 쓸 수 있도록 허락을 받는 방법을 생각하고 있다고 해요. 만약 그때가 온다면 주저 없이 허락하도록 합시다. 아직 브류는 ‘보이저엑스’를 제대로 인식 못 한다고 합니다. 우리 작업을 획기적으로 도와주는 기특한 녀석이 적어도 부모를 못 알아보는 비극은 막아야 하지 않겠습니까.

부모도 못 알아보는 브류…

유저 간담회에서 뷰티 유튜버 영상을 편집하는 사용자도 ‘이 색은 안 어울려요’ 같은 문장에서 ‘이 색’을 어김없이 ‘이 새끼’로 브류가 인식한다고 토로하네요. 하루빨리 브류가 색맹에서도 탈출하기 바랍니다.

자 이제 모두 들어가서 브류 피드백 메일에 여러 영상을 넣어 교차편집이 가능하도록 멀티캠을 지원해달라고 보냅시다! 왜냐고요? 제가 간절히 필요하거든요. 이 정도 꿀팁을 알려줬는데! 내가 돈도 벌게 해줬는데! 이런 작은 수고도 못 합니까?!

글. 바이라인네트워크
<박리세윤 PD> dissbug@byline.network

관련 글

4 댓글

  1. 안녕하세요 실무자입니다. 궁금한 점이 있어서 댓글 남겨봅니다.
    현실적으로 편집자가 원본 촬영시 자리에 같이하지 않는 경우가 있습니다.
    그럴 경우는 단순히 음성에만 의존하는 것이 아닌 영상미가 있는 걸 살려야할 때도 있는데요. 저런식으로 작업할 경우, 음성부분은 살려야하고 음성이 나오지 않은 부분의 영상미가 필요한 곳이 있을 때 합쳐서 더빙작업을 한다던지 할 경우, 내가 미쳐 확인하지 못한 부분을 자동으로 프로그램이 지워버리는 경우가 생길 것 같은데요? 컷편집을 하기 위해서는 결국에 편집자는 원본영상을 다 봐야합니다..

jonah에 답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다