Dall-E 말고 미드저니 말고 , 카카오 ‘비 에디트’
기자 업무 중에는 이미지를 다루야할 때가 많다. 텍스트가 아닌 이미지로 전달할 때 더 잘 전달될 때가 있기 때문이다. 기사를 작성하다가 이미지를 조금만 수정하고 싶을 때가 있다. 중간에 다른 그림을 넣거나, 지금 이미지를 바탕으로 더 큰 그림을 새로 만들고 싶을 때도 있다. 하지만 나는 이미지를 다루는 전문가가 아니다. 디자이너나 이미지를 잘 다루는 누군가의 손을 빌려야 했다. 하지만 이미지 생성 인공지능(AI) 서비스가 다수 등장하고 있기 때문에, 앞으로는 AI가 이런 일을 대신 해줄 수도 있을 것이다.
AI의 힘을 빌린다면 얼마나 예쁜 이미지가 만들어질 지 궁금해졌다. 그것도 국내 기업이 만든 생성AI 솔루션으로 말이다.
카카오브레인은 최근 이미지 생성AI 서비스 ‘B^ EDIT(비 에디트)’를 출시했다. 모바일에 특화했던 비 디스커버에 이은 새로운 이미지 생성AI 서비스다. 이미 시장에는 달리2와 스테이블 디퓨전, 미드저니 등 다양한 솔루션이 나와있는 상황. 카카오브레인은 어떻게 차별화하고 어떤 기능에 방점을 찍었을까. 직접 사용해봤다.
비 에디트는 웹 기반으로 돌아간다. 이 점에서는 다른 솔루션과 크게 다르지 않다. 달리2와 같이 제작한 이미지에 또 다른 프레임을 붙여 그림을 이어나가는 기능 또한 갖추고 있다.
비 에디트가 가장 앞서는 건 ‘화풍’이다. 3D렌더를 비롯해 아크릴 회화, 만화체, 색연필, 사이버펑크, 큐비즘 등 무려 30가지의 스타일 옵션을 지원한다. 아기자기한 그림이나 네온 색채가 강한 강렬한 그림 등 원하는 사용 방법에 따라 그림 스타일을 고를 수 있다.
카카오브레인은 “1억8000만장 규모의 이미지 데이터셋을 활용한 거대 생성AI 모델 칼로를 활용했다”며 “생성한 이미지를 이용자 의도에 따라 편집할 수 있다”고 설명했다.
프롬프트 입력에 따른 기본적인 이미지 생성을 바탕으로, 주목할 만한 사용법은 크게 두 가지다. 그림을 연속적으로 생성해 이미지를 확장하는 ‘아웃페인팅’과, 특정 영역을 지정해 새로운 이미지로 채우는 ‘인페인팅’이다.
우선 아웃페인팅은 이미지를 섞는 능력이 눈에 띈다. 달리2에도 있는 기능이지만 보다 배경을 자연스럽게 인식해 이질감을 줄여준다. 단, 이미지를 합치는 데는 좋지만 프롬프트를 후순위에 두는 점은 고려해야 한다. 새 프레임을 옆에 덧대고 다른 내용의 프롬프트를 넣었지만, 프롬프트 내용보다 그림을 잇는 데 집중하는 모습이다. .
인페인팅은 허전한 이미지를 채우는 데 좋다. 만약 두 사물이 있는 이미지가 있고 그 가운데 새로운 오브젝트를 끼워넣을 때 쓰면 유용하다. 이미지 중간이 허전하다면 해당 공간에 프레임을 가져다놓고 새 프롬프트를 입력해 이미지를 생성하면 된다.
다만 조화로움을 원한다면 화풍 옵션을 통일해야 한다. 스타일 옵션의 다양성이 되레 이미지를 해칠 수 있다. 기존의 이미지와 같은 화풍을 선택해야 자연스러운 인페인팅 이미지가 완성된다.
비 에디트는 이 밖에도 ‘CS2I(Color Sketch To Image)’ 기능을 지원하지만 아직은 미흡하다. 이미지에 프레임을 덧붙여 놓고, 펜으로 그림을 그린 뒤 이를 바탕으로 새로운 이미지를 만드는 기능이다. 예컨대 석양이 진 해변 그림에 빛나는 별을 넣고 싶다면 내가 원하는 방식으로 스케치를 그리고 이를 바탕으로 이미지를 생성할 수 있다. 하지만 스케치 모양을 뭉뚱그리거나 비슷하게 따라그리기만 할 뿐 배경과 잘 섞이지 않는 경우가 자주 발생했다.
기능 모두 이미지 생성에는 10초 안팎이 걸렸다. 기본 이미지 생성 갯수는 8개로, 최대 32개까지 만들 수 있다. 이미지 저장은 생성한 이미지 원본 뿐 아니라 원하는 부분을 크롭하는 것도 가능하다. 저장 포맷은 PNG다.
카카오브레인은 현재 오픈 베타 서비스를 통해 이용자 피드백을 받는 중이다. 베타 마감 기간은 미정이다.
글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network