| |

[까다로운 리뷰] 스테이블 디퓨전 AI로 자료 사진을 만들어봤다

YouTube video

안녕하세요. 이종철의 까다로운 리뷰. 오늘은 컴퓨터로 이미지를 생성해보겠습니다. 여러분은 유튜브 개그맨이라고 아시겠지만 저도 원래 직업이 있는데요. 이 직업에서는 이미지 사용이 필수입니다. 그래서 생성 AI가 처음 등장했을 때 와 이제 삽화 같은 거 만들어서 쓸 수 있겠다 했는데 달리2, 미드저니 같은 이미지들은 지나치게 몽환적이었습니다. 좀 판타스틱하고 그렇지만 이미지 자료로 쓰기엔 애매했어요. 저는 그런 판타스틱한 일을 하지는 않기 때문입니다. 그러다 최근 AI 그림이라고 실사에 가까운 게 돌아다니는 겁니다. 이거면 된다 싶어서 알아봤습니다.

이건 스테이블 디퓨전이라고, 자신의 PC에서 구동할 수 있는 소프트웨어입니다. 그래서 좋은 GPU가 있어야 하고요. 물론 구글 Colab 같은 걸 쓰면 구글의 PC를 원격으로 임대해서 좀 쓸 수 있긴 한데 이쪽은 돈을 좀 내야 합니다. 하여튼 저는 RTX3050 쓰거든요. 비싼 제품은 아닌데, 어쨌든 돌아갑니다. 스테이블 디퓨전은 원래 거의 코딩 툴 같은 거였는데 어떤 분이 웹 인터페이스를 만드셨어요. 그래서 이 인터페이스 위에서 변수, 프롬프트라고 부르는데요. 프롬프트를 입력해서 만들고 싶은 걸 만들면 됩니다.

근데 이게 프롬프트 배우기가 처음엔 어렵거든요. 그래서 프롬프트 공유 사이트 같은 데 들어가서 다른 분들이 공유해준 거 보면서 조금씩 배웠습니다. 어렵긴 하지만 포토샵, 프리미어보다는 쉬워요.

처음에 단순히 프롬프트만 입력하면 이상한 그림이 나오거든요. 그래서 모델을 학습시켜줘야 되는데, 제가 뭘 안다고 모델을 학습시키겠습니까? 그래서 시중에 있는 바질믹스, 오렌지믹스, 칠아웃믹스를 다운받아서 섞어서 씁니다. 이거 다 무료로 공개돼 있거든요. 세상에 참 좋은 분들이 많습니다.

모델만 넣으면 확 달라집니다. 달리 2에 은행에 달려가는 남자들 이렇게 검색하면 스톡 사이트에서도 못 팔 것 같은 이런 이미지가 나오는데요. 스테이블 디퓨전에서는 그럭저럭 나오죠. 조금 더 변수를 심화해서 써보면 더 그럭저럭 괜찮은 결과물이 나옵니다. 근데 안 달리잖아요. 그래서 오픈 포즈 에디터라는 걸 추가 기능으로 설치할 수 있는데, 이걸 설치해서 인터넷에서 달리는 그림을 가져와서 포즈를 따줍니다. 이걸로 그림을 그리면 얼추 원했던 게 나오죠.

사실 제가 일주일 내내 연습했던 건 ‘미쳤습니까 휴먼?’ 짤입니다. 잘 아시죠? 그래서 안드로이드 관련 프롬프트를 입력했고요. 얼굴은 얼추 됐는데 이걸 해야되잖아요. 그게 안 되는 겁니다. 제가 학습한 과정을 보시죠.

멋있지 않습니까?

그런데 아무리 해도 손이 안 올라가는 거에요. 손 올리라니까 자꾸 이런 게 나왔고요. 그래서 아까 그 오픈 포즈 에디터로 이런 짤을 만들었습니다. 이걸 갖고 돌려봤어요. 멋은 있는데 미쳤습니까 휴먼이 안 되고 있죠? 그래서 포즈도 넣고 짤도 넣어봤는데

오른쪽 보라고

경례 말고 고민하라고

뭐야 이건

미쳤습니까 로봇?

고민하라고 고민. 탄산수 왜 마시는데?

꽃받침 말고 고민하라고

자, 결론 내립니다. 짤 만들기 어렵습니다.

대신 예쁜 그림을 얻었네요.

자, 아직 자료로 쓰기엔 부족하죠? 스테이블 디퓨전 최대 단점이 모델 기반 학습이기 때문에 모델이 없으면 결과물이 잘 안 나옵니다. 일단 남성 모델이 부족하고요. 중년 이미지도 잘 안 나옵니다. 그리고, 좀 야해요.

그런데 모델이 충분히 있는 경우에는 이미 활용을 하고 계시는 분들도 많습니다. 제가 이미 이 스테이블 디퓨전으로 만든 광고 사진을 봤어요. 물론 이게 큰 해상도로 보여주면 어디선가 단점이 보이거든요. 그래서 그 회사는 배너로만 쓰고 제품은 포토샵으로 입혀서 쓰고 있었습니다. 만약 디자이너가 한명이다 이러면 꽤 좋은 해결책이 되겠죠.

제가 이 그림 생성을 보면서 놀란 건, 1주일마다 퀄리티가 비약적으로 발전한다는 겁니다. 처음 접했을 때는 그림이었고, 점차 반실사가 되더니 이제는 거의 실사에 근접했죠. 이건 AI 회사만 잘한 게 아닙니다. 프롬프트를 연구하고 개발하는 유저들도 많은 고민을 같이한거죠. 그래서 더 빨리 수준이 올라온 겁니다. 아마 한 두어달 뒤쯤이면 더 훌륭한 이미지들이 많이 나올 것으로 예상합니다. 저는 이제 10일 정도 연습했고요. 두어달 정도 더 연습하면 여러분께 좋은 퀄리티의 이미지 보여드릴 수 있을 것으로 예상합니다.

자, 반실사 이미지가 필요하신 여러분, 좋은 컴퓨터와 GPU를 갖추신 분, 스테이블 디퓨전. 하세요. 저도 연습을 많이 해서 AI로 영상 때우겠습니다. 그럼 그날까지 구독, 좋아요, 알림 설정.

영상제작. 바이라인네트워크

촬영·편집. 바이라인네트워크 영상팀 byline@byline.network

대본. <이종철 기자>jude@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다