“라떼는 말이야”…엔비디아, 3D 그래픽 생성AI 공개

엔비디아가 텍스트로 입력한 내용을 3D 그래픽으로 바꿔주는 생성 인공지능(AI)을 공개했다. 동물과 사물 그래픽 제작에 특화한 AI 모델이다.

엔비디아는 25일 이미지 변환 생성AI 모델 ‘라떼3D(Large-scale Amortized Text-To-Enhanced3D Synthesis·LATTE3D)’를 공개했다.

라떼3D는 텍스트 프롬프트를 받아 1초 안에 사물과 동물의 3D 그래픽 초안을 만들어준다. 표준 렌더링 애플리케이션에 널리 사용되는 포맷을 적용해 비디오 게임, 광고 캠페인, 디자인 프로젝트 등을 위한 가상 환경을 쉽게 구현할 수 있다는 설명이다.

엔비디아 AI 리서치 담당 부사장인 산자 피들러(Sanja Fidler)는 “1년 전만 해도 AI 모델이 이 정도 품질의 3D 비주얼을 생성하는 데 1시간이 걸렸지만, 이제는 10~12초 정도면 충분하다”며 “훨씬 더 빠른 속도로 결과를 생성할 수 있게 되면서 업계 전반의 크리에이터들이 거의 실시간으로 텍스트를 3D로 생성할 수 있게 됐다”고 밝혔다.

사용자는 처음부터 디자인 시안을 만들거나 하거나 3D 에셋 라이브러리를 일일이 찾아보는 대신 라떼3D를 사용해 머릿속에 떠오르는 아이디어를 즉시 디자인 개체로 만들 수 있다.

텍스트 프롬프트에 따라 몇 가지 다른 3D 모양 옵션을 생성해 사용자에게 선택권을 제공한다. 사용자가 최종 선택한 선택된 개체는 더 높은 품질의 최종본으로 만들어준다.

사용자는 해당 그래픽을 그래픽 소프트웨어 애플리케이션이나 엔비디아 옴니버스(Omniverse)와 같은 플랫폼으로 전송할 수 있다. 이를 통해 오픈USD(Universal Scene Description) 기반 3D 워크플로우와 애플리케이션을 사용할 수 있다.

연구진은 동물과 일상 사물이라는 두 가지를 축으로 라떼3D의 데이터세트를 훈련시켰다. 예를 들어, 3D 식물 데이터세트를 훈련한 라떼3D 버전은 조경 디자이너가 고객과 브레인스토밍하면서 정원 렌더링을 빠르게 제작하는 데 도움을 줄 수 있다. 사물에 대해 훈련한 모델은 집을 3D 시뮬레이션으로 채울 아이템을 생성할 수 있다.

라떼3D 훈련에는 엔비디아 A100 텐서 코어(Tensor Core) 그래픽처리장치(GPU)를 사용했다. 이 밖에도 챗GPT를 통해 생성된 다양한 텍스트 프롬프트를 훈련했다.

글. 바이라인네트워크
<이진호 기자>jhlee26@byline.network

관련 글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다