‘NVIDIA Edify’ 3D 생성형 AI의 새로운 차원을 열다

셔터스톡(Shutterstock)은 3D 생성기와 얼리 액세스를 출시하며, 게티이미지(Getty Images)는 기업 맞춤형 미세 조정 기능을 도입합니다. 어도비(Adobe)와 협력하여 파이어플라이와 크리에이티브 클라우드 이용자에 AI 기술을 제공힙니다. 그리고 비.라이브(Be.Live), 브리아(Bria), 큐브릭(Cuebric) 등이 추론 기능을 위해 NVIDIA Picasso AI 파운드리를 선택했습니다
by NVIDIA Korea

비주얼 생성형 AI를 위한 멀티모달 아키텍처인 NVIDIA Edify가 새로운 차원으로 나아갑니다.

3D 애셋 생성은 Edify가 개발자와 비주얼 콘텐츠 제공업체에 제공하는 최신 기능 중 하나로, 이를 통해 개발자는 AI 이미지 생성을 더욱 창의적으로 제어할 수 있습니다.

멀티미디어 콘텐츠 및 데이터 제공업체인 셔터스톡(Shutterstock)은 Edify 아키텍처 기반으로 만들어진 API(application programming interface)에 대한 얼리 액세스를 제공합니다. Edify 아키텍처는 크리에이터가 텍스트 프롬프트나 이미지를 사용해 가상 장면의 3D 오브젝트를 빠르게 생성할 수 있도록 하죠.

비주얼 콘텐츠 크리에이터이자 마켓플레이스인 게티이미지(Getty Images)는 상업적으로 안전한 생성형 AI 서비스에 맞춤형 미세 조정 기능을 추가해 기업 고객이 각자의 브랜드 가이드라인과 스타일에 맞는 비주얼을 생성할 수 있도록 지원할 예정입니다. 또한 이 서비스에는 고객이 생성된 이미지를 더욱 세밀하게 제어할 수 있는 새로운 기능이 추가됩니다.

NVIDIA GTC에서 발표된 추론용 마이크로서비스 모음인 NVIDIA NIM을 통해 개발자는 게티이미지와 셔터스톡에서 사전 훈련된 Edify 모델을 API로 테스트해 볼 수 있습니다. 또한 NVIDIA DGX Cloud에 구축된 AI 파운드리인 NVIDIA Picasso를 통해 Edify 아키텍처를 사용해 자체 생성형 AI 모델을 훈련하고 배포할 수 있습니다.

NVIDIA와 어도비(Adobe)는 Edify를 기반으로 한 새로운 3D 생성 AI 기술을 수백만 명의 파이어플라이(Firefly)와 크리에이티브 클라우드(Creative Cloud) 크리에이터에게 제공하기 위해 협력하고 있습니다.

라이브 스트리밍 플랫폼인 비.라이브(Be.Live)는 NVIDIA Picasso 파운드리 서비스를 사용해 실시간 생성형 AI를 제공함으로써 비주얼을 자동으로 생성하고 시청자에게 인터랙티브한 경험을 제공합니다. 신뢰할 수 있는 비주얼 생성형 AI를 개발하는 기업을 위해 맞춤형 종합 플랫폼을 제공하는 브리아(Bria)는 추론 기능을 실행하기 위해 Picasso를 채택했죠. 또한 크리에이티브 스튜디오 큐브릭(Cuebric)은 몰입형 가상 환경을 구축하기 위해 Picasso 기반 생성형 AI 애플리케이션을 개발해 영화와 콘텐츠 제작을 향상시키고 있습니다.

빠른 3D: 지금 얼리 액세스가 가능한 셔터스톡 3D AI 생성기

얼리 액세스로 제공되고 있는 셔터스톡의 3D AI 서비스는 크리에이터가 세트 드레싱(set dressing)과 아이디어 구상을 위해 가상 오브젝트를 생성할 수 있도록 합니다. 이 기능을 사용하면 장면 프로토타입 제작에 필요한 시간을 대폭 단축할 수 있어 아티스트들은 영웅 캐릭터와 오브젝트 제작에 더 많은 시간을 할애할 수 있죠.

작동중인 셔터스톡 3D 생성기. 이미지 제공: 셔터스톡

크리에이티브 전문가는 이 도구를 사용해 텍스트 프롬프트나 참조 이미지에서 애셋을 빠르게 생성하고 인기 있는 3D 포맷들 중에서 선택해 파일을 내보낼 수 있습니다. Edify 3D 기반 서비스에는 생성된 콘텐츠를 필터링하는 안전 장치도 내장되어 있죠.

상업적으로 안전한 이 모델은 셔터스톡의 라이선스 데이터로 훈련됐는데요. 셔터스톡은 생성 기술 훈련에 사용된 콘텐츠에 대한 지적재산권 보호를 위해 수십만 명의 아티스트에게 보상금을 지급했으며, 추가로 수백만 명에게도 지급이 이루어질 것으로 예상됩니다.

셔터스톡 3D AI 생성기를 사용해 생성한 애셋을 평면 이미지로 렌더링하고 배열한 이미지. (이미지 제공: 셔터스톡)

이번 GTC에서 HP와 셔터스톡은 디자이너들에게 무한한 프로토타입 옵션을 제공하는 Edify 3D를 사용해 사용자 맞춤형 3D 인쇄를 개선하기 위한 협업을 선보입니다.

셔터스톡의 3D AI 생성기를 사용하면 컨셉을 빠르게 반복해 디지털 애셋을 만들 수 있습니다. 이를 HP가 자동화된 워크플로우를 통해 3D 인쇄가 가능한 모델로 변환시킬 수 있고, HP 3D 프린터는 이러한 모델을 실제 프로토타입으로 변환시켜 제품 디자인에 영감을 불어넣죠.

마텔(Mattel)은 디자인 아이디어 프로세스를 가속화할 수 있는 셔터스톡의 3D 생성 AI 기능을 활용하고 있습니다. 장난감 디자이너는 AI 도구를 사용해 간단한 텍스트 설명만으로 신제품에 대한 아이디어를 시각화할 수 있죠. 고충실도 콘셉트 디자인 제작에 대한 기술적 장벽을 낮춤으로써 디자이너는 더 폭넓은 아이디어를 탐색하고 더 빠르게 반복 작업을 수행할 수 있습니다.

또한 셔터스톡은 텍스트나 이미지 프롬프트에서 생성된 360 HDRi 환경을 사용해 경량의 3D 장면을 조명하는 Edify 기반 도구를 구축하고 있습니다.

3D 콘텐츠 제작을 위한 선도적인 3DEXCITE 애플리케이션을 통해 다쏘 시스템(Dassault Systèmes)은 CGI 스튜디오 카타나(CGI studio Katana)와 함께 NVIDIA Omniverse를 기반으로 한 워크플로우에 셔터스톡의 생성 360 HDRi API를 통합하고 있는데요. NVIDIA Omniverse는 OpenUSD 기반 3D 워크플로우와 애플리케이션 개발을 위한 컴퓨팅 플랫폼입니다.

액센츄어 송(Accenture Song)은 세계 최대의 기술 기반 크리에이티브 그룹입니다다. 이들은 마케팅 목적으로 컴퓨터 지원 설계 데이터에서 고퀄리티 방어 차량(high-fidelity Defender vehicles)을 생성하기 위해 Omniverse 플랫폼을 사용하고 있죠. 액센츄어 송은 Edify의 생성형 AI 마이크로서비스와 결합해 대화형 프롬프트를 통해 영화 같은 인터랙티브 3D 환경을 제작할 수 있게 됐습니다. 그 결과 사실적으로 생성된 환경과 방어 차량의 디지털 트윈이 조화를 이루는 완벽한 몰입형 3D 장면이 탄생했죠.

게티이미지의 사용자 맞춤 미세 조정 기능으로 창의적인 비전을 현실로 가져오기

게티이미지는 사용자가 생성한 콘텐츠에 대한 면책을 제공하는 상업적으로 안전한 생성형 AI 서비스를 통해 제공되는 기능을 지속적으로 확장하고 있습니다.

지난 1월 열린 CES에서 게티이미지는 창의적인 캔버스를 확장하는 아웃페인팅과 이미지에 오브젝트를 추가, 제거 또는 교체하는 인페인팅을 위한 Edify 기반 API를 출시했는데요. 이러한 기능은 이제 Gettyimages.com과 iStock.com에서 모두 이용할 수 있습니다.

오는 5월부터 게티이미지는 Edify 기초 모델을 기업의 브랜드와 시각적 스타일에 맞게 조정하는 서비스도 제공할 예정입니다.

이 서비스는 코드 없이 셀프 서비스 방식으로 제공되는데요. 이를 통해 기업은 독점적으로 보유된 데이터 세트를 업로드해, 자동으로 생성된 태그를 검토한 후, 미세 조정된 작업을 제출하고 결과물을 검토하고, 운영 환경에 배포해 활용할 수 있습니다.

맞춤형 미세 조정 도구의 일부로, 게티이미지는 생성형 AI의 가장 큰 과제 중 하나인 이미지 출력을 보다 세밀하게 제어할 수 있는 API 모음을 출시할 계획입니다.

개발자는 곧 스케치(Sketch), 뎁스(Depth), 세그멘테이션(Segmentation) 기능에 액세스할 수 있으며, 이를 통해 사용자는 AI의 이미지 생성을 안내하는 스케치를 제공하고, 뎁스 맵을 통해 참조 이미지의 구도를 복사하며, 이미지의 일부를 분할하여 캐릭터나 물체를 추가, 제거 또는 수정할 수 있습니다.

게티이미지의 API 서비스를 이미 사용하고 있는 주요 크리에이티브 에이전시와 광고주는 다음과 같습니다.

  • 덴츠(Dentsu Inc.): 일본에 본사를 둔 광고 대행사로, 게티 이미지의 생성형 AI API 서비스를 사용하고 있습니다. 이를 통해 마케팅 사용 사례를 위한 만화와 애니메이션 스타일의 콘텐츠를 제작할 수 있는 앱인 MAFA: Manga Anime For All을 구동하죠. 또한 덴츠 크리에이티브(Dentsu Creative)는 선도적인 멤버십 웨어하우스 유통업체인 샘스클럽(Sam’s Club)의 모델을 미세 조정하기 위해 NVIDIA Picasso를 사용하고 있습니다.
  • 맥칸(McCann): 이 크리에이티브 에이전시는 고객사 레킷(Reckitt)의 일반 감기약 뮤시넥스(Mucinex)를 위해 소비자가 이 브랜드 마스코트와 상호 작용할 수 있는 혁신적인 게임을 개발하기 위해 생성형 AI를 활용했습니다.
  • 레픽 아나돌 스튜디오(Refik Anadol Studio): 예술 작품에 생성형 AI를 사용하는 것으로 유명한 이 스튜디오는 레픽의 열대우림 카탈로그에 맞춰 미세 조정된 게티이미지의 AI 모델을 사용해 제작한, 열대 우림에서 영감을 받은 예술작품을 GTC에서 선보입니다.
  • WPP: 마케팅과 커뮤니케이션 서비스업체 WPP는 코카콜라(Coca-Cola Company)와 제휴해 게티이미지의 모델을 미세 조정해 브랜드 스타일과 가이드라인에 맞는 비주얼을 구축하는 방법을 모색 중입니다.
대형 자연 모형(Large Nature Model): 레픽 아나돌 스튜디오가 GTC 2024에서 선보인 예술작품

ai.nvidia.com에서 NVIDIA Picasso에 대해 자세히 알아보고 게티이미지와 셔터스톡의 Edify 기반 NIM을 사용할 수 있다.

3 21()까지 캘리포니아 산호세에서 온라인으로 진행되는 글로벌 AI 개발자 콘퍼런스인 NVIDIA GTC에서 최신 생성형 AI에 대해 살펴보세요.

여기에서 NVIDIA 창립자 CEO 젠슨 황(Jensen Huang)의 GTC 키노트를 다시 시청할 수 있습니다.

썸네일에서 왼쪽의 콜라주는 Edify 기반 셔터스톡 3D AI 제너레이터로 생성된 에셋을 보여줍니다(사진제공: 셔터스톡). 오른쪽 이미지는 NVIDIA에서 시연하는 Edify의 스케치-이미지 변환 기능을 보여줍니다.