편집자 노트: 본 게시물은 AI Decoded 시리즈의 일부로, AI에 대한 접근성을 높여 AI에 대한 이해를 돕고, RTX PC 사용자를 위한 새로운 하드웨어, 소프트웨어, 도구 및 가속 기술을 소개합니다.
언어, 2D 이미지, 3D 모델 또는 비디오를 생성하는 콘텐츠 생성기는 크리에이티브 커뮤니티에 비전을 더 빨리 실현시킬 수 있는 도구를 제공하고 있습니다.
개발자들이 이와 같이 새로운 생성형 AI 도구를 구축하는 데 도움이 되도록 NVIDIA는 NVIDIA AI Foundry 를 마련했습니다. NVIDIA AI Foundry는 NVIDIA Edify를 사용하여 라이선스를 획득한 자체 데이터로 생성형 AI 모델을 훈련시킬 수 있도록 기업을 지원합니다. NVIDIA Edify는 단순한 텍스트 프롬프트를 사용하여 이미지, 비디오, 3D 애셋, 360도 HDR 이미징 및 물리 기반 렌더링(PBR) 머티리얼을 생성할 수 있는 멀티모달 AI 아키텍처입니다. 기업은 이러한 에셋을 생성하도록 AI Foundry를 통해 맞춤형 AI 모델을 훈련시킬 수 있습니다.
Edify의 핵심 요소에는 여러 유형의 콘텐츠를 생성할 수 있는 기능, 더 적은 이미지를 학습하고도 고품질의 콘텐츠를 생산할 수 있는 뛰어난 훈련 효율성, 스타일 매칭을 수행하거나 캐릭터 또는 오브젝트를 학습하도록 모델을 파인 튜닝할 수 있는 기능이 포함됩니다.
NVIDIA AI Foundry와 Edify를 기반으로 구축된 서비스의 가장 좋은 예시 한 가지는 상업적으로 안전한 생성형 사진 서비스인 Getty Images의 생성형 AI입니다. AI Foundry와 Edify를 함께 사용하면 사용자가 훈련 데이터 세트를 제어할 수 있으므로, 필요에 맞게 모델을 만들 수 있습니다.
Getty Images는 저작권 문제를 피하기 위해 Edify를 사용하여 라이선스를 획득한 자체 콘텐츠로 서비스를 훈련시켰으며 데이터 세트에 유명 캐릭터나 제품이 포함되지 않도록 했습니다. 또한 이 기업은 이익의 일부를 기여자들과 공유하여 모델에 기여하는 크리에이터에게 새로운 수익원을 제공했습니다.
Edify를 통한 에셋 생성
Edify는 이미지, 3D 셋, 360도 HDRi 환경 맵을 포함한 다양한 이미지 유형을 생성하도록 훈련될 수 있습니다.
Edify Image는 약 6초 만에 4개의 고품질 1K 이미지를 생성할 수 있어 이전 모델보다 성능이 두 배 향상되었습니다. 또한 생성형 업스케일러로 이미지를 4K로 변환하여 디테일을 추가할 수도 있습니다.
고급 프롬프트 준수, 초점 거리 또는 피사계 심도를 지정할 수 있는 카메라 제어 기능, 생성을 인도하는 ControlNet 덕분에 이미지를 높은 수준으로 제어할 수 있습니다. ControlNet에는 이미지의 구성을 따르거나 복사하도록 사용자가 스케치를 제공할 수 있는 기능인 Sketch와 이미지의 구성을 복사할 수 있는 기능인 Depth가 포함됩니다.
Edify Image로 이미지를 편집할 수도 있습니다. InPaint를 사용하면 이미지에 콘텐츠를 추가하거나 이미지의 콘텐츠를 수정할 수 있습니다. Replace(엄밀한 InPaint)로는 의류와 같은 세부 사항을 변경할 수 있습니다. OutPaint는 다른 종횡비에 맞게 이미지를 확장할 수 있습니다. 그리고 이 모든 기능은 텍스트 프롬프트만으로 오브젝트를 마스킹할 수 있는 기능인 Segment로 단순화됩니다.
Edify는 아티스트가 바로 사용할 수 있는 3D 메시도 만들 수 있습니다. 메시는 명확한 쿼드 기반 토폴로지, 최대 4K PBR 머티리얼 및 자동 UV 매핑과 함께 제공되어 더 쉽게 텍스처 편집을 수행할 수 있습니다. 빠른 미리보기 모드는 10초 만에 결과를 제공하고, 그 결과는 전체 3D 메시로 전환될 수 있습니다.
메시는 장면 프로토타이핑 또는 세트 장식용 배경 오브젝트 생성에 사용하거나 3D 스컬프팅을 위한 시작 단계로 사용하기에 적합합니다.
Edify 360 HDRi는 장면에 빛을 비추고 반사 효과를 내는 데 사용되거나 배경으로도 사용될 수 있는 자연 경관의 환경 맵을 생성합니다. 모델은 텍스트 또는 이미지 프롬프트로 최대 16K HDRi 이미지를 생성할 수 있습니다. 원하는 백플레이트가 있는 사용자는 몇 시간 동안 어울리는 것을 찾느라 애쓰는 대신, 맞춤형 HDRi를 만들 수 있습니다.
Edify의 독보적인 멀티모달 기능은 다양한 애셋 유형을 결합하는 고급 워크플로우를 지원합니다. 예를 들어, 사용자가 에이전트와 함께 Edify를 사용하면 단순한 텍스트 프롬프트를 통해 몇 분 안에 전체 장면을 프로토타이핑할 수 있습니다. NVIDIA Edify 기반 모델과 NVIDIA Omniverse 플랫폼의 3D 월드 구축 보조 기능을 소개한 NVIDIA Research SIGGRAPH 데모에서 보여드린 바와 같습니다.
또 다른 활용 사례로, Edify 3D 및 360 HDRi를 Image와 결합하면 사용자가 이미지 생성을 완벽하게 제어할 수 있습니다. 아티스트는 3D로 장면을 생성하여 오브젝트를 이동하고 원하는 샷을 구성한 다음, Edify Image를 사용하여 프로토타입을 사실적인 이미지로 변환할 수 있습니다.
Getty Images의 생성형 AI
Getty Images는 크리에이티브 비주얼, 에디토리얼 사진, 비디오 및 음악을 제공하는 최대 콘텐츠 서비스 공급업체 중 한 곳이며, 사람들이 세계 유수 사진작가 및 비디오그래퍼의 강력한 비주얼 콘텐츠를 찾아보고, 구매하고, 공유하기 위해 가장 먼저 찾는 곳 중 하나입니다.
Getty Images는 생성형 AI 서비스를 강화하기 위해 NVIDIA AI Foundry를 사용하여 NVIDIA Edify Image 모델을 훈련시켰습니다. 엔터프라이즈를 위한 Getty Images의 생성형 AI 그리고 소규모 기업 및 아마추어 크리에이터를 위한 iStock의 생성형 AI를 통해 제공되는 이 서비스는 NVIDIA Edify 기반 모델을 사용하여 이미지를 생성하고 수정할 수 있는 기능을 사용자에게 제공합니다.
Getty Images와 iStock이 최근 Edify Image의 최신 버전으로 업데이트됨에 따라 더 빠른 생성 및 더 충실한 프롬프트 준수와 더불어 카메라 제어 기능의 제공이 가능하게 되었습니다.
이제 사용자는 미리 촬영된 크리에이티브 콘텐츠에 생성형 AI 도구를 사용할 수 있으므로 iStock의 비주얼 라이브러리를 편집하고 수정하여 빠르게 기존 콘텐츠를 완벽하게 맞춤화할 수 있습니다. 이와 같은 기능은 곧 Gettyimages.com에서 사용할 수 있습니다.
ai.nvidia.com에서 Getty Images의 생성형 AI를 체험해 보세요.
생성형 AI는 게임, 화상 회의 및 모든 종류의 인터랙티브 경험을 혁신하고 있습니다. AI Decoded 뉴스레터를 구독하고 AI 기술이 바꿀 현재와 미래의 모습을 확인하세요.