편집자 노트: 본 게시물은 AI Decoded 시리즈의 일부로, AI에 대한 접근성을 높여 AI에 대한 이해를 돕고, RTX PC 사용자를 위한 새로운 하드웨어, 소프트웨어, 도구 및 가속 기술을 소개합니다.
이미지 생성 모델은 생성형 AI의 인기 있는 하위 부문으로, 문자 언어를 구문 분석하고 이해한 다음 거의 모든 스타일의 이미지로 변환할 수 있습니다.
이미지 생성 부문에서 실현 가능한 최첨단을 대표하는 Black Forest Labs의 새로운 모델 시리즈를 이제 PC와 워크스테이션에서 사용해 볼 수 있으며 GeForce RTX와 NVIDIA RTX GPU에서 가장 빠르게 실행됩니다.
Flux의 기능
FLUX.1 AI는 Black Forest Labs에서 개발한 텍스트-이미지 생성 모델 제품군입니다. 이 모델은 DiT(Diffusion Transformer) 아키텍처를 기반으로 구축되어, 많은 수의 파라미터를 가진 모델이 효율성을 유지할 수 있습니다. Flux 모델은 고품질 이미지 생성을 위해 120억 개의 파라미터로 학습됩니다.
DiT 모델은 효율적이지만 계산 집약적이며, NVIDIA RTX GPU는 이러한 새로운 모델을 다루는 데 필수적입니다. 그중 규모가 가장 큰 모델은 상당한 조정을 거치지 않고는 RTX가 아닌 GPU에서 실행할 수 없습니다. Flux 모델은 이제 성능을 최대 20% 향상시키는 NVIDIA TensorRT 소프트웨어 개발 키트를 지원합니다. 사용자는 ComfyUI에서 TensorRT를 사용한 Flux 및 다른 모델을 사용해 볼 수 있습니다.
Flux의 매력
FLUX.1은 AI가 지시를 얼마나 정확하게 해석하고 실행하는지를 나타내는 프롬프트 준수도가 뛰어나 고품질의 다양한 이미지를 생성하는 데 탁월합니다. 프롬프트 준수도가 높다는 것은 생성된 이미지가 텍스트 프롬프트에 설명된 요소, 스타일 및 분위기와 밀접하게 일치한다는 것을 의미합니다. 프롬프트 준수가 낮다는 것은 이미지가 주어진 지침에서 부분적으로 또는 완전히 벗어날 수 있음을 의미합니다.
FLUX.1은 손이나 얼굴과 같은 까다롭고 복잡한 부위를 포함하여 인체 해부학을 정확하게 렌더링하는 기능으로 유명합니다. 또한 FLUX.1은 이미지 내에서 판독하기 쉬운 텍스트 생성 기능을 크게 향상시켜 텍스트-이미지 모델에서 발생하는 또 다른 일반적인 문제들을 해결합니다. 따라서 FLUX.1 모델은 홍보 자료, 책 표지와 같이 정확한 텍스트 표현이 필요한 응용 분야에 적합합니다.
FLUX.AI는 세 가지 유형으로 제공되어, 사용자는 품질 저하 없이 자신의 워크플로우에 가장 적절한 유형을 선택할 수 있습니다.
- 1 pro: 기업 사용자들을 위한 최첨단 품질 유형으로, 응용 프로그램 프로그래밍 인터페이스를 통해 액세스 가능합니다.
- 1 dev: FLUX.1 pro의 정수를 집약한 무료 버전으로, 고품질로 제공합니다.
- 1 schnell: 가장 빠른 모델로, 지엽적인 개발 및 개인적인 용도에 이상적이며, Apache 2.0 라이센스가 적용됩니다.
dev 및 schnell 모델은 오픈 소스이며, Black Forest Labs는 인기 있는 플랫폼인 Hugging Face에서 가중치에 대한 액세스를 제공합니다. 이를 통해 연구자와 개발자는 모델을 기반으로 구축하고 향상시킬 수 있으므로, 이미지 생성 커뮤니티 내에서의 혁신과 협력이 촉진됩니다.
커뮤니티의 지지
Flux 모델의 dev 및 schnell 유형은 출시 후 3주도 되지 않아 HuggingFace에서 200만 회 이상 다운로드되었습니다.
사용자들은 뛰어난 디테일과 사실감을 갖춘 시각적으로 놀라운 이미지를 생성하고 광범위한 매개 변수 조정 없이 복잡한 프롬프트를 처리하는 FLUX.1의 능력에 찬사를 보냈습니다.
이와 더불어, FLUX.1의 다양한 아트 스타일을 다루는 기능과 신속하게 이미지를 생성하는 효율성은 개인 및 전문 프로젝트 모두에서 유용한 도구입니다.
지금 시작하세요.
사용자는 ComfyUI와 같은 인기 있는 커뮤니티 웹페이지를 사용하여 FLUX.1에 액세스할 수 있습니다. 커뮤니티에서 운영하는 ComfyUI Wiki에는 시작하기 위한 단계별 지침이 포함되어 있습니다.
또한 많은 YouTube 크리에이터들이 MDMZ의 이 영상과 같이 Flux 모델에 대한 비디오 튜토리얼을 제공합니다.
#fluxRTX 해시태그를 사용하여 생성된 이미지를 소셜 미디어에 공유하고 NVIDIA AI 채널에 자신의 이미지가 소개되는 기회를 누려 보세요.
생성형 AI는 게임, 화상 회의를 비롯한 모든 종류의 대화형 경험을 변화시키고 있습니다. AI Decoded 뉴스레터를 구독하여 새로운 소식과 미래의 혁신을 알아보세요.