Flux와 Furious: RTX AI PC와 워크스테이션에서 가장 빠르게 실행되는 새로운 이미지 생성 모델

Black Forest Labs의 최신 모델은 고품질 이미지를 생성하고 NVIDIA RTX GPU에서 뛰어난 성능을 자랑합니다.
by NVIDIA Korea
Flux와 Furious: RTX AI PC와 워크스테이션에서 가장 빠르게 실행되는 새로운 이미지 생성 모델

편집자 노트본 게시물은 AI Decoded 시리즈의 일부로, AI에 대한 접근성을 높여 AI에 대한 이해를 돕고, RTX PC 사용자를 위한 새로운 하드웨어소프트웨어도구 및 가속 기술을 소개합니다.

이미지 생성 모델은 생성형 AI의 인기 있는 하위 부문으로, 문자 언어를 구문 분석하고 이해한 다음 거의 모든 스타일의 이미지로 변환할 수 있습니다.

이미지 생성 부문에서 실현 가능한 최첨단을 대표하는 Black Forest Labs의 새로운 모델 시리즈를 이제 PC와 워크스테이션에서 사용해 볼 수 있으며 GeForce RTXNVIDIA RTX GPU에서 가장 빠르게 실행됩니다.

Flux의 기능

FLUX.1 AI는 Black Forest Labs에서 개발한 텍스트-이미지 생성 모델 제품군입니다. 이 모델은 DiT(Diffusion Transformer) 아키텍처를 기반으로 구축되어, 많은 수의 파라미터를 가진 모델이 효율성을 유지할 수 있습니다. Flux 모델은 고품질 이미지 생성을 위해 120억 개의 파라미터로 학습됩니다.

DiT 모델은 효율적이지만 계산 집약적이며, NVIDIA RTX GPU는 이러한 새로운 모델을 다루는 데 필수적입니다. 그중 규모가 가장 큰 모델은 상당한 조정을 거치지 않고는 RTX가 아닌 GPU에서 실행할 수 없습니다. Flux 모델은 이제 성능을 최대 20% 향상시키는 NVIDIA TensorRT 소프트웨어 개발 키트를 지원합니다. 사용자는 ComfyUI에서 TensorRT를 사용한 Flux 및 다른 모델을 사용해 볼 수 있습니다.

프롬프트: “눈보라 속에서 김이 모락모락 나는 온천에 몸을 담그고 있는 원숭이의 잡지 사진.” 출처: NVIDIA
프롬프트: “눈보라 속에서 김이 모락모락 나는 온천에 몸을 담그고 있는 원숭이의 잡지 사진.” 출처: NVIDIA

Flux의 매력

FLUX.1은 AI가 지시를 얼마나 정확하게 해석하고 실행하는지를 나타내는 프롬프트 준수도가 뛰어나 고품질의 다양한 이미지를 생성하는 데 탁월합니다. 프롬프트 준수도가 높다는 것은 생성된 이미지가 텍스트 프롬프트에 설명된 요소, 스타일 및 분위기와 밀접하게 일치한다는 것을 의미합니다. 프롬프트 준수가 낮다는 것은 이미지가 주어진 지침에서 부분적으로 또는 완전히 벗어날 수 있음을 의미합니다.

FLUX.1은 손이나 얼굴과 같은 까다롭고 복잡한 부위를 포함하여 인체 해부학을 정확하게 렌더링하는 기능으로 유명합니다. 또한 FLUX.1은 이미지 내에서 판독하기 쉬운 텍스트 생성 기능을 크게 향상시켜 텍스트-이미지 모델에서 발생하는 또 다른 일반적인 문제들을 해결합니다. 따라서 FLUX.1 모델은 홍보 자료, 책 표지와 같이 정확한 텍스트 표현이 필요한 응용 분야에 적합합니다.

FLUX.AI는 세 가지 유형으로 제공되어, 사용자는 품질 저하 없이 자신의 워크플로우에 가장 적절한 유형을 선택할 수 있습니다.

  • 1 pro: 기업 사용자들을 위한 최첨단 품질 유형으로, 응용 프로그램 프로그래밍 인터페이스를 통해 액세스 가능합니다.
  • 1 dev: FLUX.1 pro의 정수를 집약한 무료 버전으로, 고품질로 제공합니다.
  • 1 schnell: 가장 빠른 모델로, 지엽적인 개발 및 개인적인 용도에 이상적이며, Apache 2.0 라이센스가 적용됩니다.

dev 및 schnell 모델은 오픈 소스이며, Black Forest Labs는 인기 있는 플랫폼인 Hugging Face에서 가중치에 대한 액세스를 제공합니다. 이를 통해 연구자와 개발자는 모델을 기반으로 구축하고 향상시킬 수 있으므로, 이미지 생성 커뮤니티 내에서의 혁신과 협력이 촉진됩니다.

커뮤니티의 지지

Flux 모델의 dev 및 schnell 유형은 출시 후 3주도 되지 않아 HuggingFace에서 200만 회 이상 다운로드되었습니다.

사용자들은 뛰어난 디테일과 사실감을 갖춘 시각적으로 놀라운 이미지를 생성하고 광범위한 매개 변수 조정 없이 복잡한 프롬프트를 처리하는 FLUX.1의 능력에 찬사를 보냈습니다.

프롬프트: “늦은 저녁 시간 이비자에서 열린 야외 일렉트로닉 댄스 음악 콘서트, 흰색 골지 탱크탑을 입고 선글라스와 헤드폰을 목에 얹은 의인화된 벵골 호랑이 DJ가 무대 위에서 턴테이블에 발을 올리고 있는 모습, 연기가 몇 줄기 피어오르고 굴절된 조명이 비추는 파티 분위기를 대단히 디테일하게 묘사한 클로즈업 사진.” 출처: NVIDIA

 

프롬프트: “비가 오는 저녁의 붐비는 도시 거리를 보여주는 사진 품질의 이미지. 길가에 주차된 노란색 택시의 전조등이 켜져 있으며 젖은 포장 도로에 반사된다. 빨간 코트를 입은 여성이 밝은 녹색 우산 아래에 서서 스마트폰을 보고 있다. 왼쪽에는 파란색 글자로 ‘Café Mocha’라고 쓰여진 네온 사인이 밝혀진 카페가 있다. 카페에는 큰 창문들이 있으며, 창문을 통해 사람들이 음료를 즐기는 모습을 볼 수 있다. 가로등은 주변을 비추어 장면에 따뜻한 빛을 불어 넣고, 빗방울이 공기 중에 안개가 흐려지는 효과를 만든다. 배경에 놓인 높은 건물에는 8:45 pm을 표시하는 대형 디지털 시계가 달려 있다.” 출처: NVIDIA

이와 더불어, FLUX.1의 다양한 아트 스타일을 다루는 기능과 신속하게 이미지를 생성하는 효율성은 개인 및 전문 프로젝트 모두에서 유용한 도구입니다.

지금 시작하세요.

사용자는 ComfyUI와 같은 인기 있는 커뮤니티 웹페이지를 사용하여 FLUX.1에 액세스할 수 있습니다. 커뮤니티에서 운영하는 ComfyUI Wiki에는 시작하기 위한 단계별 지침이 포함되어 있습니다.

또한 많은 YouTube 크리에이터들이 MDMZ의 이 영상과 같이 Flux 모델에 대한 비디오 튜토리얼을 제공합니다.

#fluxRTX 해시태그를 사용하여 생성된 이미지를 소셜 미디어에 공유하고 NVIDIA AI 채널에 자신의 이미지가 소개되는 기회를 누려 보세요.

생성형 AI는 게임, 화상 회의를 비롯한 모든 종류의 대화형 경험을 변화시키고 있습니다. AI Decoded 뉴스레터를 구독하여 새로운 소식과 미래의 혁신을 알아보세요.