NVIDIA NIM 마이크로서비스와 AI Blueprints로 로컬 AI의 새로운 시대 시대를 선보이다

새로운 NIM 마이크로서비스와 AI Blueprints가 RTX AI PC 및 워크스테이션에서 생성형 AI를 구현합니다. 또한 CES에서 발표한 더 많은 소식을 이번 RTX AI Garage 시리즈의 첫 번째 편에서 요약해 드립니다.
by NVIDIA Korea

생성형 AI는 지난 1년 동안 사람들이 생활하고 일하며 즐기는 방식을 변화시켰으며, 글쓰기와 콘텐츠 제작에서 게임, 학습, 생산성에 이르기까지 모든 분야에 혁신을 가져왔습니다. 특히 개발자들이 이 획기적인 기술의 한계를 확장하는 것을 주도하고 있습니다.

산업을 정의하는 기술 혁신은 차고라는 한 곳에서 탄생해 왔습니다. 올해에는 RTX AI Garage 시리즈가 시작되며, NVIDIA NIM 마이크로서비스와 AI Blueprints에 대해 자세히 알아보고 AI 에이전트, 크리에이티브 워크플로우, 디지털 휴먼, 생산성 앱 등을 구축하려는 을개발자들 위해 정기적인 콘텐츠를 제공할 예정입니다. RTX AI Garage에 오신 것을 환영합니다.

올 초 CES에서 발표한 첫 번째 편에서는 NVIDIA RTX AI PC에서 사용할 수 있는 새로운 AI 파운데이션 모델을 포함하여 디지털 휴먼, 콘텐츠 제작, 생산성 및 개발을 한 단계 더 발전시킬 수 있습니다.

이 모델들은 NVIDIA NIM 마이크로서비스로 제공되며, 새로운 GeForce RTX 50 시리즈 GPU를 기반으로 합니다. NVIDIA Blackwell 아키텍처를 기반으로 하는 RTX 50 시리즈 GPU는 초당 최대 3,352조의 AI 연산 성능, 32GB의 VRAM 및 FP4 컴퓨팅을 특징으로 하여 AI 추론 성능을 두 배로 향상하고 생성형 AI를 더 작은 메모리 공간으로 로컬에서 실행할 수 있습니다.

NVIDIA는 또한 디지털 휴먼 및 콘텐츠 제작 등의 애플리케이션을 위해 NIM 마이크로서비스를 기반으로 사전 구성된 바로 사용할 수 있는 워크플로우인 NVIDIA AI Blueprints도 소개했습니다.

NIM 마이크로서비스와 AI Blueprints를 통해 개발자는 그 어느 때보다 빠르게 AI 기반 경험을 빌드하고 반복하여 PC에 제공할 수 있습니다. 그 결과 PC 사용자를 위한 강력하고 실용적인 새로운 기능이 등장했습니다.

NVIDIA NIM을 통한 AI 가속

PC에 AI의 발전을 도입하는 데에는 두 가지 핵심 과제가 있습니다. 첫째, AI 연구 속도가 엄청나게 빠르게 진행되고 있으며, Hugging Face와 같은 플랫폼에 매일 새로운 모델이 등장하고 있습니다. 현재 이 플랫폼에는 백만개 이상의 모델이 호스팅되고 있습니다. 그 결과, 혁신적인 것은 빠르게 구식이 됩니다.

둘째, 이 모델들을 PC용으로 적용하는 것은 복잡하고 자원이 많이 소모되는 과정입니다. PC 하드웨어에 최적화하고, AI 소프트웨어와 통합하여 애플리케이션에 연결하려면 상당한 공학적 노력이 필요합니다.

NVIDIA NIM은 PC에 최적화되어 사전 패키징된 최첨단 AI 모델을 제공하여 이러한 과제를 해결할 수 있도록 지원합니다. 이러한 NIM 마이크로서비스는 모델 도메인을 아우르며, 한 번의 클릭으로 설치할 수 있고, 간편한 통합을 위한 애플리케이션 프로그래밍 인터페이스(API)를 갖추고 있으며, NVIDIA AI 소프트웨어와 RTX GPU를 활용하여 가속화된 성능을 제공합니다.

CES에서 NVIDIA는 RTX AI PC용 NIM 마이크로서비스 파이프라인을 발표하여 거대 언어 모델(LLM), 시각 언어 모델, 이미지 생성, 음성, 검색 증강 생성(RAG), PDF 추출 및 컴퓨터 비전 등의 활용 사례를 지원합니다.

새로운 Llama Nemotron 오픈 모델 제품군은 광범위한 에이전트 작업에서 높은 정확도를 제공합니다. RTX AI PC 및 워크스테이션을 위한 NIM 마이크로서비스로 제공될 Llama Nemotron Nano 모델은 명령 추적, 기능 호출, 채팅, 코딩, 수학 등의 에이전트 AI 작업에서 탁월한 성능을 발휘합니다.

개발자들은 곧 WSL(Windows Subsystem for Linux)을 사용하여 Windows 11 PC에서 이러한 마이크로서비스를 빠르게 다운로드하여 실행할 수 있게 될 것입니다.

개발자가 NIM을 사용하여 AI 에이전트와 어시스턴트를 구축하는 방법을 시연하기 위해 NVIDIA는 사용자에게 정보를 손쉽게 제공하고, 데스크톱 앱과 화상 회의 통화를 지원하고, 문서를 읽고 요약하는 등의 작업을 할 수 있는 시각 기반 PC 아바타인 Project R2X를 미리 공개했습니다. 구독하고 Project R2X 업데이트를 받으세요

NIM 마이크로서비스를 사용함으로써, AI 개발자는 모델 큐레이션, 최적화, 백엔드 통합의 복잡함을 피하고 최첨단 AI 모델을 제작하 혁신하는 데 집중할 수 있습니다.

API에는 무엇이 있나요?

API는 애플리케이션이 소프트웨어 라이브러리와 통신하는 API는 애플리케이션이 라이브러리에 할 수 있는 일련의 ‘호출’을 정의하고 애플리케이션이 그 대가로 기대할 수 있는 것을 정의합니다. 기존의 AI API는 많은 설정과 구성이 필요하기 때문에 AI 기능을 사용하기 어려워 혁신을 저해합니다.

NIM 마이크로서비스는 애플리케이션이 요청을 보내고 응답을 받을 수 있는 사용하기 쉽고 직관적인 API를 또한 다양한 모델 유형을 위해 입력 및 출력 미디어를 중심으로 예를 들어, LLM은 텍스트를 입력으로 받아 출력으로 생성하고, 이미지 생성기는 텍스트를 이미지로 변환하고, 음성 인식기는 음성을 텍스트로 변환하는 등의 작업을 합니다.

마이크로서비스는 VSCode, AnythingLLM, 개발자는 build.nvidia.com에서 쉽게  다운로드하여 배포할 수 있습니다.

이러한 API를 RTX에 도입함으로써 NVIDIA NIM은 PC에서 AI 혁신을 가속화할 것입니다.

개발자들은 곧 출시될 NVIDIA ChatRTX 기술 데모를 사용하여 다양한 NIM 마이크로서비스를 경험할 수 있을 것으로 예상됩니다.

혁신을 위한 AI Blueprint

개발자는 PC에 맞게  사전 패키징되고 최적화된 최첨단 모델을 사용하여 AI 기반 프로젝트를 빠르게 제작할 수 있습니다. 한 단계 더 나아가, 여러 AI 모델과 기타 기능을 결합하여 디지털 휴먼, 팟캐스트 생성기, 애플리케이션  어시스턴트와 같은 복잡한 애플리케이션을 구축할 수 있습니다.

NIM 마이크로서비스를 기반으로 하는 NVIDIA AI Blueprint는 복잡한 AI 워크플로우를 위한 레퍼런스 구현입니다. 개발자는 라이브러리, 소프트웨어 개발, AI 모델을 비롯한 여러 구성 요소를 하나의 애플리케이션에서 연결할 수 있도록 지원합니다.

AI Blueprint에는 개발자가 레퍼런스 애플리케이션과 소스 코드, 샘플 데이터, 다양한 구성 요소의 커스터마이징과  오케스트레이션을 위한 문서 등 레퍼런스 워크플로우를 빌드, 실행, 커스터마이징, 확장하는 데 필요한 모든 것이 포함되어 있습니다.

NVIDIA는 CES에서 RTX를 위한 두 가지 AI Blueprint를 발표했습니다. 하나는 사용자가 모든 PDF에서 팟캐스트를 생성할 수 있는 PDF에서 팟캐스트 변환 기능입니다. 또 다른 Blueprint는 FLUX.1 [개발] 기반의 3D 가이드 생성형 AI로,

AI Blueprint를 사용하면 개발자는 RTX PC 및 워크스테이션에서 최첨단 워크플로우를 위해 AI 실험부터 AI 개발로 빠르게 전환할 수 있습니다.

생성형 AI를 위해 구축

새로운 GeForce RTX 50 시리즈 GPU는 복잡한 생성형 AI 문제를 해결하기 위해 특별 설계되었으며, FP4를 지원하는 5세대 Tensor 코어, 더 빠른 G7 메모리, AI와 크리에이티브 워크플로우 간의 효율적인 멀티태스킹을 위한 AI 관리 프로세서를 갖추고 있습니다.

GeForce RTX 50 시리즈는 FP4 지원을 추가하여 PC에 더 나은 성능과 더 많은 모델을 제공할 수 있도록 지원합니다. FP4는 파일 압축과 유사하게 모델 크기를 줄이는 낮은 양자화 방식입니다. 대부분의 모델이 적용하는 기본 방식인 FP16과 비교하여 FP4는 메모리의 절반 이하를 사용하며, 50 시리즈 GPU는 이전 세대보다 2배 이상의 성능을 제공합니다. 이는 NVIDIA TensorRT 모델 최적화 도구가 제공하는 고급 양자화 방식을 통해 거의 품질 손실 없이 이 작업을 수행할 수 있습니다.

예를 들어,  Black Forest Labs의 FP16 FLUX.1 [개발] 모델은 23GB 이상의 VRAM을 필요로 하며, 이는 GeForce RTX 4090 및 전문 GPU에서만 지원할 수 있음을 FP4를 사용하면 FLUX.1 [개발]은 10GB 미만을 필요로 하므로, 더 많은 GeForce RTX GPU에서 로컬로 실행할 수 있습니다.

FP16을 갖춘 GeForce RTX 4090을 사용하면 FLUX.1 [개발] 모델은 30단계로 15초 이내에 이미지를 생성할 수 있습니다. FP4를 탑재한 GeForce RTX 5090을 사용하면 이미지를 5초가 조금 넘는 시간 안에 생성할 수 있습니다.

PC를 위한 새로운 AI API 시작하기

NVIDIA NIM 마이크로서비스와 AI Blueprint는 2월부터 제공될 예정이며, 초기 하드웨어 지원은 GeForce RTX 50 시리즈, GeForce RTX 4090 및 4080, 그리고 NVIDIA RTX 6000 및 5000 전문가용 GPU를 대상으로 합니다. 향후 추가 GPU가 지원될 예정입니다.

NIM 지원 RTX AI PC는 Acer, SUS, Dell, GIGABYTE, HP, Lenovo, MSI, Razer, Samsung과 지역 시스템 빌더인 Corsair, Falcon Northwest, LDLC, Maingear, Mifcon, Origin PC, PCS, Scan 등에서 구매할 수 있습니다.

GeForce RTX 50 시리즈 GPU 및 노트북은 게임의 판도를 바꾸는 성능을 제공하고, 혁신적인 AI 경험을 제공하며, 크리에이터가 기록적인 시간 내에 워크플로우를 완료할 수 있도록 지원합니다. NVIDIA 젠슨 황 CEO의 키노트를 다시 보고 CES에서 발표한 NVIDIA의 AI 뉴스에 대해 자세히 알아보세요.

소프트웨어 제품 정보에 관한 공지를 참조하세요.