PC에서 4K AI 영상 생성을 더 빠르게, NVIDIA RTX 업데이트

2025년은 PC 기반 AI 개발이 본격적으로 도약한 해였습니다.

PC급 소형 언어 모델(SLM)은 2024년 대비 정확도가 약 2배 향상되며, 클라우드 기반 최첨단 거대 언어 모델(LLM)과의 격차를 크게 줄였죠. 울라마(Ollama), 컴피UI(ComfyUI), 라마.cpp(llama.cpp), 언슬로스(Unsloth) 등 AI PC 개발자 도구는 완성도가 높아지면서 전년 대비 인기가 두 배로 증가했고, PC급 모델을 다운로드하는 사용자 수는 2024년 대비 10배로 늘었는데요.

이러한 진전은 올해를 기점으로 일상적인 PC 크리에이터, 게이머, 생산성 사용자 전반에서 생성형 AI가 폭넓게 확산되는 기반을 마련하고 있습니다.

이번 주 CES에서는 개발자에게 PC 환경에서 생성형 AI를 배포하는 데 필요한 성능과 메모리를 제공하기 위해 GeForce RTX, NVIDIA RTX PRO, NVIDIA DGX Spark 디바이스를 대상으로 한 대규모 AI 업그레이드가 발표됐습니다. 주요 내용은 다음과 같습니다.

PyTorch-CUDA 최적화와 컴피UI의 네이티브 NVFP4/FP8 정밀도 지원을 통해 비디오 및 이미지 생성형 AI 성능 최대 3배 향상과 VRAM 사용량 60% 절감
컴피UI에 RTX Video Super Resolution 통합으로 4K 영상 생성 가속
라이트릭스(Lightricks)의 최첨단 LTX-2 오디오 비디오 생성 모델의 오픈 웨이트 출시를 위한 NVIDIA NVFP8 최적화
블렌더(Blender)의 3D 장면을 활용해 출력 결과를 정밀 제어하는 4K AI 영사 생성용 신규 파이프라인
Ollama, llama.cpp를 통한 SLM 추론 성능 최대 35% 향상
ai의 하이퍼링크(Hyperlink) 신규 영상 검색 기능에 대한 RTX 가속

이러한 개선을 통해 사용자는 로컬 RTX AI PC가 제공하는 개인정보 보호, 보안, 그리고 저지연 환경에서 고급 영상, 이미지, 언어 AI 워크플로우를 원활하게 실행할 수 있습니다.

RTX PC에서 4K 영상을 3배 빠르게 생성

생성형 AI는 훌륭한 영상을 만들어낼 수 있지만, 온라인 도구는 프롬프트만으로는 제어가 어렵습니다. 또한 대부분의 모델이 너무 커서 PC의 VRAM에 적합하지 않아 4K 영상 생성은 사실상 불가능에 가깝죠.

RTX 기반 영상 생성 파이프라인을 공개합니다. 이 파이프라인은 훨씬 적은 VRAM을 사용하여 비디오를 3배 빠르게 생성하고 4K로 업스케일링할 수 있도록 하며, 아티스트가 생성 결과를 정밀하게 제어할 수 있게 합니다.

파이프라인은 스토리보드를 제작한 뒤 이를 사실적인 키프레임으로 변환하고, 최종적으로 고품질 4K 영상으로 완성할 수 있도록 설계됐습니다. 이 파이프라인은 아티스트의 필요에 따라 조합 또는 수정 가능한 세 가지 블루프린트로 구성되죠.

장면에 필요한 에셋을 생성하는 3D 객체 생성기
블렌더에서 장면을 설정하고 이를 기반으로 사실적인 키프레임을 생성하는 3D 가이드 이미지 생성기
시작과 종료 키프레임을 따라 영상을 애니메이션화하고, NVIDIA RTX Video 기술을 활용해 4K로 업스케일링하는 영샹 생성기

이 파이프라인은 라이트릭스의 새로운 LTX-2 모델 출시로 완성됐으며, 오늘부터 다운로드할 수 있습니다.

LTX-2는 로컬 AI 영상 제작의 중요한 전환점으로 선도적인 클라우드 기반 모델에 필적하는 결과를 제공하는 동시에, 최대 20초 분량의 4K 영상을 뛰어난 비주얼 품질로 생성합니다. 이 모델은 내장 오디오, 멀티 키프레임 지원, 제어 가능성을 강화한 LoRA(Low-Rank Adaptation) 기반의 고급 컨디셔닝 기능을 갖춰, 클라우드 의존 없이도 영화 수준의 품질과 제어력을 제공하죠.

이 파이프라인은 컴피UI를 기반으로 구동됩니다. 최근 수개월 동안 NVIDIA는 컴피UI와 긴밀히 협력해 NVIDIA GPU에서 성능을 40% 최적화했으며, 최신 업데이트에는 NVFP4와 NVFP8 데이터 형식에 대한 지원이 추가됐는데요. 이를 종합하면 RTX 50 시리즈의 NVFP4 포맷 사용 시 성능은 3배 향상되고 VRAM 사용량은 60% 감소하며, NVFP8 포맷 사용 시 성능은 2배 향상되고 VRAM 사용량은 40% 감소합니다.

현재 컴피UI에서는 일부 주요 모델에 대해 NVFP4와 NVFP8 체크포인트를 직접 사용할 수 있습니다. 해당 모델에는 라이트릭스의 LTX-2, 블랙 포레스트 랩스(Black Forest Labs)의 플럭스.1(FLUX.1)과 플럭스.2(FLUX.2), 알리바바의 큐웬-이미지(Qwen-Image)와 Z-이미지(Z-Image)가 포함됩니다. 곧 추가 모델 지원도 제공될 예정입니다.

비디오 클립 생성 이후에는 컴피UI의 새로운 RTX 비디오 노드를 사용해 단 몇 초 만에 4K로 업스케일링할 수 있습니다. 이 업스케일러는 실시간으로 작동하며, 가장자리를 선명하게 하고 압축 아티팩트를 제거해 깨끗한 최종 이미지를 제공하죠. RTX 비디오는 다음 달 컴피UI에서 제공될 예정입니다.

사용자가 GPU 메모리 한계를 넘어설 수 있도록, 컴피UI와 협력해 ‘웨이트 스트리밍(weight streaming)’으로 알려진 메모리 오프로딩 기능을 개선했습니다. 웨이트 스트리밍을 활성화하면 VRAM이 부족할 경우 시스템 RAM을 활용할 수 있어, 중급형 RTX GPU에서도 더 큰 모델과 복잡한 다단계 노드 그래프를 실행할 수 있죠.

영상 생성 워크플로우는 다음 달 다운로드할 수 있으며, LTX-2 비디오 모델의 오픈 웨이트와 컴피UI RTX 업데이트는 현재 이용할 수 있습니다.

PC 파일과 영상을 검색하는 새로운 방식

PC의 파일 검색 방식은 수십 년 동안 큰 변화가 없었습니다. 여전히 파일명과 불완전한 메타데이터에 주로 의존하고 있어, 작년에 작성한 특정 문서 하나를 찾는 일조차 필요 이상으로 어렵죠.

넥사AI(Nexa.ai)의 로컬 검색 에이전트 하이퍼링크는 RTX PC를 자연어 질문에 인라인 인용과 함께 답변할 수 있는 검색 가능한 지식 베이스로 전환합니다. 문서, 슬라이드, PDF, 이미지를 스캔하고 인덱싱해 파일명에 의존한 추측이 아닌 아이디어와 콘텐츠 중심의 검색을 가능하게 합니다. 모든 데이터는 로컬에서 처리돼 사용자 PC에만 저장되므로 개인정보 보호와 보안이 보장됩니다. 또한 RTX 가속을 통해 RTX 5090 GPU 기준 텍스트 및 이미지 파일 인덱싱은 기가바이트당 30초, 응답 시간은 3초에 불과합니다. 이는 CPU 기준 인덱싱이 기가바이트당 1시간, 응답 시간 90초가 소요되는 것과 비교해 대폭 향상된 성능을 제공하죠.

CES에서 넥사AI는 영상 콘텐츠를 지원하는 하이퍼링크의 새로운 베타 버전을 공개했습니다. 이를 통해 사용자는 비디오 내 객체, 동작, 음성을 검색할 수 있으며, B-롤을 찾는 영상 아티스트부터 하이라이트 장면을 공유하려는 게이머까지 폭넓게 활용할 수 있습니다.

하이퍼링크 프라이빗 베타 참여를 원하는 사용자는 웹페이지에서 신청할 수 있으며, 접근 권한은 이달부터 순차적으로 제공됩니다.

약 35% 더 빨라진 소형 언어 모델

라마.cpp에서 NVIDIA RTX PC 기반 LLM 성능 약 35% 향상

오픈소스 커뮤니티와 라마.cpp와 올라마를 기반으로 RTX GPU와 NVIDIA DGX Spark 데스크톱 슈퍼컴퓨터에서 SLM 성능이 크게 향상됐습니다. 이는 NVIDIA Nemotron 3 오픈 모델 제품군을 포함한 전문가 혼합(MoE) 모델에 특히 효과적이죠.

지난 4개월간 SLM 추론 성능은 라마.cpp에서 35%, 올라마에서 30% 향상됐습니다. 해당 업데이트는 현재 제공 중이며, 라마.cpp에는 LLM 로딩 시간을 단축하는 편의성 개선이 이미 포함됐습니다.

이러한 성능 향상은 LM 스튜디오(Studio)의 다음 업데이트에 반영되며, 신규 MSI AI 로봇 앱과 같은 에이전틱 애플리케이션에도 곧 적용됩니다. MSI AI 로봇 앱은 라마.cpp 최적화를 활용해 MSI 디바이스 설정을 제어할 수 있으며, 향후 업데이트에서 최신 개선 사항을 포함할 예정입니다.

NVIDIA Broadcast 2.1, 더 많은 PC 사용자에게 가상 키 라이트 제공

NVIDIA Broadcast 앱은 AI 효과를 통해 PC 마이크와 웹캠 품질을 개선해 라이브 스트리밍과 화상 회의에 적합한 환경을 제공합니다.

NVIDIA Broadcast 버전 2.1에서는 가상 키 라이트 효과가 업데이트돼 성능이 향상됐으며, RTX 3060 데스크톱 GPU 이상에서 사용할 수 있습니다. 또한 더 다양한 조명 환경을 처리하고 색온도 제어 범위를 확대했으며, 전문 스트리밍에서 흔히 사용되는 투 키 라이트 방식을 구현하기 위해 업데이트된 HDRi 기반 맵을 적용했죠. NVIDIA Broadcast 업데이트 버전을 다운로드할 수 있습니다.

DGX Spark로 집에서도 AI 크리에이티브 스튜디오 구축

매달 더욱 강력한 AI 모델이 PC에 등장함에 따라, 보다 강력하고 유연한 로컬 AI 환경에 대한 개발자들의 관심도 지속적으로 높아지고 있습니다. DGX Spark는 책상 위에 놓을 수 있는 콤팩트한 AI 슈퍼컴퓨터로, 메인 데스크톱이나 노트북과 연동해 실험, 프로토타이핑, 고급 AI 워크로드 실행을 가능하게 합니다.

DGX Spark는 LLM 테스트나 에이전틱 워크플로우 프로토타이핑에 관심 있는 사용자, 또는 메인 PC에서 편집을 위해 병렬로 에셋을 생성하려는 아티스트에게 적합합니다.

CES에서는 NVIDIA DGX Spark 출시 후 약 3개월 만에 최대 2.6배 향상된 성능을 제공하는 주요 AI 성능 업데이트도 공개했습니다.

라마.cpp에서 NVIDIA DGX Spark 기반 LLM 성능 약 35% 향상

또한 새로운 DGX Spark 플레이북도 제공됩니다. 여기에는 추측 디코딩을 위한 플레이북과 두 개의 DGX 스파크 모듈을 파인튜닝하는 플레이북이 포함됩니다.

페이스북, 인스타그램, 틱톡, X에서 NVIDIA AI PC를 팔로우하고 RTX AI PC 뉴스레터를 구독하고 최신 정보를 확인하세요. 링크드인과 X에서 NVIDIA Workstation도 팔로우하면 소식을 확인할 수 있습니다.

자세한 내용은 소프트웨어 제품 정보 관련 안내도 확인하세요.