새로운 오픈 모델 제품군 가속화하는 NVIDIA와 Mistral AI

프론티어급에서 콤팩트 모델까지 포괄하는 새로운 미스트랄 3 제품군은 NVIDIA 플랫폼에 최적화됐습니다.
by NVIDIA Korea

NVIDIA 슈퍼컴퓨팅과 엣지 플랫폼 전반에 최적화된 오픈소스 다국어·멀티모달 모델 제품군인 미스트랄 AI(Mistral AI)의 ‘미스트랄 3(Mistral 3)’가 발표됐습니다.

미스트랄 라지 3는 전문가 혼합 방식(mixture-of-experts, MoE) 모델로, 모든 토큰마다 모든 뉴런을 구동하는 대신 가장 영향력이 큰 모델의 일부만 활성화하는데요. 그 결과 불필요한 낭비 없이 확장성과 정확성을 동시에 제공하며, 엔터프라이즈 AI를 가능성을 넘어 실용의 영역으로 끌어올립니다.

미스트랄 AI의 신형 모델들은 엔터프라이즈 AI 분야에서 업계 최고 수준의 정확도와 효율성을 제공합니다. 2025년 12월 2일(현지 시간)부터 클라우드, 데이터센터, 엣지 환경 전반에서 활용되고 있습니다.

410억 개의 활성 매개변수와 총 6,750억 개의 매개변수, 25만 6천 개의 대용량 컨텍스트 윈도우를 갖춘 미스트랄 라지 3는 엔터프라이즈 AI 워크로드에 확장성, 효율성, 적응성을 제공합니다.

NVIDIA GB200 NVL72 시스템과 미스트랄 AI의 MoE 아키텍처를 결합함으로써 기업들은 방대한 AI 모델을 효율적으로 배포하고 확장할 수 있으며, 고도화된 병렬 처리와 하드웨어 최적화의 혜택을 누릴 수 있죠.

이러한 조합은 미스트랄 AI가 ‘분산 지능(distributed intelligence)’이라고 부르는 시대를 향한 중요한 진전으로, 연구 성과와 실제 활용 사이의 간극을 좁히는 계기가 됩니다.

모델의 세분화된 MoE 아키텍처는 NVIDIA NVLink의 일관적인 메모리 도메인을 활용하고 광범위한 전문가 병렬 처리 최적화를 적용해 대규모 전문가 병렬 처리의 성능 이점을 극대화하죠.

이러한 이점은 정확성을 유지하는 저정밀도 NVFP4와 NVIDIA Dynamo의 분산형 추론 최적화와 결합돼 대규모 훈련과 추론을 위한 최고 성능을 보장합니다.

GB200 NVL72에서 미스트랄 라지 3는 이전 세대인 NVIDIA H200 대비 10배의 성능 향상을 달성했는데요. 이러한 세대 간 성능 향상은 더 나은 사용자 경험, 토큰당 비용 절감, 에너지 효율 증대로 이어집니다.

미스트랄 AI는 첨단 거대 언어 모델(LLM)의 기술 수준을 선도하는 데 그치지 않고, 개발자가 어디서든 AI를 실행할 수 있도록 지원하는 9개의 소형 언어 모델 또한 공개했습니다.

소형의 미니스트랄 3 제품군은 NVIDIA Spark, RTX PC 또는 노트북, NVIDIA Jetson 디바이스 등 NVIDIA의 엣지 플랫폼 전반에서 실행되도록 최적화됐습니다.

최상의 성능을 제공하기 위해 NVIDIA는 라마.cpp(llama.cpp), 올라마(Ollama) 등 주요 AI 프레임워크와 협력해 NVIDIA GPU 기반 엣지 환경 전반에서 뛰어난 성능 구현을 가능하게 하죠.

이제 개발자와 AI 애호가들은 라마.cpp와 올라마를 통해 엣지 환경에서 빠르고 효율적으로 구동되는 미니스트랄 3 제품군을 체험할 수 있습니다.

미스트랄 3 모델 제품군은 누구나 자유롭게 이용할 수 있어 전 세계 연구자와 개발자가 자유롭게 실험하고, 맞춤화하고, AI 혁신을 가속하며 최첨단 기술에 대한 접근을 폭넓게 확장할 수 있도록 합니다.

미스트랄 AI의 모델을 Data Designer, Customizer, Guardrails, NeMo 에이전트 툴킷 등 AI 에이전트 라이프사이클 개발을 위한 오픈소스 NVIDIA NeMo 도구에 연동하면, 기업은 자사 활용 사례에 맞춰 모델을 더욱 정교하게 맞춤화할 수 있습니다. 이로써 프로토타입 단계에서 제품화까지의 전환 속도를 한층 높일 수 있죠.

클라우드부터 엣지까지 효율성을 확보하기 위해 NVIDIA는 NVIDIA TensorRT-LLM, SGLang, vLLM 등 추론 프레임워크를 미스트랄 3 모델 제품군에 맞춰 최적화했습니다.

미스트랄 3는 현재 주요 오픈소스 플랫폼과 클라우드 서비스 제공업체를 통해 이용할 수 있습니다. 또한, 가까운 시일 내 NVIDIA NIM 마이크로서비스 형태로도 배포될 예정입니다.

이 모델들은 AI가 요구되는 다양한 환경에서 즉시 적용될 수 있도록 설계돼 있습니다.

소프트웨어 제품 정보에 관한 공지를 확인하세요.