오픈 모델, 데이터, 라이브러리로 구성된 NVIDIA Nemotron™ 3 제품군을 소개합니다! 이 제품군은 산업 전반에서 투명하고 효율적이며 목적에 맞게 특화된 에이전틱 AI 개발을 지원합니다.
Nemotron 3 모델은 Nano, Super, Ultra 규모로 제공되며, 혁신적인 하이브리드 잠재 전문가 혼합 방식(mixture-of-experts, MoE) 아키텍처를 도입했는데요. 이를 통해 개발자는 대규모 환경에서 신뢰할 수 있는 멀티 에이전트 시스템을 구축하고 배포할 수 있습니다.
기업들은 단일 모델 기반 챗봇에서 협업형 멀티 에이전트 AI 시스템으로 전환하고 있죠. 이에 개발자들은 통신 과부하, 맥락 이탈, 높은 추론 비용 등 점점 더 많은 과제에 직면하고 있습니다. 또한 복잡한 워크플로우를 자동화할 모델을 신뢰하기 위해 투명성에 대한 요구도 커지고 있는데요. Nemotron 3는 이러한 과제를 직접적으로 해결하며, 고객이 전문화된 에이전틱 AI를 구축하는 데 필요한 성능과 개방성을 제공합니다.
NVIDIA 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “오픈 혁신은 AI 발전의 토대입니다. Nemotron을 통해 첨단 AI를 개방형 플랫폼으로 전환함으로써 개발자들에게 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하고 있습니다”고 말했습니다.
NVIDIA Nemotron은 NVIDIA의 광범위한 소버린 AI 전략을 지원합니다. 유럽부터 한국에 이르기까지 다양한 조직들이 자체 데이터, 규제, 가치에 부합하는 AI 시스템을 구축할 수 있도록 개방적이고 투명하며 효율적인 모델 채택을 가능하게 하죠.
Nemotron 3의 초기 도입 기업들로는 액센츄어(Accenture), 케이던스(Cadence), 크라우드스트라이크(CrowdStrike), 커서(Cursor), 딜로이트(Deloitte), EY, 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 팔란티어(Palantir), 퍼플렉시티(Perplexity), 서비스나우(ServiceNow), 지멘스(Siemens), 시놉시스(Synopsys), 줌(Zoom) 등이 있습니다. 이들은 제조, 사이버보안, 소프트웨어 개발, 미디어, 커뮤니케이션 등 다양한 산업 전반의 AI 워크플로우를 구현하기 위해 Nemotron 제품군의 모델을 통합하고 있습니다.
서비스나우의 회장 겸 CEO인 Bill McDermott은 “NVIDIA와 서비스나우는 수년간 AI의 미래를 함께 만들어왔으며, 최고의 순간은 아직 오지 않았습니다. 오늘 저희는 모든 산업의 리더들이 에이전틱 AI 전략을 빠르게 추진할 수 있도록 지원하는 데 있어 중요한 진전을 이루고 있는데요. 서비스나우의 지능형 워크플로우 자동화와 NVIDIA Nemotron 3의 결합은 탁월한 효율성, 속도, 정확성을 바탕으로 계속해서 업계 표준을 제시할 것”이라고 소감을 밝혔습니다.
멀티 에이전트 AI 시스템이 확산됨에 따라, 개발자들은 최첨단 추론을 위해 독점 모델에 점점 더 의존하는 한편, 비용 절감을 위해 보다 효율적이고 맞춤화가 가능한 오픈 모델을 함께 활용하고 있죠. 단일 워크플로우 내에서 최전선 수준의 모델과 Nemotron 간에 작업을 라우팅하면, 에이전트의 지능을 극대화하는 동시에 토크노믹스를 최적화할 수 있습니다.
퍼플렉시티 CEO Aravind Srinivas는 “퍼플렉시티는 AI 어시스턴트와 같은 뛰어난 도구에 내장된 정확한 AI가 인간의 호기심을 증폭시킨다는 아이디어를 기반으로 구축됐습니다. 저희 에이전트 라우터를 통해 Nemotron 3 Ultra와 같은 최적화된 오픈 모델로 워크로드를 전달하거나, 고유한 역량이 요구되는 작업에는 선도적인 독점 모델을 활용할 수 있죠. 이를 통해 퍼플렉시티의 AI 어시스턴트는 탁월한 속도와 효율성, 확장성을 바탕으로 운영됩니다”고 말했습니다.
오픈 Nemotron 3 모델은 스타트업이 AI 에이전트를 보다 빠르게 개발하고 반복 개선할 수 있도록 지원하며, 프로토타입 단계부터 엔터프라이즈 배포에 이르기까지 혁신을 가속화합니다. 제너럴 캐털리스트(General Catalyst), 메이필드(Mayfield), 시에라 벤처스(Sierra Ventures)의 포트폴리오 기업들은 인간과 AI의 협업을 지원하는 AI 팀원을 구축하기 위해 Nemotron 3 도입을 검토하고 있습니다.
메이필드의 매니징 파트너인 Navin Chaddha는 “NVIDIA의 오픈 모델 스택과 NVIDIA Inception 프로그램은 초기 단계 기업에 실험과 차별화, 빠른 확장을 가능하게 하는 모델과 도구, 비용 효율적인 인프라를 제공합니다. Nemotron 3는 창업자들이 에이전틱 AI 애플리케이션과 AI 팀원을 구축하는 데 있어 빠른 출발을 가능하게 하고, NVIDIA의 방대한 설치 기반을 활용할 수 있도록 돕습니다”고 말했습니다.
Nemotron 3, 효율성과 정확성으로 멀티 에이전트 AI 재정의
Nemotron 3 MoE 모델 제품군은 세 가지 규모로 구성됩니다.
- Nemotron 3 Nano는 300억 개의 파라미터를 갖춘 소형 모델로, 한 번에 최대 30억 개의 파라미터를 활성화해 목적에 맞는 고효율 작업을 수행합니다.
- Nemotron 3 Super는 약 1,000억 개의 파라미터와 토큰당 최대 100억 개의 활성 파라미터를 갖춘 고정확도 추론 모델로, 멀티 에이전트 애플리케이션에 적합합니다.
- Nemotron 3 Ultra는 약 5,000억 개의 파라미터와 토큰당 최대 500억 개의 활성 파라미터를 갖춘 대규모 추론 엔진으로, 복잡한 AI 애플리케이션을 지원합니다.
현재 제공 중인 Nemotron 3 Nano는 컴퓨팅 비용 효율성이 가장 뛰어난 모델입니다. 낮은 추론 비용으로 소프트웨어 디버깅, 콘텐츠 요약, AI 어시스턴트 워크플로우, 정보 검색과 같은 작업에 최적화돼 있죠. 이 모델은 고유한 하이브리드 MoE 아키텍처를 활용해 효율성과 확장성 측면에서 향상된 성능을 제공합니다.
이러한 설계를 통해 Nemotron 3 Nano는 Nemotron 2 Nano 대비 최대 4배 높은 토큰 처리량을 달성하며, 추론 토큰 생성량을 최대 60%까지 줄여 추론 비용을 크게 절감합니다. 또한 100만 토큰 컨텍스트 윈도우를 지원해 더 많은 정보를 기억할 수 있으며, 장시간에 걸친 다단계 작업에서도 정보 간 연결성을 높여 정확도를 향상시키죠.
AI 성능을 벤치마킹하는 독립 평가 기관인 아티피셜 애널리시스(Artificial Analysis)는 Nemotron 3 Nano를 동일한 규모의 모델 중 가장 개방적이고 효율적이며, 정확도 측면에서도 선도적인 성능을 기록했다고 밝혔습니다.
Nemotron 3 Super는 낮은 지연 시간으로 다수의 협업 에이전트가 복잡한 작업을 수행해야 하는 애플리케이션에 강점을 보입니다. Nemotron 3 Ultra는 심층 연구와 전략적 계획 수립이 요구되는 AI 워크플로우를 위한 고급 추론 엔진 역할을 수행합니다.
Nemotron 3 Super와 Ultra는 NVIDIA Blackwell 아키텍처 기반의 초고효율 4비트 NVFP4 훈련 포맷을 사용해 메모리 요구 사항을 크게 줄이고 훈련 속도를 가속화합니다. 이러한 효율성 덕분에 기존 인프라에서도 높은 정밀도 포맷 대비 정확도를 유지한 채 더 대규모 모델 훈련이 가능하죠.
Nemotron 3 모델 제품군을 통해 개발자는 특정 워크로드에 적합한 규모의 오픈 모델을 선택할 수 있습니다. 또한 수십 개에서 수백 개의 에이전트로 확장하는 동시에 복잡한 워크플로우에서 더 빠르고 정확한 장기 추론 성능의 이점을 누릴 수 있죠.
AI 에이전트 맞춤화를 위한 새로운 오픈 도구와 데이터
NVIDIA는 전문화된 AI 에이전트를 구축을 위한 훈련 데이터세트와 최첨단 강화학습 라이브러리 컬렉션을 공개했습니다.
총 3조 개의 토큰으로 구성된 새로운 Nemotron 사전 훈련, 사후 훈련, 강화학습 데이터세트는 고도화된 추론과 코딩, 다단계 워크플로우 사례를 풍부하게 제공해 높은 역량을 갖춘 도메인 특화 에이전트 구축을 지원하는데요. Nemotron 에이전틱 세이프티 데이터세트(Nemotron Agentic Safety Dataset)는 실제 환경에서 수집된 원격 측정 데이터를 제공해, 복잡한 에이전트 시스템의 안전성을 평가하고 강화할 수 있도록 돕습니다.
개발 속도를 높이기 위해 NVIDIA Nemotron 모델의 훈련 환경과 사후 훈련 기반을 제공하는 오픈소스 라이브러리인 NeMo Gym, NeMo RL도 함께 공개됐습니다. 또한 모델의 안전성과 성능을 검증할 수 있도록 NeMo Evaluator도 선보였죠. 모든 도구와 데이터세트는 현재 깃허브(GitHub)와 허깅 페이스(Hugging Face)를 통해 제공되고 있습니다.
Nemotron 3는 LM 스튜디오(LM Studio), 라마.cpp(llama.cpp), SGLang, vLLM을 통해 지원됩니다. 이와 함께 프라임 인텔렉트(Prime Intellect)와 언슬로스(Unsloth)는 NeMo Gym의 즉시 사용 가능한 훈련 환경을 자사 워크플로우에 직접 통합하고 있으며, 이를 통해 강력한 강화학습 훈련 환경에 보다 빠르고 손쉽게 접근할 수 있습니다.
NVIDIA 오픈 모델 시작하기
Nemotron 3 Nano는 현재 허깅 페이스에서 제공되며, 베이스텐(Baseten), 딥인프라(DeepInfra), 파이어웍스(Fireworks), 프렌들리에이아이(FriendliAI), 오픈라우터(OpenRouter), 투게더 AI(Together AI) 등 추론 서비스 제공업체를 통해서도 이용할 수 있습니다.
Nemotron은 카우치베이스(Couchbase), 데이터로봇(DataRobot), H2O.ai, 제이프로그(JFrog), 람다(Lambda), 유아이패스(UiPath) 등 엔터프라이즈 AI, 데이터 인프라 플랫폼에서도 제공됩니다. 퍼블릭 클라우드 고객의 경우, Nemotron 3 Nano는 아마존웹서비스(Amazon Web Services, AWS)에서 아마존 베드록(Amazon Bedrock, 서버리스 방식)을 통해 제공될 예정이며, 구글 클라우드(Google Cloud), 코어위브(CoreWeave), 크루소(Crusoe), 마이크로소프트 파운드리(Microsoft Foundry), 네비우스(Nebius), 엔스케일(Nscale), 요타(Yotta)에서도 곧 지원될 예정입니다.
Nemotron 3 Nano는 NVIDIA 가속 인프라 전반에서 안전하고 확장 가능한 배포를 위해 NVIDIA NIM™ 마이크로서비스 형태로도 제공됩니다. 이를 통해 최고 수준의 개인정보 보호와 제어 기능을 보장합니다.
Nemotron 3 Super와 Nemotron 3 Ultra는 2026년 상반기에 제공될 예정입니다.
