이제 기업을 위한 맞춤형 생성형 AI 모델 개발 가속화가 곧 지원될 예정입니다! 개발자는 새로운 엔비디아 AI 파운데이션 모델(NVIDIA AI Foundation Models)을 통해 브라우저에서 직접 실험하고, 엔비디아 AI 파운데이션 엔드포인트(AI Foundation Endpoints)에서 애플리케이션 테스트와 고유한 비즈니스 데이터로 커스터마이징할 수 있습니다.
엔비디아 AI 파운데이션 모델은 엔터프라이즈급 사전 훈련된 모델의 엄선된 모음으로, 개발자가 엔터프라이즈 애플리케이션을 위한 맞춤형 생성형 AI 모델을 즉시 시작할 수 있도록 지원합니다.
오늘날 무료 오픈 소스 대규모 언어 모델(Large Language Models) 환경은 기업에게 마치 뷔페와 같은데요. 그래서 생성형 AI 애플리케이션을 구축하는 개발자에게는 이러한 방대한 양이 부담스러울 수 있습니다. 호환성, 보안, 모델 훈련에 사용되는 데이터 등 고유한 프로젝트와 비즈니스 요구 사항을 탐색해야 하기 때문입니다.
엔비디아에 최적화된 파운데이션 모델로 혁신 가속화
엔비디아 AI 파운데이션 모델을 브라우저에서 직접 간편한 사용자 인터페이스 또는 API를 통해 경험할 수 있습니다. 이러한 모델들은 엔터프라이즈 애플리케이션 내에서 성능을 테스트하기 위해 엔비디아 AI 파운데이션 엔드포인트에서 직접 액세스됩니다.
사용 가능한 모델에는 개발자가 독점 데이터로 커스터마이징을 간소화할 수 있도록 형식이 지정된 라마 2(Llama 2), 스테이블 디퓨전 XL(Stable Diffusion XL), 미스트랄(Mistral)과 같은 커뮤니티 모델이 포함됩니다. 아울러 최고의 처리량과 가장 낮은 지연 시간을 제공하고 모든 엔비디아 GPU 가속 스택에서 대규모로 실행될 수 있도록 엔비디아 텐서RT-LLM(TensorRT-LLM)으로 최적화되었습니다. 예를 들어, 텐서RT-LLM으로 최적화된 라마 2 모델은 엔비디아 H100에서 거의 2배 빠르게 실행됩니다.
새로운 네모트론-3 (Nemotron-3) 8B 파운데이션 모델 제품군은 헬스케어, 통신, 금융 서비스를 포함한 광범위한 산업 분야에서 오늘날 가장 진보된 엔터프라이즈 채팅과 Q&A 애플리케이션을 제작할 수 있도록 지원할 예정입니다.
이 모델은 안전하고 프로덕션용 생성형 AI 애플리케이션을 구축하는 고객을 위해 출발점이라고 할 수 있는데요. 엄격하게 소싱된 데이터세트를 기반으로 학습되며, 훨씬 더 큰 모델과 비슷한 성능으로 작동하므로 엔터프라이즈 배포에 이상적입니다.
네모트론-3 8B 모델의 다국어 기능은 핵심적인 차별화 요소입니다. 기본적으로 영어, 독일어, 러시아어, 스페인어, 프랑스어, 일본어, 중국어, 한국어, 이탈리아어, 네덜란드어 등 50개 이상의 언어를 능숙하게 지원합니다.
커스터마이징부터 배포까지 빠른 진행
비즈니스 기능 전반에 걸쳐 생성형 AI를 활용하는 기업에는 고유한 애플리케이션에 맞게 맞춤형 모델을 제작할 수 있는 AI 파운드리가 필요합니다. 엔비디아의 AI 파운드리는 엔비디아 AI 파운데이션 모델, 엔비디아 네모(NeMo) 프레임워크와 툴, 엔비디아 DGX 클라우드(DGX Cloud) AI 슈퍼컴퓨팅 서비스 등 세 가지 요소로 구성되었습니다. 이 세 가지 요소를 함께 사용해 맞춤형 생성형 AI 모델을 제작할 수 있는 엔드투엔드 엔터프라이즈 제품을 제공합니다.
커스터마이징된 모델을 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어를 통해 엔터프라이즈급 보안, 안정성과 지원과 함께 가속 컴퓨팅의 거의 모든 곳에 배포할 수 있습니다.
엔비디아 AI 파운데이션 모델은 엔비디아 NGC 카탈로그와 허깅 페이스(Hugging Face)에서 무료로 사용할 수 있으며, 마이크로소프트 애저(Microsoft Azure) AI 모델 카탈로그에서도 호스팅됩니다.