NVIDIA는 두 가지 새로운 대규모 언어 모델(LLM) 클라우드 AI 서비스 NVIDIA NeMo LLM(Large Language Model) 서비스와 NVIDIA BioNeMo LLM(Large Language Model) 서비스를 발표했습니다. 이 서비스는 개발자가 LLM을 쉽게 적응시키고 콘텐츠 생성, 텍스트 요약, 챗봇, 코드 개발뿐만 아니라 단백질 구조와 생체 분자 특성 예측 등을 위한 맞춤형 AI 애플리케이션을 배포할 수 있도록 지원합니다.
NeMo LLM 서비스를 통해 개발자는 NVIDIA 관리 인프라에서 프롬프트 러닝이라는 훈련 방법을 사용하여 사전 훈련된 여러 기초 모델을 신속하게 조정할 수 있는데요. NVIDIA BioNeMo 서비스는 LLM 사용을 언어 분야를 넘어 과학 애플리케이션으로 확장함으로써 제약, 생명 공학 회사의 약물 발견을 가속화하는 클라우드 API(응용 프로그래밍 인터페이스)입니다.
NVIDIA의 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “대규모 언어 모델은 모든 산업을 변화시킬 잠재력을 가지고 있습니다. 기초 모델을 조정할 수 있는 능력은 수백만 명의 개발자가 LLM의 힘을 활용할 수 있게 함으로써, 이제 처음부터 대규모 모델을 구축할 필요 없이 언어 서비스를 만들고 과학적 발견을 강화할 수 있습니다”라고 말했습니다.
NeMo LLM 서비스, 프롬프트 러닝으로 정확도 높이고 배포 가속화
NeMo LLM 서비스를 통해 개발자는 자체 훈련 데이터를 사용해 30억 개의 파라미터부터 세계 최대 LLM 중 하나인 Megatron 530B에 이르는 기초 모델을 커스터마이징할 수 있습니다. 모델을 처음부터 훈련하려면 몇 주에서 몇 개월까지 소요되지만, 이 프로세스에 걸리는 시간은 단 몇 분에서 몇 시간에 불과하죠.
모델은 p-튜닝이라는 기술을 사용하는 프롬프트 러닝으로 커스터마이징됩니다. 이를 통해 개발자는 원래 수십억 개의 데이터 포인트로 훈련된 기초 모델을 수백 개의 예제만 사용하여 신속하게 조정할 수 있죠. 커스터마이징 프로세스는 작업별 프롬프트 토큰을 생성한 다음 기초 모델과 결합하여 특정 사용 사례에 대해 더 높은 정확도와 관련성 높은 응답을 제공합니다.
개발자는 동일한 모델을 사용하여 여러 사용 사례에 맞게 커스터마이징하고 다양한 프롬프트 토큰을 생성할 수 있습니다. 플레이그라운드 기능은 모델을 쉽게 실험하고 상호 작용할 수 있는 코드 없는 옵션을 제공하여 산업별 사용 사례에 대한 LLM의 효율성과 접근성을 더욱 향상시킵니다.
배포할 준비가 되면 조정된 모델을 클라우드 인스턴스나 온프레미스 시스템, 또는 API를 통해 실행할 수 있습니다.
대규모 모델의 힘을 활용할 수 있게 해주는 BioNeMo LLM 서비스
BioNeMo LLM 서비스에는 화학, 생물학 애플리케이션을 위한 두 가지 새로운 BioNeMo 언어 모델이 포함되어 있습니다. 이는 단백질, DNA, 생화학 데이터에 대한 지원을 제공하여 연구자가 생물학적 서열에서 패턴과 통찰력을 발견하는 데 도움을 주죠.
BioNeMo는 연구원들이 수십억 개의 파라미터를 포함하는 모델을 활용하여 작업 범위를 확장할 수 있도록 하는데요. 이렇게 더 큰 모델은 단백질 구조와 유전자 간의 진화적 관계에 대한 더 많은 정보를 저장할 수 있으며, 치료 애플리케이션을 위한 새로운 생체 분자를 생성할 수도 있습니다.
클라우드 API, Megatron 530B와 다른 기존 모델에 대한 액세스 제공
기초 모델 조정 외에도, LLM 서비스에는 클라우드 API(Cloud API)를 통해 기존 또는 맞춤 모델을 사용하는 옵션이 포함됩니다.
이를 통해 개발자는 메가트론 530B를 포함하여 사전 훈련된 광범위한 LLM에 액세스할 수 있다. 또한 현재 오픈 베타 버전으로 제공되는 NVIDIA NeMo Megatron 프레임워크로 생성된 T5와 GPT-3 모델에 대한 액세스를 제공하며, 광범위한 애플리케이션과 다국어 서비스 요구 사항을 지원합니다.
자동차, 컴퓨팅, 교육, 의료, 통신 등 다양한 산업의 선도기업들은 NeMo Megatron을 사용하여 중국어, 영어, 한국어, 스웨덴어 등의 언어로 고객 서비스를 혁신하고 있습니다.
이용 정보
NeMo LLM과 BioNeMo 서비스, 클라우드 API는 다음 달부터 조기 액세스로 제공될 예정입니다. 자세한 내용은 지금 신청해서 확인해보세요.
NeMo Megatron 프레임워크의 베타 릴리스는 NVIDIA NGC에서 사용할 수 있으며, NVIDIA DGX Foundry, NVIDIA DGX SuperPOD와 아마존웹서비스(AWS), 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라(Oracle Cloud Infrastructure)의 가속화된 클라우드 인스턴스에서 실행하도록 최적화되어 있습니다.
NeMo Megatron 프레임워크를 경험해보고 싶은 개발자는 NVIDIA LaunchPad 랩에서 무료로 사용할 수 있습니다.
젠슨 황 CEO의 GTC 키노트에서 NVIDIA AI로 구동되는 대규모 언어 모델에 대해 자세히 알아보세요.