AI 개발 속도 최대 10배 높여주는 툴 킷 NVIDIA TLT 3.0 발표

by NVIDIA Korea

NVIDIA가 새로운 사전 훈련 모델과 Transfer Learning Toolkit(TLT) 3.0의 출시를 발표했습니다. TLT는 NVIDIA Train, Adapt, and Optimize(TAO) 플랫폼이 유도하는 AI 제작 워크플로우의 핵심 요소입니다. 이번 릴리스에는 컴퓨터 비전과 대화형 AI 분야에서 고도의 정확도와 성능을 갖춘 사전 훈련 모델들을 비롯하여 AI의 개발 속도를 최대 10배까지 높여줄 강력한 생산성 기능들이 포함됐습니다.

AI를 활용한 솔루션의 출시 경쟁이 치열한 상황에서 기업의 경쟁력은 최상의 개발용 툴에 접근할 수 있는지 여부에 좌우됩니다. 고도의 정확도와 성능을 갖춘 커스텀 AI 모델을 제작 환경에 배포하기까지 AI 제품 개발용 오픈 소스 모델들로 훈련을 진행하려는 시도에는 위험성이 수반되는데요. NVIDIA는 사전 훈련을 마친 고품질 모델과 TLT를 제공하여 대규모의 데이터 수집과 라벨링에 소요되는 비용을 절감합니다. 또한 AI/머신 러닝(ML) 모델들을 처음부터 훈련해야 하는 부담 또한 덜어주죠. 컴퓨터 비전과 음성 지원 서비스 시장에 새로 진입한 기업들은 이제 대규모의 AI 개발팀이 없이도 프로덕션 수준의 AI를 구축할 수 있습니다.

최신 릴리스의 주요 내용은 다음과 같습니다:

  • 엣지에서 실시간 추론을 지원하여 OpenPose 모델보다 9배 빠른 추론 성능을 달성하는 자세 예측 모델(pose-estimation model)
  • 인간 감지용 시맨틱 분할(semantic segmentation) 네트워크인 PeopleSemSegNet
  • 자동차 번호판의 감지와 인식, 심박수 모니터링, 감정 인식, 얼굴 특징점(facial landmarks) 검출 등의 여러 산업 활용 사례에서 사전 훈련을 마친 컴퓨터 비전 모델
  • 다양한 영역별 독점 데이터세트와 오픈 소스 데이터세트에서 훈련을 진행하는 새로운 음성 인식 모델 CitriNet
  • 질의응답용으로 새롭게 개발된 Megatron Uncased 모델을 비롯하여 음성 텍스트 변환, 개체명 인식, 구두점 처리, 텍스트 분류를 지원하는 사전 훈련 모델 다수
  • 아마존 웹 서비스(AWS), 구글 클라우드 플랫폼(GCP), 마이크로소프트 애저(Microsoft Azure)상에서의 훈련 지원
  • NVIDIA Triton과 비전 AI(vision AI)를 위한 DeepStream SDK, 대화형 AI를 위한 NVIDIA Riva에 즉시 배포 가능

빠른 시작 가이드

  • Transfer Learning Toolkit를 다운로드하고 개발자 리소스에 액세스하세요: 시작하기
  • NGC에서 모델을 다운로드하세요: 컴퓨터 비전 | 대화형 AI
  • 개발자를 위한 최신 튜토리얼을 확인하세요: NVIDIA Transfer Learning Toolkit로 2D 자세 예측 모델의 훈련과 최적화 진행하기. 1부 | 2부

데이터 생성과 라벨링 툴의 통합으로 AI의 속도와 정확도 개선

TLT 3.0은 대규모의 다양한 데이터를 고품질로 라벨링하여 제공하는 선도적 파트너사들의 플랫폼과 통합되어, 더 신속한 엔드-투-엔드 AI/ML 워크플로우를 지원합니다. 이 파트너사들의 서비스를 활용해 데이터의 생성과 주석화를 진행하고, TLT와 원활하게 통합하여 모델의 훈련과 최적화를 수행할 수 있습니다. 또한 해당 모델을 DeepStream SDK나 Riva로 배포하여 컴퓨터 비전과 대화형 AI 분야에서 신뢰도 높은 애플리케이션을 제작할 수도 있습니다.

TLT를 활용한 합성 데이터, 데이터 주석화와 관련한 정보를 파트너사들의 블로그 게시글과 튜토리얼에서 확인하세요.

NVIDIA의 사전 훈련된 모델과 Transfer Learning Toolkit에 대한 더 자세한 내용을 알아보세요.