자동차 구입 시에 우리가 가장 먼저 생각하는 건 차종, 즉 모델입니다. 통근 비용 절약은 혼다 시빅(Honda Civic), 멋진 외관과 속도감은 쉐보레 콜벳(Chevy Corvette), 무거운 수하물의 운반은 포드 F-150(Ford F-150)을 고민하는 식이겠죠.
이 시대 최고의 혁신적 테크놀로지인 AI를 향한 여정의 경우 우리가 먼저 고민해야 할 것은 엔진, 즉 머신 러닝(ML) 모델입니다.
머신 러닝 모델이란?
ML 모델은 산더미 같은 데이터를 뒤져 패턴을 발견하거나 예측을 수행하는 알고리즘의 표현식입니다. 데이터를 연료 삼아 작동하는 ML 모델은 AI의 수학 엔진에 해당하죠.
가령 컴퓨터 비전용 ML 모델은 실시간 비디오 속 차량과 보행자를 식별할 수 있을 겁니다. 자연어 처리용 모델은 단어와 문장을 번역할 수 있겠죠.
다른 말로 표현하면, ML 모델은 오브젝트와 그들의 관계를 수학적으로 나타낸 표현형입니다. 소셜 네트워크 게시글의 ‘좋아요’부터 실험실 실험의 분자에 이르기까지, 무엇이든 오브젝트가 될 수 있습니다.
전천후 머신 러닝 모델
ML 모델의 피처가 될 수 있는 오브젝트에 제약이 없으므로 AI의 사용 범위에도 제한이 없습니다. 무궁무진한 조합이 탄생할 수 있죠.
데이터 사이언티스트들은 다양한 목적으로 사용될 ML 모델 일체를 만들어 왔으며, 현재 더 많은 모델이 개발 중에 있습니다.
ML 모델의 간단한 분류 체계
선형(linear) 모델은 대수학을 사용해 재무 계획 내 변수들 간의 관계를 예측합니다. 그래픽 모델은 소비자가 제품을 구매할지 여부 등의 확률을 도표로 표현하죠. ML 모델에 따라서는 나뭇가지의 메타포를 빌려 의사결정 분지도(decision tree), 또는 이 분지도들의 조합인 랜덤 포레스트(random forest)의 형태를 취하기도 합니다.
2012년에 일어난 소위 AI의 빅뱅에서 연구자들은 딥 러닝이 패턴 탐지와 예측을 가장 성공적으로 수행하는 기법임을 발견했습니다. 딥 러닝은 신경망이라 불리는 일종의 ML 모델을 사용하는데요. 이 모델이 뇌세포의 패턴과 기능에 착안해 만들어졌다는 이유로 신경망이라는 이름을 붙었습니다.
ML 모델의 대중화
딥 러닝이라는 용어 또한 ML 모델의 특정 구조에서 따온 이름입니다. 이 구조란 각 피처와 그들의 관계를 다층적으로 쌓아 올리는 것을 뜻합니다. 이를 테면 수학을 재료로 초대형 샌드위치를 만드는 셈입니다.
현재 두 종류의 딥 러닝 모델(자세한 설명은 여기를 참고하세요)이 패턴 발견의 측면에서 굉장한 정확도를 자랑하며 널리 활용되고 있습니다.
컴퓨터 비전에 자주 사용되는 합성곱 신경망(CNN)은 자율주행 자동차의 눈 역할을 하고, 의료 이미지에서 질병을 포착합니다. 언어와 문자를 분석하도록 조정된 반복 신경망(RNN)과 트랜스포머는 아마존 알렉사와 구글 어시스턴트, 애플 시리의 엔진으로 사용됩니다.
사전 훈련된 모델 고르기
CNN이나 RNN, 트랜스포머 등 적합한 모델군의 선택은 훌륭한 출발점이 되어줍니다. 하지만 아직 갈 길이 멀죠.
일례로 바하 500 경주에 참가할 생각이라면, 모래언덕용 스톡 자동차에 육중한 차체 안정 장치와 특수 타이어를 달아 직접 개조하거나, 해당 경주용으로 미리 구축되어 있는 차량을 구입할 수 있을 것입니다.
후자의 경우를 머신 러닝에서는 사전 훈련된 모델이라고 부릅니다. 개별 활용 사례의 데이터와 유사한 대규모 훈련 데이터로 미리 조정해둔 모델을 의미하죠. 데이터 간 관계에 해당하는 가중치(weight)와 편향(bias)이 의도된 용도에 맞춰 최적화돼 있습니다.
모델의 훈련에는 어마어마한 데이터세트와 방대한 AI 전문성, 상당한 컴퓨팅 능력이 필요합니다. 요령 있는 구매자들은 사전 훈련된 모델을 선택해 시간과 비용을 절약합니다.
사전 훈련 모델을 위한 선택, NGC 카탈로그
사전 훈련된 모델을 구하려면 신뢰할 수 있는 딜러를 찾아야 하는데요.
NVIDIA가 제공하는 온라인 라이브러리인 NGC 카탈로그에는 면밀한 검증을 거친 사전 훈련 모델이 가득합니다. 컴퓨터 비전과 대화형 AI 등 광범위한 AI 작업용 모델들이 준비되어 있습니다.
NGC 카탈로그의 모델들은 제품 이력과 함께 제공되므로 사용자는 자신이 선택하는 모델을 정확히 파악할 수 있습니다. 모델의 이력은 인력 고용 시에 활용되는 자격 인증과도 같습니다.
모델 이력은 해당 모델의 훈련 도메인, 훈련에 사용한 데이터세트, 예측 성능을 보여줍니다. 사용자가 투명성을 바탕으로 자신의 활용 사례에 적합한 모델을 자신 있게 선택하도록 해줍니다.
ML 모델의 추가 리소스
그뿐 아니라 NGC 모델들은 전이 학습(transfer learning)에도 준비돼 있습니다. 전이 학습은 모델이 구동될 정확한 환경, 즉 사용자의 애플리케이션 데이터에 모델을 맞추는 최종 조정 단계에 해당합니다.
NVIDIA는 NGC 카탈로그에서 선택한 모델을 조정할 도구도 함께 제공합니다. 바로 NVIDIA TAO입니다. 지금 조기 체험 프로그램에 등록할 수 있습니다.
더 자세한 정보는 다음을 확인하세요:
- 사전 훈련된 모델을 위한 NVIDIA 웹페이지
- NGC 카탈로그 가이드
- TAO와 관련 툴을 위한 NVIDIA 웹페이지
- 컴퓨터 비전용 사전 훈련 모델로 동작 인식 애플리케이션을 구축하는 개발자 블로그
- GTC 2021의 전이 학습 관련 대담(등록 시 무료 시청 가능)