사전 훈련된 AI 모델이란 무엇인가?

어린 아이에게 유니콘이 무엇인지 가르치는 상황을 상상해보세요. 처음에 이것을 설명하려면 유니콘에 대한 어린이용 이미지를 보여주고 독특한 특징을 설명하는 게 좋을 겁니다.

그럼 인공지능(AI) 기계에 유니콘이 무엇인지 가르친다고 상상해보세요. 어디서부터 시작해야 할까요?

사전 훈련된 AI 모델은 해결책을 제공합니다.

사전 훈련된 AI 모델은 특정 작업을 수행하기 위해 대규모 데이터 세트에 대해 훈련된 딥 러닝 모델로, 데이터를 기반으로 패턴을 찾거나 예측하는 뇌와 같은 신경 알고리즘의 표현인데요. 이는 그대로 사용하거나 애플리케이션의 특정 요구사항에 맞게 미세 조정할 수 있습니다.

사전 훈련된 AI 모델을 사용하는 이유

사전 훈련된 모델을 사용하게 되면 AI 모델을 처음부터 구축하는 않고도 각 상황에 맞는 요구 항을 충족할 수 있도록 커스터마이징할 수 있습니다.

AI 애플리케이션을 구축할 때 먼저 개발자는 신화 속에 나오는 말 식별, 자율주행 자동차 안전 위험 감지, 의료 영상에 기반한 암 진단 등 특정 작업을 수행할 수 있는 AI 모델이 필요합니다. 또한 이런 모델은 무엇인가를 배울 수 있는 수많은 데이터가 필요하죠.

이 학습 과정에는 인커밍(incoming) 데이터의 여러 레이어를 거치고 각 레이어에서 목표 관련 특성들을 강조하는 작업이 수반됩니다.

예를 들어, 유니콘을 인식할 수 있는 모델을 만들려면 먼저 유니콘, 말, 고양이, 호랑이 등 여러 동물들의 이미지를 제공할 수 있습니다. 이것이 인커밍 데이터입니다.

그런 다음 선과 색상과 같은 단순한 것부터 시작하여 복잡한 구조적 특징으로 발전하는 대표적인 데이터 특성의 레이어가 구성됩니다. 이런 특성은 확률을 계산함으로써 다양한 관련성을 배정받게 되죠.

예를 들어, 생물이 고양이나 호랑이와 다르게 말에 가까워 보일수록 유니콘일 가능성이 더 커지는 것입니다. 이러한 확률 값은 AI 모델의 각 신경망 레이어에 저장되며, 레이어가 추가됨에 따라 표현된 사물에 대한 이해도가 더욱 높아집니다.

그런 모델을 처음부터 만들기 위해서는 종종 수십억 개의 데이터 행을 가진 방대한 데이터 세트가 필요한데요. 이는 비용이 많이 들고 얻기 어려울 수 있지만, 데이터 수를 낮추게 되면 모델의 성능이 저하될 수 있습니다.

가중치라고 알려진 사전 계산된 확률적 표현은 시간, 비용, 노력을 절감합니다. 사전 훈련된 모델은 이러한 가중치로 미리 구축되고 훈련됩니다.

정확한 대표 가중치가 많은 고품질의 사전 훈련된 모델을 사용하면 AI를 성공적으로 배치할 가능성이 높아지죠. 가중치를 수정할 수 있고 모델에 데이터를 추가해 커스터마이징이나 미세 조정을 더 많이 할 수 있습니다.

사전 훈련된 모델을 기반으로 하는 개발자는 밀집한 레이어에 대한 수많은 입력 데이터나 컴퓨팅 확률을 처리할 필요 없이 AI 애플리케이션을 더 빠르게 만들 수 있는 것입니다.

다시 말해, 사전 훈련된 AI 모델을 사용한다는 것은 천과 바늘과 실 대신 드레스나 셔츠를 가지고 필요에 맞게 맞춤 제작하는 것과 같습니다.

사전 훈련된 AI 모델은 종종 전이 학습에 사용되며, 여러 모델 아키텍처 유형을 기반으로 할 수 있습니다. 인기 있는 아키텍처 유형 중 하나로 트랜스포머 모델이 있습니다. 이 모델은 순차적 데이터의 관계를 추적하면서 맥락과 의미를 학습하는 신경망입니다.

NVIDIA Inception 프로그램의 프리미어 파트너인 AI 기업 클래리파이(Clarifai)의 플랫폼 수석 부사장인 알프레도 라모스(Alfredo Ramos)에 따르면, 사전 교육을 받은 모델은 AI 애플리케이션 개발 시간을 최대 1년까지 단축하고 비용을 수십만 달러 절감합니다.

사전 훈련된 모델이 AI를 발전시키는 방법은?

사전 훈련된 모델은 AI 개발을 단순화하고 가속화하기 때문에 수많은 개발자와 기업은 다양한 AI 활용 사례를 가속화하기 위해 이런 모델을 활용합니다.

사전 훈련된 모델이 AI를 발전시키는 주요 분야는 다음과 같습니다.

자연어 처리: 사전 훈련된 모델은 번역, 챗봇, 기타 자연어 처리 응용 프로그램에 사용됩니다. 종종 트랜스포머 모델 아키텍처를 기반으로 하는 대규모 언어 모델(LLM)은 사전 훈련된 모델에서 나온 것입니다. 사전 훈련된 LLM의 예로는 세계 최대 AI 모델 중 하나인 NVIDIA NeMo Megatron이 있습니다.
음성 AI: 사전 훈련된 모델은 음성 AI 애플리케이션이 다양한 언어를 사용하는 데 도움이 됩니다. 이런 사례로는 콜센터 자동화, AI 비서, 음성인식 기술 등이 있습니다.
컴퓨터 비전: 위에서 설명한 유니콘 사례처럼, 사전 훈련된 모델은 AI가 생물이나 물체, 장소와 사람을 빠르게 인식하도록 도울 수 있습니다. 이를 통해 사전 훈련된 모델은 컴퓨터 비전을 가속화하여 스포츠, 스마트 시티 등에 걸쳐 애플리케이션에 사람의 눈과 같은 비전 기능을 제공합니다.
헬스케어: 의료 애플리케이션의 경우 NVIDIA BioNeMo 서비스 및 프레임워크의 일부인 MegaMolBART와 같은 사전 훈련된 AI 모델은 화학의 언어를 이해하고 실제 분자 내 원자 간의 관계를 학습할 수 있으므로 과학계가 약물 발견을 가속화하는 강력한 도구를 제공합니다.
사이버 보안: 사전 훈련된 모델은 AI 기반 사이버 보안 솔루션을 구현하고 보안 분석가의 능력을 강화하여 위협을 더 빠르게 탐지할 수 있는 시작점이 됩니다. 예를 들어 인간과 기계의 디지털 지문 채취, 이상 징후 탐지, 민감한 정보 및 피싱 탐지 등의 사례에 쓰일 수 있습니다.
예술과 창의적인 워크플로우: 최근에 부상하는 AI 예술에 힘을 보태면서, 사전 훈련된 모델은 GauGAN와 NVIDIA Canvas와 같은 도구를 통해 창의적인 워크플로우를 가속화하는 데 도움이 될 수 있습니다.

사전 훈련된 AI 모델은 사용자 정의와 미세 조정이 사용되는 사례가 무한하기 때문에 산업 전반에 적용될 수 있습니다.

사전 훈련된 AI 모델을 사용할 수 있는 곳은?

구글(Google), 메타(Meta), 마이크로소프트(Microsoft), NVIDIA와 같은 기업들은 AI 모델을 구축하기 위해 최첨단 모델 아키텍처와 프레임워크를 발명하고 있습니다.

이는 때때로 모델 허브에서나 오픈 소스로 출시되기도 하여 사전에 훈련된 AI 모델을 미세 조정하고 정확도를 향상시키며 모델 저장소를 확장할 수 있습니다.

GPU에 최적화된 AI 소프트웨어, 모델, 쥬피터 노트북(Jupyter Notebook) 등이 모인 허브인 NVIDIA NGC에는 NVIDIA AI 플랫폼과 함께 사용하는 데 최적화된 AI 벤치마크와 교육 레시피뿐만 아니라 사전 훈련된 모델이 포함돼 있습니다.

완벽하게 관리되고 안전한 클라우드 네이티브 AI 및 데이터 분석 소프트웨어 제품군인 NVIDIA AI Enterprise에는 암호화 없이 사전 교육된 모델이 포함되어 있는데요. 이를 통해 NVIDIA 사전 훈련된 모델을 맞춤형 AI 애플리케이션에 통합하려는 개발자와 기업은 모델 가중치와 바이어스(bias)을 보고 설명력을 개선하고 쉽게 디버깅할 수 있습니다.

깃허브(GitHub), 허깅 페이스(Hugging Face)와 같은 허브에서도 수천 개의 오픈 소스 모델을 사용할 수 있습니다.

사전 훈련된 모델은 투명하고 설명이 가능하며 개인정보 보호규정을 준수하고 동의와 바이어스 없는 윤리적 데이터를 사용하여 훈련되는 것이 중요합니다.

AI 모델을 사전 훈련하는 NVIDIA

더 많은 개발자가 AI를 시제품에서 제품으로 만들 수 있도록 NVIDIA가 제공하는 사전 훈련된 모델은 다음과 같습니다.

NVIDIA SegFormer는 깃허브에서 사용할 수 있는 간단하고 효율적이며 강력하게 시맨틱(semantic) 분할을 하는 트랜스포머 모델입니다.
NVIDIA의 특수 제작 컴퓨터 비전 모델은 스마트 시티, 주차 관리, 여러 애플리케이션을 위한 수백만 개의 이미지에 대해 훈련된 모델입니다.
NVIDIA NeMo Megatron은 대화형 AI, 음성 AI, 생물학을 위한 고성능의 유연한 애플리케이션을 구축하기 위한 오픈소스 프레임워크인 NVIDIA NeMo의 일부로서 사용자 지정 가능한 세계 최대의 언어 모델입니다.
NVIDIA StyleGAN은 생성적 적대 네트워크(GAN)를 위한 스타일 기반 생성기 아키텍처로서, 다양한 스타일로 무한한 그림을 만들기 위해 전이 학습을 사용합니다.

또한 음성 AI 애플리케이션을 구축하고 배포하는 GPU 가속 소프트웨어 개발 키트인 NVIDIA Riva에는 10개 언어로 사전 훈련된 모델이 포함되어 있습니다.

또한 NVIDIA와 킹스 컬리지 런던(King’s College London)이 개발한 의료 연구를 위한 오픈 소스 AI 프레임워크인 MONAI에도 의료 영상을 위한 사전 훈련된 모델이 포함됩니다.

NVIDIA로 사전 훈련된 AI 모델에 대해 더 자세히 알아보세요!