딥러닝 작업은 머신러닝 전문가, 데이터 과학자, 엔지니어에게 있어 반복적이고 실험적이며 시간이 많이 소요되는 일입니다. 그러나 딥러닝을 추천 시스템과 같은 특정 애플리케이션 도메인에 적용하면, 기존의 상용 추천 시스템보다 규모에 맞춰 더 나은 예측을 제공할 수 있습니다.
추천 시스템은 우리가 듣는 음악, 읽는 책, 소셜 미디어를 통한 연결 방법, 쇼핑 방법에 대해 매일 우리가 내리는 결정에 영향을 미치기 때문에, 적절하고 신뢰할 만한 추천 시스템을 만드는 일에는 큰 책임이 따릅니다.
SDK로 딥러닝 개발을 대중화하는 것은 NVIDIA DNA의 핵심입니다.
올해 가을에 열린 ‘GTC 2020’에서 엔비디아 젠슨 황 CEO는 딥러닝 추천시스템 개발을 대중화하기 위해 오픈 소스 엔드 투 엔드 프레임 NVIDIA Merlin 오픈 베타를 발표했습니다.
NVIDIA Merlin을 통해 데이터 과학자, 머신러닝 엔지니어와 연구진은 GPU 가속 추천시스템을 기반으로 데이터 수집, 훈련, 구축을 위한 파이프라인을 가속화할 수 있습니다.
GTC 2020에 포함된 1000개 이상의 세션 중에 딥러닝 추천시스템을 개발하는데 도움이 되는 핵심 가이드 세션은 다음과 같습니다.
NVIDIA Merlin 추천 프레임에 대한 심층 분석 – GTC 세션: 이 세션은 신속한 실험, 생산 재교육, 저지연성과 높은 처리량 추천을 제공하는 Merlin 활용을 위한 추천 데이터세트, 딥러닝 기반 추천 모델에 공통적으로 쓰이는 엔지니어링 및 사전 처리 기능에 대한 정보를 제공합니다.
멀티 GPU 지원 및 신규 데이터 로더가 포함된 NVIDIA NVTablular 오픈베타 발표: NVTabular는 데이터 파이프라인에서 일반적으로 발생하는 문제를 해결하는 Merlin의 구성요소인 ETL(Extract, Transform, Load, 추출, 변환, 로드)입니다. Merlin이 반복가능한 데이터 로더를 포함하게 된 배경과 이유를 알아보고 PyTorch와 TensorFlow에 최적화된 NVTabular 데이터 로더가 워크플로우를 가속화하는 방법의 예를 확인할 수 있습니다.
NVIDIA Merlin 오픈베타를 통해 추천 시스템 교육을 가속화하기: HugeCTR은 Merlin의 교육용 구성요소로서, 최적화와 상호운용성을 용이하게 해주는 풍부한 세트로 구성되었습니다. HugeCTR의 최신 업데이트가 대규모 딥러닝 추천시스템용 워크플로우를 가속화하려는 NVIDIA의 행로를 어떻게 지원하는지 확인해보세요.
RecSys Challenge 2020 대회 우승: 추천시스템 대회 ‘RecSys Challenge 2020’에서 NVIDIA의 학제간 팀이 트위터 상호 작용 예측에 대한 공동 작업으로 1위를 차지했습니다. 기술적 관점의 학습에 대해 더욱 자세한 내용을 읽어보거나 GTC 세션 영상을 시청해 보십시오.