딥러닝을 쉽게 따라할 수 있는 추천 시스템 리소스

by NVIDIA Korea
0104 블로그 메인이미지

딥러닝 작업은 머신러닝 전문가, 데이터 과학자, 엔지니어에게 있어 반복적이고 실험적이며 시간이 많이 소요되는 일입니다. 그러나 딥러닝을 추천 시스템과 같은 특정 애플리케이션 도메인에 적용하면, 기존의 상용 추천 시스템보다 규모에 맞춰 더 나은 예측을 제공할 수 있습니다.

추천 시스템은 우리가 듣는 음악, 읽는 책, 소셜 미디어를 통한 연결 방법, 쇼핑 방법에 대해 매일 우리가 내리는 결정에 영향을 미치기 때문에, 적절하고 신뢰할 만한 추천 시스템을 만드는 일에는 큰 책임이 따릅니다.

SDK로 딥러닝 개발을 대중화하는 것은 NVIDIA DNA의 핵심입니다.

0104 블로그 중간1
GTC2020 키노트: 추천 시스템 — 맞춤형의 인터넷 엔진

올해 가을에 열린 ‘GTC 2020’에서 엔비디아 젠슨 황 CEO는 딥러닝 추천시스템 개발을 대중화하기 위해 오픈 소스 엔드 투 엔드 프레임 NVIDIA Merlin 오픈 베타를 발표했습니다.

0104 블로그 중간2
GTC2020 키노트: NVIDIA Merlin 오픈 베타 발표

NVIDIA Merlin을 통해 데이터 과학자, 머신러닝 엔지니어와 연구진은 GPU 가속 추천시스템을 기반으로 데이터 수집, 훈련, 구축을 위한 파이프라인을 가속화할 수 있습니다.

GTC 2020에 포함된 1000개 이상의 세션 중에 딥러닝 추천시스템을 개발하는데 도움이 되는 핵심 가이드 세션은 다음과 같습니다.

NVIDIA Merlin 추천 프레임에 대한 심층 분석 – GTC 세션: 이 세션은 신속한 실험, 생산 재교육, 저지연성과 높은 처리량 추천을 제공하는 Merlin 활용을 위한 추천 데이터세트, 딥러닝 기반 추천 모델에 공통적으로 쓰이는 엔지니어링 및 사전 처리 기능에 대한 정보를 제공합니다.

멀티 GPU 지원 및 신규 데이터 로더가 포함된 NVIDIA NVTablular 오픈베타 발표: NVTabular는 데이터 파이프라인에서 일반적으로 발생하는 문제를 해결하는 Merlin의 구성요소인 ETL(Extract, Transform, Load, 추출, 변환, 로드)입니다. Merlin이 반복가능한 데이터 로더를 포함하게 된 배경과 이유를 알아보고 PyTorch와 TensorFlow에 최적화된 NVTabular 데이터 로더가 워크플로우를 가속화하는 방법의 예를 확인할 수 있습니다.

NVIDIA Merlin 오픈베타를 통해 추천 시스템 교육을 가속화하기: HugeCTR은 Merlin의 교육용 구성요소로서, 최적화와 상호운용성을 용이하게 해주는 풍부한 세트로 구성되었습니다. HugeCTR의 최신 업데이트가 대규모 딥러닝 추천시스템용 워크플로우를 가속화하려는 NVIDIA의 행로를 어떻게 지원하는지 확인해보세요.

RecSys Challenge 2020 대회 우승: 추천시스템 대회 ‘RecSys Challenge 2020’에서 NVIDIA의 학제간 팀이 트위터 상호 작용 예측에 대한 공동 작업으로 1위를 차지했습니다. 기술적 관점의 학습에 대해 더욱 자세한 내용을 읽어보거나 GTC 세션 영상을 시청해 보십시오.