AI 개발자 밋업에서 만나는 추천 시스템 NVIDIA Merlin의 모든 것

by NVIDIA Korea

NVIDIA가 이번주 8월 27일 금요일 오전 10시부터 ‘NVIDIA AI 개발자 밋업(AI Developer Meetup)’을 진행합니다. 이번 행사에서는 NVIDIA Merlin 추천 시스템 프레임워크에 대한 소개와 분야별 활용사례를 살펴봅니다.

맞춤형 검색 기능을 가능하게 하는 추천 알고리즘과 개인화 콘텐츠는 수억 명에 달하는 개인 인터넷 이용자들이 시청하고, 구매하며, 플레이하고 싶은 콘텐츠를 찾을 수 있도록 도움을 주고 있습니다. 추천 시스템은 넷플릭스, 아마존(Amazon), 페이스북(Facebook), 바이두(Baidu), 알리바바(Alibaba)와 같은 인터넷 기업이 성공할 수 있었던 결정적 요소입니다. 모든 추천 시스템이 스마트한 추천을 위해 필요한 데이터를 잘 처리하지는 못합니다. 그래서 훈련 속도가 저하되고 사용자의 편안한 인터넷 경험이 저해되기도 합니다.

NVIDIA는 이러한 문제를 해결하고 기업에서 스마트하고도 강력한 추천 시스템을 구축할 수 있도록 AI 기반 추천 시스템인 Merlin 프레임워크를 오픈 소스로 제공하고 있습니다. 이는 사용하기 쉬운 API로 되어 있어, GPU 가속 추천 시스템의 수집, 훈련, 배포를 위한 엔드-투-엔드 파이프라인을 통해 GPU 가속 추천 시스템을 보다 쉽게 적용할 수 있는 기업용 딥 러닝 추천 시스템 프레임워크입니다. 미디어, 엔터테인먼트, 온라인 상품 판매업 등 각 분야의 선도 업체들은 GPU 기반 가속 딥 러닝을 실행하기 위해 오픈 소스 추천 시스템을 사용하고 있습니다. 이를 통해 기존 방법보다 사용자의 클릭 횟수나 구매 횟수가 늘어날 뿐만 아니라 더 많은 고객이 유입되어 궁극적으로 기업이 더 나은 기술에 투자할 수 있도록 합니다.

세션 1.  딥 러닝 기반 추천 시스템의 미래와 추천 시스템 챌린지 우승 전략

소셜 미디어와 비디오 서비스 업체는 스크린 상에서 화면에 나타나거나 광고에 뜨는 추천 결과물에 Merlin이 어떠한 영향을 주는지를 평가하고 있습니다. 대형 온라인 상품판매 앱이나 소매업체들은 소비자에게 새로운 품목을 추천해주는 기능에 Merlin을 활용하는 방안을 고려하고 있습니다. 본 세션에서는 Merlin을 이용한 스냅(Snap), 텐센트(Tencent), 포스트메이츠(Postmates) 등 전 세계 주요 IT 대기업과의 다양한 산업 협업 사례를 통해 Merlin과 딥 러닝 기반 추천 시스템의 현재와 미래에 대해 함께 알아봅니다.

올해 NVIDIA는 ACM RecSys 챌린지 2021(ACM RecSys Challenge 2021), SIGIR 이커머스 데이터 챌린지(SIGIR eCommerce Data Challenge), 부킹닷컴 챌린지(Booking.com Challenge) 등 세 개의 주요 추천 시스템 챌린지에서 Merlin을 활용해 우승을 차지했습니다. 사용자들이 마음에 들거나 리트윗이 필요한 트윗 추천, 유럽의 휴가객을 위한 실시간 다음 여행지 추천, 사용자 구매 취향, 추천 상품 예측 챌린지 등 다양한 추천 시스템 적용 사례도 함께 소개됩니다. 발표는 손석우(James Sohn) NVIDIA Merlin 프로덕트 매니저가 진행합니다.

세션 2. MLPerf 벤치마크 성능과 함께 Merlin 기술 뜯어보기

NVIDIA Merlin을 통해 데이터 사이언티스트, 머신 러닝 엔지니어와 연구진은 GPU 가속 추천시스템을 기반으로 데이터 수집, 훈련, 구축을 위한 파이프라인을 가속화할 수 있습니다. 이번 세션에서는 크게 딥 러닝 추천 시스템 구축을 위해 필요한 Merlin 프레임 워크의 세 축을 구성하고 있는 ETL(추출, 변환, 로드), NVTabular와 트레이닝용 HugeCTR, 추론에 활용되는 TRITON에 대해 알아봅니다. 또한, Merlin이 어떻게 딥 러닝 추천 시스템용 워크플로우를 쉽게 가속화할 수 있는지를 다룹니다.

지난 6월 30일 Merlin은 NVIDIA와 파트너 추천 시스템을 포함하여 모든 최신 MLPerf 트레이닝 벤치마크에서 기록을 세우며, 추천 시스템 트레이닝을 위한 가장 빠른 상용 솔루션으로서 입지를 강화했습니다. Merlin은 14개의 NVIDIA DGX 시스템에서 추천 시스템을 1분도 안 걸리는 시간으로 트레이닝 했습니다. 본 세션에서는 Merlin의 우수한 MLPerf 벤치마크 결과와 최적화 기법을 공개합니다. 발표는 이민석 NVIDIA HugeCTR 테크 리드가 진행합니다.

이외에도, NVIDIA의 딥 러닝 전문가들에게 궁금한 점을 물어보고 발표자로부터 답변을 들을 수 있는 질의 응답 세션과 이벤트도 진행됩니다. 온라인으로 진행되는 이번 행사의 사전 등록은 여기에서 선착순으로 접수 중입니다. 참가자 전원에게 별도로 줌(Zoom) 온라인 미팅룸 링크가 안내될 예정입니다.