지난 십여 년 사이 수조 달러 규모로 급성장한 전자 상거래는 이제 수십억 소비자가 애용하는 서비스가 됐습니다. 온라인 거래의 폭발적 증가 배경에는 개인 맞춤형 추천을 제공하는 엔진의 발전이 자리잡고 있죠.
추천 시스템은 개인 맞춤형 쇼핑을 지원합니다. 전자 상거래 사이트에서 제품을 검색할 때, 또는 다른 업무로 인터넷에 접속할 때 추천 내용이 화면에 등장하는 경험을 다들 해보았을 텐데요. 인터넷이 선사하는 크나큰 재미의 하나인 추천 시스템은 유례없는 규모의 데이터세트와 모델을 통해 발전을 거듭하는 중입니다.
NVIDIA Merlin은 추천 시스템이라는 로켓의 연료 역할을 합니다. 훈련과 추론을 강화해 데이터 활용 방안을 개선하고 NVIDIA GPU 가속 추천 시스템의 구축을 지원합니다.
현재 온라인 산업의 어깨는 그 어느 때보다도 무겁습니다. 이마케터(eMarketer)의 보고에 따르면 2021년 전세계 전자 상거래는 전년 대비 17% 가까이 늘어 5조 달러에 육박했습니다.
세계적 규모의 온라인 사이트라면 추천 시스템의 관련도(relevance)를 1%만 개선해도 수십억 건의 매출 신장을 기대할 수 있다고 하는데요.
오늘날 인터넷 기업들이 경쟁 우위 확보를 위해 추천 시스템에 투자를 늘리는 것도 당연한 일인 셈입니다.
시장조사기관 모르도르 인텔리전스(Mordor Intelligence)는 2020년에 21억 2,000만 달러 규모였던 추천 시스템 시장이 2026년에는 151억 3,000만 달러까지 성장할 것으로 전망했습니다. 규모와 속도 면에서 추천 엔진 시장의 성장세가 가장 두드러지는 곳으로는 아시아 태평양 지역을 꼽았습니다.
그러나 추천 시스템 산업은 관련도 개선에 필요한 데이터와 프로세스의 지속적 증가라는 난제에 직면해 있습니다. 이 데이터는 수십억 개의 제품/소비자 프로필에서 개인과 제품 간에 발생한 수조 건의 인터랙션(클릭, 뷰)으로 구성되죠.
이 정도 규모의 데이터라면 모델 훈련에만 수일이 걸립니다. 더 많은 데이터로 학습한 새 모델을 더 신속히 배포할수록 관련도도 더 훌륭히 개선됩니다.
각종 모델과 기법, 라이브러리를 제공하는 Merlin 컬렉션에 포함된 딥 러닝 기반 시스템 구축용 툴을 활용하면, 데이터를 테라바이트 단위로 처리해 예측을 개선하고 클릭 수를 늘릴 수 있습니다.
NVIDIA Merlin과 GPU로 추론 강화하는 스냅
이마케터에 따르면 2021년 미국의 디지털 광고액은 1,911억 달러에 달해 전년 대비 25.5%의 상승률을 기록했습니다.
소셜 미디어 애플리케이션 스냅챗(Snapchat)의 모회사인 스냅(Snap)은 캘리포니아주 산타모니카에 기반을 두고 있으며, 일간 활성 사용자 수는 3억 명을 넘어섭니다. 소셜 계정의 사진과 동영상 메시지 서비스에서 광고 수익을 창출합니다.
에반 스피겔(Evan Spiegel) 스냅 CEO는 3분기 실적 보고에서 “우리는 광고 파트너에게 유의미한 결과를 제공하는 한편, 지속적인 혁신을 통해 자사 플랫폼의 역량을 확대하고 커뮤니티에 기여할 것”이라고 밝혔습니다.
이 과정에서 스냅의 발목을 잡는 기술적 장애물로 자사 워크로드에 들어갈 값비싼 순위 모델의 지속적인 개발과 보다 복잡한 모델로의 확장, 그 과정에서 발생하는 비용의 절감 문제 등을 들 수 있는데요.
이를 극복하고자 스냅은 NVIDIA GPU와 Merlin을 도입해 자사의 콘텐츠 순위 집계 역량을 강화했습니다.
스냅의 니마 카제노우리(Nima Khajehnouri) 엔지니어링 부문 부사장은 “스냅은 NVIDIA GPU와 Merlin 소프트웨어로 머신 러닝 추론의 비용 대비 효율을 50% 늘리면서 지연시간은 2배로 줄여 컴퓨팅에 여유 공간을 확보했습니다. 이에 힘입어 규모와 정확도를 개선한 광고/콘텐츠 순위 모델을 실험, 배포할 수 있었습니다”라고 설명했습니다.
Merlin의 HugeCTR로 모델 훈련 강화하는 텐센트
중국 시가총액 1위의 몸값을 자랑하는 엔터테인먼트 기업 텐센트(Tencent)는 높은 인기를 구가하는 메시지 서비스 ‘위챗(WeChat)’과 결제 플랫폼 ‘위챗 페이(WeChat Pay)’를 운영하고 있습니다.
광고용 추천 시스템 모델들의 반복 작업을 신속히 수행해야 하는 텐센트 엔지니어들에게는 모델 훈련 성능의 강화가 절실한 상황이죠.
텐센트의 샹팅 콩(Xiangting Kong) 엔지니어는 “텐센트에서 광고용 추천 분야는 대내적으로 중요한 사업에 해당하며, 추천 시스템을 통해 전체 광고 수익을 높이고 있습니다”라고 말했습니다.
문제는 광고용 추천의 정확도를 개선하고자 샘플 피처와 데이터의 양을 늘리다 보면 훈련 시간이 길어져 모델의 갱신 주기에 악영향을 끼친다는 점입니다.
이와 관련해 샹팅 콩 엔지니어는 “광고용 추천 훈련 시스템의 훈련용 프레임워크로 HugeCTR을 통합해 모델 훈련의 갱신 주기를 앞당길 수 있습니다. 그 결과 모델이 훈련하는 샘플의 수가 늘어 온라인상의 효과들이 개선됩니다”라고 말했습니다.
그는 또한 훈련용 모델의 성능이 강화되면 훈련 데이터의 양을 늘려 해당 모델의 정확도를 개선하고 광고 수익을 높일 수 있다고 덧붙였습니다.
NVIDIA A100 GPU로 비용 절감하는 메이투안
메이투안(Meituan)의 사업은 요식업과 엔터테인먼트, 주문형 서비스 등 200여 개의 범주에 걸쳐 있습니다. 중국의 이 인터넷 대기업은 6억 6,700만 명이 넘는 활성 사용자와 830만 명의 상인들을 보유하고 있죠.
메이투안의 수석 기술전문가 준 황(Jun Huang)은 성능의 대규모 개선을 위해 훈련 샘플의 양과 모델의 복잡성 증대를 선호하는 편이라고 설명했습니다.
이 과정에서 자사의 모델들이 점차 복잡해짐에 따라 훈련용 프레임워크의 심도 있는 최적화가 어려워졌다는 점을 메이투안의 문제로 꼽았는데요.
“우리는 A100 GPU 기반 훈련 시스템에 NVIDIA HugeCTR을 통합하는 작업을 진행 중입니다. 이를 통해 비용 또한 크게 절감하고 있습니다. 이는 사전 최적화에 따른 결과일 뿐이며 향후에도 최적화를 계속할 여지는 얼마든지 있습니다”
최근 메이투안은 2021년 2분기의 12개월 후행(TTM) 거래자당 평균 거래 건수가 2020년 2분기 TTM의 25.7건에서 32.8건으로 증가했다고 보고한 바 있습니다.
NVIDIA Merlin과 NVIDIA Triton을 더 자세히 알아보세요.