맛있는 치즈 피자나 도미노피자의 초콜릿 라바 크런치 케이크를 주문해 집으로 배달될 때 어떤 기술이 사용되는지 생각해 본 적 있나요?
전세계 수백명의 인공지능(AI), 데이터 사이언스, 딥 러닝 등 분야의 과학자들이 대거 참여하는 무료 온라인 행사 GTC 디지털(GTC Digital)에서 글로벌 피자 대기업 도미노가 펼칠 강연의 프리뷰 영상이 도미노의 링크드인(LinkedIn) 페이지에 게재됐는데요. 이 영상에서 도미노는 자사의 AI 플랫폼인 엔비디아 DGX-1 시스템의 숨겨진 비밀을 공개했습니다.
이 AI 시스템은 도미노가 자사의 배달 예측 모델과 자사 기밀 중 하나라고 밝힌 또 다른 독자적인 AI 모델을 훈련하는 데 도움을 주고 있다고 합니다. 이 시스템은 도미노의 두 번째 클러스터입니다.
도미노의 데이터 사이언스와 AI 관리자인 잭 프라고소(Zack Fragoso)는 “고객들은 피자를 주문했던 경험을 떠올릴 때 보통 어떤 피자를 주문할 지와 ‘피자를 집으로 배달시켜야지’만 생각하죠. 그 피자가 매장에서 집까지 배달되는 데 들어가는 숨은 노력과 기술까지 생각하진 못할 겁니다”라고 말했습니다.
도미노는 이 영상에서 도미노가 새로운 엔비디아 DGX-1 시스템을 어떻게 배달 받았는지 그리고 이를 어떻게 활용할 계획인지 설명하면서 새로운 차원의 배달과 언박싱 영상을 선보입니다.
프라고소는 “DGX는 매장에서 내려지는 모든 결정을 자동화하고 고객들에게는 높은 수준의 정보를 제공합니다”라고 덧붙였습니다.
올해 1월 프라고소는 자신이 이끄는 팀이 주문된 피자가 언제 배송 준비를 마칠지에 대한 예측 시간의 정확도를 75%에서 95%로 높였다고 엔비디아에 전했습니다. 이 모델은 현재 근무 중인 직원의 수, 대기 중인 주문의 복잡성, 현재 교통 상황을 고려해 예측정보를 제공합니다.
프라고소는 엔비디아 자사 블로그에 실린 ‘도미노가 AI 기술로 고객의 피자 취향을 파악하는 방법’이라는 글을 통해 “도미노는 매장에서 데이터 카탈로그를 작성하는 일을 탁월하게 잘 합니다. 하지만 최근까지 그런 대형 모델을 구축할 수 있는 하드웨어가 없었습니다” 라며, “DGX 서버가 생긴 다음부터는 한 시간 내에 훨씬 더 복잡한 모델을 훈련시킬 수 있었습니다. 속도가 약 72배가량 빨라져 새로운 데이터를 추가해 모델을 개선하는 등 버전 업그레이드를 매우 빠르게 할 수 있었습니다. 현재 생산중인 모델은 버전 3입니다”라고 덧붙였습니다.
위 블로그에서 언급했듯이 도미노의 다음 과제는 엔비디아 튜링(Turing) T4 GPU를 활용해 실시간 예측이 수반되는 도미노의 업무에 필요한 AI 추론 업무를 가속화하는 것입니다.
프라고소는 “모델 지연 시간은 매우 중요한 부분이기 때문에, T4을 사용해 추론 스택을 구축해 현재 생산중인 AI 모델들을 호스팅하고 있습니다. 지연시간이 50ms에서 10ms 미만으로 크게 개선된 사례도 있었습니다”라고 말했습니다.
도미노는 GTC 디지털에서 성공의 비결에 대한 녹화 강연을 제공할 예정입니다. 강연의 제목은 ‘엔터프라이즈 AI를 위한 도미노의 레시피: GPU, 협업, 속도의 만남(Domino’s Recipe for Enterprise AI: Blending GPUs, Collaboration, and Speed) 입니다.