스스로 배우는 인공지능이 물류 업계의 변화를 주도합니다

by NVIDIA Korea

물류 업계에서 가장 오랫동안 풀지 못한 과제 중 하나는 최단 경로를 찾는 일입니다.

1930년대에 처음으로 밝혀진 “외판원의 문제(traveling salesman problem)”은 최적의 시간과 자원을 사용해서 최단 시간으로 도시 간 이동하는 방법에 관련된 것인데요.

런던의 인공지능(AI) 스타트업 InstaDeep의 공동창립자 겸 CEO인 카림 베귀어(Karim Beguir)는 GPU 테크놀로지 컨퍼런스(GPU Technology Conference, 이하 GTC)에서 GPU로 구동되는 딥 러닝과 강화학습을 통한 해결책을 참가자들에게 설명했습니다.

 

외판원의 문제를 해결하기 위해 이전에는 최적화 솔버(optimization solvers), 경험적 접근(heuristics), 그리고 몬테카를로 트리 검색(Monte Carlo Tree Search) 알고리즘을 사용했는데요. 하지만 베귀어 CEO에 따르면 이러한 접근법들은 자체적으로 학습할 수 없다는 단점을 가지고 있습니다.

베귀어 CEO는 “이전에 해결된 문제들로부터 축적된 경험이 없습니다. 이 문제를 해결하기 위해서는 계산적인 투자로 무언가를 학습할 수 있다면 좋을 것입니다”라고 말했습니다.

베귀어 CEO는 딥 러닝 뉴럴 네트워크의 속도와 몬테 카를로 트리 검색의 계획적인 의사결정을 결합하는 최근의 연구 덕분에, 물류 분야를 변화시킬 돌파구를 찾았다고 덧붙였습니다.

구글 딥마인드(DeepMind)의 알파제로(AlphaZero)은 뉴럴 네트워크, 몬테카를로 트리 검색, 그리고 스스로의 플레이를 통해 배울 수 있는 능력을 결합한 프로그램인데요. 베귀어 CEO는 알파제로를 “새로운 유형의 AI 챔피언”이라고 부릅니다.

알파제로는 바둑, 장기, 체스 게임의 세계 챔피언들은 이기기 위해서 개발되었지만 그 영향은 게임 분야에만 국한되지 있지 않습니다.

베귀어 CEO는 “알파제로의 학습은 데이터가 제로인 상태에서 시작합니다. 시스템은 자기 대국을 통해 발생한 데이터로 학습을 합니다”라고 설명했습니다.

 

알파제로는 다니엘 카너먼(Daniel Kahneman)이 자신의 저서 “생각에 관한 생각(Thinking, Fast and Slow)”에서 서술한 인간의 두 가지 인지 과정을 연결합니다. 한 가지는 삶의 대부분을 지배하는 빠르고 직관적인 반응이고, 다른 한 가지는 좀 더 복잡한 문제를 해결하기 위해 사용되는 계획적인 생각입니다.

인체의 이러한 발달된 과정에 영감을 얻은 InstaDeep은 몬테 카를로 트리 검색을 딥 러닝에 대입하여, 알파제로를 비즈니스 상의 문제들을 해결하는데 적용하는 작업을 진행하고 있습니다. 해당 모델을 엔비디아 DGX-1 AI 슈퍼컴퓨터에서 실행하게 되면 놀라운 발전을 이루게 됩니다.

InstaDeep의 AI 알고리즘은 트레이닝을 받는 것이 아니라 처음부터 일을 시작합니다. 외판원의 문제 역시 점차 더 나은 경로를 찾아서 해결하게 되는 것이지요. 이 알고리즘은 보다 효율적인 포장 방법을 배우고 있으며, 물류 산업의 또 다른 과제를 해결하고 있습니다.

베귀어 CEO는 경험을 통해 배우는 AI를 만드는 것이 물류와 같은 산업 분야의 중대한 과제를 해결할 수 있다고 믿습니다. 다만 스스로 배우는 AI가 완벽한 비즈니스 솔루션이 되기에는 아직 갈 길이 멀다는 사실은 인정합니다.

베귀어 CEO는 “지금은 문제를 해결하는 단계이지만, 앞으로 더 많은 것을 해낼 수 있을 것입니다. 몇 년 후에 여러분의 시스템이 학습할 수 있는 능력이 없다면, 무언가 잘못하고 있는 것일 테지요”라고 말했습니다.

 

InstaDeep은 엔비디아의 인셉션 프로그램(Inception program)의 회원사 중 한 곳인데요. 엔비디아 인셉션은 스타트업들이 AI 및 데이터 사이언스를 발전시키는 데 도움을 주는 프로그램입니다.