알리바바(Alibaba)와 유니버시티 칼리지 런던(University College London)의 연구원들이 인기 실시간 전략 게임 스타크래프트(StarCraft)의 다양한 전략들을 혼합하여 실행하는 방법을 학습한 딥 러닝 기반 시스템을 개발했습니다.
이 대규모 다중 에이전트 시스템은 쿠다(CUDA), 타이탄 X(TITAN X), GTX 1080 GPU, 그리고 텐서플로우(TensorFlow) 딥 러닝 프레임워크와 심층 신경망 라이브러리(cuDNN)를 사용하는데요. 전투를 가장 잘 수행하는 방법에 대한 구체적인 지시 없이도 강화 학습을 통해 최고 수준의 게임 플레이어들이 사용하는 전략들을 학습했답니다. 이 소프트웨어는 시행 착오를 거쳐 역량을 개선했으며, 전투에 참여하는 유닛의 수와 유형에 따라 전략을 바꾸어 적용합니다.
논문 데이터베이스 사이트인 아카이브(arXiv)에 공개된 한 논문은 “다중 에이전트 양방향 조정 네트워크인 빅넷(BiCNet)은 양 팀 모두에 임의로 인공지능 에이전트들을 배분함으로써 다양한 지형에서 여러 유형의 전투를 해나갈 수 있습니다. 분석한 바에 따르면, 빅넷은 레이블이 지정된 데이터나 사람이 선보이는 직접적인 시연 같은 감독 없이도 숙련된 게임 플레이어처럼 다양한 유형의 협동 전략을 배울 수 있습니다.”라고 밝혔습니다.
해당 논문에 따르면 빅넷은 서로 다른 에이전트들을 사용하는 작업에도 간편하게 적용할 수 있습니다. 빅넷의 다중 베이스라인에 대한 접근방식은 실험을 통해 다양한 시나리오에서 평가되고 있는데요. 여기서 빅넷은 정상급의 성능을 자랑하며, 대규모 실생활 응용에 있어서도 상당한 잠재력을 보여주고 있습니다.
이러한 시스템이 광범위하게 실생활에 적용될 수 있는 방법을 모색하는 연구진들은 “실생활에서 인공지능을 적용하는 것은 종종 여러 에이전트들의 공동작업을 필요로 합니다. 에이전트 내 커뮤니케이션 및 협업을 위한 효율적인 학습은 인공지능 전반에 있어서 반드시 거쳐가야 할 단계입니다.”라고 말했습니다.
스타크래프트를 플레이하는 인공지능에 관한 더 많은 내용은 여기에서 확인해 보세요!