40년 전 처음 일본에서 출시된 이후로 글로벌 게임 업계의 전설이 된 팩맨(PAC-MAN)을 기억하시나요? 40년이 지난 지금 이 고전 게임이 AI에 힘입어 다시 태어났습니다.
엔비디아 연구소에서 개발한 일명 엔비디아 ‘GameGAN’이라고 불리는 이 강력한 인공지능(AI) 모델은 50,000편의 팩맨 에피소드를 훈련해, 기본적인 게임 엔진 없이도 팩맨의 모든 기능을 구현하는데요. 다시 말해, AI가 게임의 기본 규칙을 이해하지 않고도 믿을 수 있는 결과를 보여주며 게임을 성공적으로 재현한 것입니다.
GameGAN은 생성 대립 신경망(Generative Adversarial Network, 이하 GAN)를 활용해 컴퓨터 게임 엔진을 모방한 최초의 신경망 모델입니다. GAN 기반 모델은 생성모델과 분류모델이라는 두 개의 신경망으로 구성돼 있으며 새로운 콘텐츠를 본래 데이터라고 착각할 정도로 원본과 흡사하게 생성하는 방법을 학습합니다.
김승욱 엔비디아 연구원 겸 프로젝트 수석 저자는 “GameGAN은 GAN 기반 신경망을 활용해 게임 엔진을 모방한 최초의 연구입니다. AI가 게임 속에서 움직이는 에이전트의 스크린 플레이만 보고 주어진 환경의 규칙을 학습할 수 있는지 확인하고 싶었습니다. 그런데 AI가 이걸 해내더군요”라고 말했습니다.
인공 에이전트가 GAN 생성 게임을 할 때 GameGAN은 에이전트의 행동에 대응하면서 게임 환경 속에서 새로운 프레임을 실시간으로 생성합니다. GameGAN은 여러 레벨이나 여러 버전을 갖춘 게임의 스크린 플레이를 학습한 다음 GameGAN이 단 한번 도 본 적 없던 게임 레이아웃도 생성할 수 있죠.
이런 기능은 게임 개발자가 새로운 게임 레벨의 레이아웃을 자동으로 생성할 때, 혹은 AI 연구원이 자율 머신 훈련을 위한 시뮬레이터 시스템을 손쉽게 개발하고 싶을 때 사용할 수 있습니다.
GameGan 훈련을 위해 팩맨 데이터를 제공한 세계적인 게임 제작사 반다이 남코 엔터테인먼트(BANDAI NAMCO Entertainment)의 연구 개발사 반다이 남코 연구소 (BANDAI NAMCO Research Inc.)의 연구원 코이치로 츠츠미(Kichita Tsutsumi)는 “연구 결과를 보고 깜짝 놀랐습니다. AI가 게임 엔진 없이 대표적인 고전 게임인 팩맨을 재현했다는 것을 믿을 수가 없었죠. 이 연구는 게임 개발자들이 새로운 레벨의 레이아웃, 캐릭터, 심지어 게임 자체를 개발하기 위한 창의적인 프로세스를 어떻게 가속화할 수 있을지에 대한 가능성을 보여줍니다.”
올해 후반기면 누구나 엔비디아 AI 플레이그라운드(AI Playground)에서 이 연구를 통해 개발된 데모 게임을 경험할 수 있게 됩니다.
추억의 게임을 재탄생시킨 AI
팩맨 팬들은 집 근처 오락실에 가서 동전을 들고 미로 형태로 구성된 맵 속에서 고스트를 피하거나 물리치는 이 고전 게임을 하곤 했습니다. 핀볼 게임기 앞에서 왼쪽으로 가서 돌아 에어하키 게임대를 거쳐 곧장 직진하면 팩맨이 동그란 점들을 먹어치우며 고스트 잉키, 핑키, 블링키, 클라이드를 피해 도망가고 배경에선 팩맨 사운드트랙 음악이 들리곤 했죠.
1981년에만 해도 미국에서는 팩맨처럼 동전을 넣어 할 수 있는 오락게임을 75,000 시간동안 하려면 수십억 개의 동전을 써야 했습니다. 그 후 수십년 간 최고의 인기를 얻었던 팩맨은 PC로, 게임 콘솔로, 그리고 이제는 모바일 버전으로 진화했습니다.
GameGAN 에디션은 기존 게임 엔진 대신 신경망을 기반으로 팩맨 게임 환경을 생성합니다. AI는 한 프레임에서 다른 프레임으로 이동할 때마다 시각적인 일관성을 유지하기 위해 앞서 무엇이 생성됐는지 기억하면서 가상 세계를 추적하게 됩니다.
GAN은 게임의 종류와 상관없이 단순히 과거에 했던 게임 플레이가 녹화된 스크린과 에이전트의 키스트로크(keystroke) 정보를 수집하면서 규칙을 학습하는데요. 게임 개발자는 이런 도구를 사용해 기존 게임 레벨의 스크린 플레이를 학습 데이터로 삼아 해당 게임의 새로운 레이아웃을 자동으로 구성할 수 있습니다.
반다이남코 리서치의 데이터를 활용해 토론토에 위치한 엔비디아 AI 리서치 랩(NVIDIA AI Research Lab)의 김승욱 연구원과 관계자들은 엔비디아 DGX 시스템을 기반으로 팩맨 에피소드 (총 수백만 프레임)의 신경망과 게임을 플레이하는 AI 에이전트의 키스트로크 데이터를 짝을 지어 훈련시켰습니다.
이렇게 훈련된 GameGAN 모델은 일관된 미로 형태, 점, 파워 펠렛(Power Pellets)과 같이 게임 속에서 고정되어 움직이지 않는 요소와 고스트나 팩맨 자체처럼 움직이는 요소들을 생성합니다.
또 게임 속에서 적용되는 간단한 규칙에서 복잡한 핵심 규칙까지 모두 학습합니다. 기존 게임에서와 마찬가지로, 팩맨은 미로의 벽을 뚫고 지나갈 수 없습니다. 팩맨은 미로 속에서 이동하면서 점을 먹고, 파워 펠렛을 먹게 되면 유령운 파란색으로 변해 달아납니다. 팩맨이 한쪽에서 미로를 빠져나가면 반대편 쪽으로 순간 이동을 하기도 하죠. 그리고 유령과 부딪치면 화면이 깜박이면서 게임이 끝납니다.
GameGAN 모델은 움직이는 캐릭터와 배경을 분리할 수 있기 때문에 야외 미로로 배경을 재구성하거나 팩맨 모양을 사용자가 좋아하는 이모티콘으로 바꿀 수 있는데요. 게임 개발자들은 이 기능을 사용해 새로운 캐릭터 아이디어나 게임 테마를 시도해볼 수 있습니다.
게임을 너머, 자율 머신까지
자율 로봇은 보통 AI가 현실 세계에서 직접 사용되기에 앞서 환경 속 규칙을 학습할 수 있는 시뮬레이터를 통해 학습합니다. 개발자는 물체들이 상호 작용하는 방식과 환경 속에서 조명이 어떻게 작동할지에 대한 규칙을 코딩해야 하기 때문에 시뮬레이터를 개발하는 데 많은 시간이 소요됩니다.
시뮬레이터는 사물을 잡아 옮기는 방법을 학습하는 물류창고 로봇에서부터 음식이나 의약품을 운반하기 위해 인도 위를 이동하는 운반 로봇 등 모든 종류의 자율 머신을 개발하는 데 사용됩니다.
GameGAN은 이와 같은 용도의 복잡한 시뮬레이터를 개발 과정을 간단한 신경망만 학습으로 대체할 수 있다는 가능성을 보여줬습니다.
가령, 자동차에 카메라를 설치하면 카메라를 통해 도로의 모습이나 운전자가 운전대를 돌리거나 엑셀을 밟는 모습을 기록할 수 있죠. 이렇게 수집된 데이터는 운전자나 자율주행 자동차가 브레이크를 세게 밟는 등의 행동을 취할 경우 어떤 일이 벌어질지 예측하는 딥 러닝 모델을 훈련시키는 데 사용될 수 있을 겁니다.
토론토 엔비디아 리서치 랩 디렉터 산자 피들러(Sanja Fidler)는 “영상을 보면서 에이전트가 어떤 행동을 취하는 지 단순히 보기만해도 운전 규칙이나 물리학 법칙을 모방해 학습할 수 있는 AI가 개발될 수도 있습니다. GameGAN은 이 방향으로 나아가는 첫 걸음이라고 할 수 있죠”라고 말했습니다.
전세계에 200명 이상의 엔비디아 연구소 소속 과학자들이 AI, 컴퓨터 비전, 자율 주행 자동차, 로보틱스, 그래픽과 같은 분야를 집중적으로 연구하고 있습니다.
GameGAN의 개발에 엔비디아 연구원 산자 피들러, 김승욱, 조나 필리언(Jonah Philion), 토론토 대학생 유하우 저우(Yuhao Zhou), MIT 교수 안토니오 토랄바(Antonio Torralba)가 참여했습니다. 관련 논문은 6 월 열릴 CVPR(Conference on Computer Vision and Pattern Recognition)에서 발표될 예정입니다.
팩맨 & ©반다이 남코 엔터테인먼트