인기있는 오디션 쇼에서 초현실적인 아바타를 구현한 NVIDIA AI 기술

by NVIDIA Korea

현재 ‘아메리카 갓 탤런트(America’s Got Talent)’는 미국에서 황금시간대에 방영되는 두 번째로 최고의 인기를 누리는 TV 오디션 쇼입니다. 최근 결승전에서는 600만 명 이상의 시청객이 실시간으로 구현되는 AI 아바타 기술에 주목하는 일이 있었죠.

기술 스타트업의 글로벌 네트워크인 NVIDIA Inception 회원, 메타피식스(Metapysic)는 미국 NBC에서 최근 ‘아메리카 갓 탤런트’의 100만 달러의 상금과 라스 베가스 쇼의 헤드라인을 장식할 기회를 거머쥐기 위해 경합에 뛰어든 11명의 참여자 중 하나였죠. 메타피식스는 이 오디션 쇼에서 최초로 결승전에 이른 AI 참여자였습니다.

악평으로 유명한 심사위원 사이먼 코웰(Simon Cowell)이 “현재까지 방영됐던 시리즈 중 최고의 공연”이자 “이 쇼에서 가장 독특했던 공연”을 보였다고 칭찬한 이 팀은 무대에 서있던 가수들을 실시간으로 애니메이션화하여 AI 아바타를 현실처럼 탈바꿈한 무대를 선보였는데요.

준결승전에서 메타피식스 팀으로 나온 3명의 가수, 다니엘 에밋(Daniel Emmet), 패트릭 데일리(Patrick Dailey), 존 리센(John Riesen)은 오페라곡 “네순도르마(Nessun Dorma)”를 부르며 사이먼 코웰과 동료 심사위원인 호위 맨델(Howie Mandel), 진행자 테리 크루스(Terry Crews)를 재현한 AI 아바타에 그들의 목소리를 덧입혔죠. 결승곡을 위해서는 “역대 최고의 로큰롤 아이콘 중 하나를 재현”할 계획이라며 관객들의 궁금증을 계속 불러일으켰습니다.

https://youtu.be/2mDJSq7bInY

‘아메리카 갓 탤런트’의 우승자는 9월 14일에 발표됐습니다.

메타피식스의 공동 창업자 크리스 우메(Chris Ume)와 함께 모습을 드러낸 공동 창업자 겸 CEO인 톰 그레이엄(Tom Graham)은 “아메리카 갓 탤런트 쇼에 메타피식스가 처음으로 공연을 하게 됨으로써 세상에서 가장 높은 시청률을 자랑하는 무대에서 AI가 활용되는 모습을 선보일 수 있게 됐다”고 전했습니다.

(왼쪽부터) 다니엘 에밋, 톰 그레이엄, 크리스 우메는 메타피식스 팀으로 “아메리카 갓 탤런트” 오디션에 참여했습니다. (사진: 트레이 패튼(Trae Patton)/NBC, 메타피식스 제공)

톰 그레이엄 CEO는 “최근 몇 년간 합성 미디어에 대해 인식이 전반적으로 확대됐지만, 메타피식스의 이번 공연은 인터넷에서 엔터테인먼트, 교육에 이르는 여러 분야에 AI 기술이 미래에 미칠 수 있는 영향을 보여줬다”라고 설명했습니다.

AI 인지도를 높이면서 상상력을 포착하다

런던에서 2021년에 설립된 메타피식스는 크리에이터들이 소위 ‘묘한 골짜기(uncanny valley)’라고 부르는 가상 정체성과 초현실적인 합성 콘텐츠의 지평선을 넓히기 위해 AI 기술을 개발하고 있는데요.

이 팀이 처음으로 입 소문이 나기 시작한 것은 작년에 배우 마일스 피셔(Miles Fisher)가 톰 크루즈의 AI 아바타를 애니메이션화한 영상을 틱톡(TikTok) 채널 ‘딥톰크루즈(DeepTomCruise)’에 올리면서였습니다. 그레이엄은 이 게시물이 약 1억건의 조회수를 기록했으며, “많은 사람들에게 합성 미디어의 놀라운 기능을 처음으로 소개했다”고 밝혔죠.

AI 아바타를 ‘아메리카 갓 탤런트’ 무대로 옮겨오면서, 메타피식스는 정교한 카메라 장치와 공연자들을 통해 AI 기술이 무대에서 실시간으로 작동되는 모습을 시연해 보이면서 수백만 명의 시청자들에게 다가갈 수 있었습니다.

무대 뒤에서 GPU를 가속화하는 AI

메타피식스의 AI 아바타 소프트웨어 파이프라인에는 NVIDIA Research에서 개발한 인기있는 StyleGAN의 변이모델이 포함됩니다. TensorFlow 딥 러닝 프레임워크를 사용하는 이 팀은 NVIDIA CUDA 소프트웨어에 의지하며 NVIDIA GPU로 작업을 가속화합니다.

메타피식스의 제품 혁신 부문 디렉터인 조 플라테(Jo Plaete)는 “NVIDIA의 하드웨어/소프트웨어 라이브러리가 없었다면, 이 수준까지 초현실적인 결과를 만들어내지 못했을 것”이라며 “NVIDIA 하드웨어 플랫폼이 제공하는 연산을 통해 더 크고 복잡한 모델을 신속하게 이터레이션할 수 있는 속도로 교육할 수 있어서 가장 완벽하게 조율된 결과를 얻을 수 있었습니다”라고 전했습니다.

AI 모델 개발 작업과 라이브 공연 중의 추론 작업을 위해 메타피식스는 NVIDIA A100 Tensor Core GPU을 비롯해 NVIDIA GPU가 탑재된 데이터센터 구성과 여러 워크스테이션은 물론 NVIDIA DGX 시스템을 사용합니다.

조 플라테는 “뛰어난 하드웨어의 지원 덕분에 필요할 때마다 문제를 아주 빠르게 해결할 수 있었다”며 “연구와 엔지니어링 팀의 도움을 얻게 되면 관련된 툴과 메타피식스 파이프라인에서 툴을 활용하는 방법에 대해 더 깊이 이해할 수 있다”고 설명합니다.

‘아메리카 갓 탤런트’에서의 공연에 이어 메타피식스는 엔터테인먼트 분야에서 몇 가지 협업을 더 추진할 계획입니다. 또한 사용자들이 자신만의 초현실적인 AI 아바타를 만들 수 있는 소비자 대면 플랫폼인 ‘에브리 애니원(Every Anyone)’을 출시하기도 했습니다.

이번 NVIDIA GTC무료 등록하고 온디멘드를 통해 AI와 메타버스 기술의 최신 기술을 알아보세요. 메타피식스는 “벤처 캐피털(VC)를 위한 AI: NVIDIA Inception 글로벌 스타트업 쇼케이스“에 패널로 참여했습니다.

메인 사진: 크리스 해스턴(Chris Haston)/NBC, 메타피식스 제공