넥스트 빅씽(Next Big Thing)이 무엇인지 알고 싶다면, 이를 개발하는 회사의 누군가에게 몇 번이고 물어보세요.
소니 그룹(Sony Group)의 R&D 센터인 도쿄 라보라토리16(Tokyo Laboratory 16)를 총괄하는 유이치 카게야마(Yuichi Kageyama)는 “AI는 다음 시대를 위한 핵심 도구이기 때문에 우리는 개발자들이 훌륭한 AI 결과를 도출하는 데 필요한 컴퓨팅 리소스를 제공하고 있습니다”라고 말했습니다.
내부적으로 GAIA라고 불리는 이 연구소의 컴퓨팅 리소스는 모든 소니 그룹 계열사에 대해 디지털 엔진 역할을 하고 있는데요. 현재 전사적으로 AI를 추진하기 위한 가속 컴퓨팅의 두 번째 연료 주입을 앞두고 있습니다.
소니 엔지니어들은 엑스페리아(Xperia) 스마트폰부터 엔터테인먼트 로봇 아이보(aibo), 전문가 및 소비자용 카메라에서 공장 자동화와 인공위성에 이르는 이미징 구성 요소 포트폴리오까지 머신 러닝 스마트 기능을 제품에 적용하고 있습니다. 심지어 차세대 첨단 이미징 칩을 만드는데도 AI를 사용하고 있죠.
비용은 낮추고, 성능 높이기
AI 시대로 효율적으로 이동하기 위해 소니는 NVIDIA Mellanox InfiniBand 네트워크에 연결된 NVIDIA DGX A100 시스템 클러스터를 설치하고 있습니다. 소니는 작년 10월에 자체 AI 훈련을 도입하며 조달한 NVIDIA V100 Tensor Core GPU를 사용해 기존 시스템 활용도를 거의 최대치로 확장했습니다.
카게야마는 “클라우드 서비스를 사용할 때는 AI 개발자들이 비용을 걱정했지만, 이제는 GAIA에서 AI 개발에 집중할 수 있습니다”라고 말했습니다.
자체 AI 엔진도 성능을 발휘하고 있는데요. 한 팀은 초고해상도 이미지 제공을 위한 딥 러닝 모델을 설계하고 리소스 추가를 통해 거의 16배 더 빠르게 모델을 훈련함으로써 한 달 워크로드를 하루로 단축했습니다.
소니 개발자를 위한 HPC와 딥 러닝 분산 기술을 총괄하는 요시키 타나카(Yoshiki Tanaka)는 “DGX A100의 컴퓨팅 파워, 확장된 GPU 메모리, 더 빠른 InfiniBand 네트워킹 덕분에 우리는 더 큰 데이터셋에서 훨씬 더 뛰어난 성능을 기대할 수 있습니다”라고 말했죠.
AI 파이프라인 지원
소니는 2018년에 딥 러닝의 빠른 속도를 활용해 일본 산업기술종합연구소(National Institute of Advanced Industrial Science and Technology)의 시스템에서 뉴럴 네트워크 라이브러리(Neural Network Libraries)를 가속화했습니다. 그리고 올해 CES(소비자전자제품 박람회)에서 선보인 전문 영화 제작용 에어피크(Airpeak) 드론과 같이 이미 머신 러닝으로 구동되는 제품을 출시하고 있습니다.
앞으로 기대할 것들도 더 많은데요.
카게야마는 “현재 훌륭한 프로젝트를 시작한 많은 비즈니스 팀과 협력하고 있기 때문에 2021 회계연도에 좋은 결과를 볼 수 있을 것입니다”라고 말했습니다.
NVIDIA는 “GPU 사용 문화를 구축”하기 위해 소프트웨어와 서비스를 제공하는 데 전력을 다하고 있습니다.
예를 들어, 소니 개발자는 AI 앱을 실행하는 데 필요한 모든 소프트웨어 구성요소에 NVIDIA의 온라인 컨테이너 레지스트리인 NGC를 사용합니다.
소니는 뉴럴 네트워크 라이브러리와 기타 유틸리티를 활용해 자체 컨테이너도 만들었으며 현재 NGC에서 이용 가능합니다. 이는 파이토치(PyTorch)와 텐서플로(TensorFlow)와 같이 대중화된 환경에서 작업 시 NVIDIA의 컨테이너를 보완합니다.
소프트웨어 지원
개발자들은 코드를 한 곳에 모으는 것이 작업을 단순화하고 가속화하는 데 도움이 된다고 말합니다.
일부 연구자들은 고성능 컴퓨팅 작업을 위해 이 시스템을 사용해 AI를 포함한 다양한 기술 애플리케이션을 가속화하는 NVIDIA CUDA 소프트웨어를 활용하고 있습니다.
NVIDIA는 소니를 지원하기 위해 작업 스케줄러를 제공하고 여러 GPU로 앱을 확장할 수 있는 기능을 NVIDIA의 라이브러리에 추가했습니다.
GAIA 시스템 개발을 이끄는 마사히로 하라(Masahiro Hara)는 “이렇게 복잡한 시스템에서 공정성과 높은 활용도를 달성하기 위해서는 좋은 관리 소프트웨어가 중요합니다”라고 말했습니다.
분석으로의 확장
또한 NVIDIA는 소니가 GAIA에서 자사 소프트웨어를 사용하는 방법에 대한 교육 프로그램을 만드는 것도 도왔습니다.
소니는 앞으로 데이터 분석과 시뮬레이션 분야까지 확장을 계획하고 있는데요. 현재 파이썬(Python) 프로그래머들이 데이터 사이언스에 GPU의 파워를 활용할 수 있도록, NVIDIA가 설계를 도운 오픈소스 소프트웨어인 RAPIDS를 평가하고 있습니다.
오늘 하루도 소니가 AI 분야에서 선두를 유지할 수 있도록 열심히 일한 카게야마는 재택근무가 끝난 후 아이들과 노는 것을 즐기는데요. 이 또한 디지털 감각을 유지하게 해준다고 합니다. “’마인크래프트(Minecraft)’에서는 제가 초보자이고 아이들이 저보다 훨씬 뛰어납니다.”