가속 컴퓨팅은 우리와 늘 함께하는 테크놀로지입니다. 한밤중의 고요한 집에서도 우리의 삶을 더욱 나은 것으로 만들어주죠.
예를 들어 여러분이 스트리밍으로 감상할 영화를 구매할 때 신용카드 사기를 방지합니다. 좋아할 만한 저녁 메뉴를 추천하고 신속한 배달을 주선하죠. 더 나아가 놀랄 만한 시각 효과로 영화감독에게 아카데미상을 안기기도 합니다.
가속 컴퓨팅이란?
가속 컴퓨팅(accelerated computing)은 특수한 하드웨어를 통해 작업 속도를 대폭 개선하는 방법으로, 자주 반복되는 작업을 묶는 병렬 처리 기법이 흔히 사용됩니다. 대개 직렬로 작업을 실행하는 CPU에 문제가 될 수 있는 까다로운 작업을 오프로드하는 방식입니다.
가속 컴퓨팅은 PC에서 태어나 슈퍼컴퓨터에서 번성했습니다. 오늘날 우리가 사용하는 휴대전화와 클라우드 서비스 일체에 적용돼 있죠. 그리고 이제는 데이터를 활용해 비즈니스를 혁신하려는 각종 기업들도 가속 컴퓨팅을 도입하고 있습니다.
가속 컴퓨터들은 CPU와 다른 유형의 프로세스들을 고루 혼합하는데요. 이 아키텍처는 때로 이기종 컴퓨팅(heterogeneous computing)이라 불리기도 합니다.
가속 컴퓨터 뜯어보기
GPU는 가장 널리 사용되는 액셀러레이터(accelerator)입니다. 데이터 처리 장치(DPU) 또한 가속 네트워킹 개선으로 인기를 모으며 급부상 중이죠. 이들은 각자의 역할을 수행하면서 호스트 CPU와도 어우러져 균형 잡힌 하나의 시스템을 구성합니다.
오늘날의 상업적/전문적 시스템 모두 가속 컴퓨팅을 채택해 머신 러닝과 데이터 애널리틱스, 시뮬레이션과 시각화 등의 작업을 처리합니다. 이 현대적인 스타일의 컴퓨팅은 뛰어난 성능과 에너지 효율을 제공하죠.
가속 컴퓨팅 대중화의 주역, PC
코프로세서(co-processor)라 불리는 특수 하드웨어는 오랜 세월 컴퓨터와 함께하며 호스트 CPU의 작업을 가속해왔습니다. PC에 진일보한 연산 기능을 더하는 부동 소수점 프로세서(floating-point processor)로 1980년경에 첫 유명세를 탔죠.
이후 10년 사이에 비디오 게임과 그래픽 관련 사용자 인터페이스가 인기를 얻으면서 그래픽 액셀러레이터에 대한 수요가 늘기 시작했습니다. 1993년 즈음에는 그래픽 관련 칩이나 카드를 생산하는 기업이 50여 곳에 육박했죠.
1999년에 NVIDIA는 3D 이미지 렌더링의 주요 작업을 CPU에서 오프로드하는 최초의 칩인 GeForce 256을 출시했습니다. GeForce 256은 병렬 처리를 위해 4개의 그래픽 파이프라인을 처음 사용한 칩이기도 합니다.
NVIDIA는 이를 그래픽 처리 장치(GPU)라 불렀는데요. 이로써 컴퓨터 액셀러레이터의 새로운 범주가 마련됐습니다.
전문가들이 병렬 처리를 활용하는 방법
2006년까지 NVIDIA가 출하한 GPU는 5억 개에 달합니다. NVIDIA는 겨우 3개의 그래픽 공급업체로 구성된 부문을 선도하며 또다른 혁신의 도래를 목격하고 있었죠.
일부 연구자들은 CPU가 힘을 발휘하지 못하는 작업들에 GPU를 투입할 목적으로 자체 코드들을 개발했습니다. 스탠퍼드대학교의 이안 벅(Ian Buck) 박사팀이 발표한 브룩(Brook)을 예로 들 수 있는데요. 브룩은 폭넓게 채택된 최초의 프로그래밍 모델로, 대중화된 C 언어를 병렬 처리에 맞춰 확장합니다.
이안 벅 박사는 NVIDIA에서 인턴으로 경력을 시작해 현재 가속 컴퓨팅 부문 부사장을 맡고 있습니다. 2006년에는 GPU 내의 병렬 처리 엔진을 모든 작업에 적용하게 해주는 프로그래밍 모델인 CUDA의 출시를 주도하기도 했습니다.
CUDA는 2007년에 G80 프로세서와 팀을 이뤄 NVIDIA GPU의 신규 제품군에 투입되며 가속 컴퓨팅의 응용 영역을 산업과 과학 분야로까지 넓혔습니다.
HPC + GPU = 과학 연구 가속화
이 GPU 제품군들은 테슬라(Tesla)와 페르미(Fermi), 케플러(Kepler), 맥스웰(Maxwell), 파스칼(Pascal), 볼타(Volta), 튜링(Turing), 암페어(Ampere) 등 혁신가의 이름을 딴 새로운 아키텍처와 함께 확장을 거듭하며 운명처럼 데이터센터를 향해갔습니다.
그 과정에서 1990년대의 그래픽 액셀러레이터들이 그랬듯 여러 경쟁자와 맞닥트리기도 했습니다. 가장 대표적으로 인모스(Inmos)의 참신한 병렬 프로세서인 트랜스퓨터(transputer) 등을 들 수 있죠.
티리아스 리서치(Tirias Research)의 케빈 크레웰(Kevin Krewell) 분석관은 “그럼에도 오직 GPU만이 생존한 건 소프트웨어 생태계 때문”이라고 설명합니다. “소프트웨어 생태계의 부재는 다른 제품들에게 종말의 전조나 다름없었습니다”
전세계의 고성능 컴퓨팅(HPC) 전문가들은 GPU를 탑재한 가속 HPC 시스템을 구축해 과학 분야를 개척합니다. 오늘날 이들의 작업은 천체물리학의 블랙홀과 게놈 시퀀싱 등 다양한 영역에 걸쳐 있습니다.
실제로 미국 오크릿지국립연구소(Oak Ridge National Lab)는 HPC 사용자를 위한 가속 컴퓨팅 안내서까지 출간한 바 있습니다.
가속 네트워크 개선하는 InfiniBand
이 슈퍼컴퓨터들 다수가 InfiniBand를 사용합니다. InfiniBand는 저지연의 고속 링크로 대규모의 분산형 GPU 네트워크 구축에 이상적이죠. 가속 네트워킹의 중요성을 인식한 NVIDIA는 2020년 4월에 InfiniBand의 개척자인 멜라녹스(Mellanox)를 인수했습니다.
그로부터 불과 6개월 뒤, NVIDIA는 최초의 DPU를 발표했습니다. 이 데이터 프로세서는 보안, 스토리지, 네트워크 가속화의 개념을 새롭게 정립하는 중인데요. 슈퍼컴퓨터와 클라우드 서비스, OEM 시스템과 제3자 소프트웨어 부문 등이 BlueField DPU의 로드맵에 관심을 집중하고 있습니다.
2021년 6월 기준으로 세계에서 가장 빠른 슈퍼컴퓨터 Top 500개 중 342개가 NVIDIA 테크놀로지를 사용하고 있었습니다. 그 중에서도 신규 시스템의 70퍼센트, 상위 10개 컴퓨터 중 8개가 NVIDIA 제품을 도입했죠.
CUDA 생태계는 지금까지 700개가 넘는 가속 애플리케이션을 만들어냈으며 신약 개발과 재난 대응, 더 나아가 화성 탐사 계획처럼 원대한 도전들을 지원하고 있습니다.
한편, 그래픽 또한 가속 컴퓨팅을 통해 또다른 도약을 이룩했습니다. 2018년에 출시된 NVIDIA Turing 아키텍처 기반 GeForce RTX GPU는 시각 테크놀로지의 성배와도 같은 레이 트레이싱을 최초 지원해 게임과 시뮬레이션에 실제와 같은 사실성을 부여했습니다.
AI, 가속 컴퓨팅의 거물급 애플리케이션
2012년에 테크놀로지 업계는 빅뱅을 경험합니다. 새롭고 강력한 형태의 컴퓨팅인 AI가 등장한 것인데요.
AI의 기본은 병렬 처리입니다. 따라서 연구자와 클라우드 서비스 제공자들은 딥 러닝 초창기부터 GPU 가속 컴퓨터를 사용해 자체 신경망을 훈련, 실행했죠.
각 수직 시장(vertical market) 전반을 선도하는 기업들 또한 가속 컴퓨팅에서 AI가 갖는 중요성을 빠르게 인지하고 다음과 같이 활용하기 시작했습니다.
- 아메리칸 익스프레스(American Express)는 AI로 신용카드 사기를 방지합니다.
- 클라우드 서비스들은 판매를 촉진하는 추천 시스템에 AI를 사용합니다.
- 여러 기업이 대화형 AI로 고객 서비스를 개선합니다.
- 통신사들은 스마트한 5G 서비스의 제공을 위해 AI를 탐구하고 있습니다.
- 영화 <아이리시맨(Irishman)>의 제작자들은 AI로 로버트 드니로와 알 파치노의 외모를 젊어 보이게 만들었습니다.
- <아이리시맨>을 보면서 도어대시(DoorDash)나 도미노 피자의 스마트 AI 서비스로 추천/배달받은 저녁식사를 함께 즐길 수 있습니다.
언젠가 모든 기업의 데이터기업화, 모든 서버의 가속컴퓨터화가 실현될 것입니다.
VM웨어(VMware)나 레드 햇(Red Hat)처럼 업계를 선도하는 주류 IT 소프트웨어 기업들 또한 이와 동일한 비전을 공유하며, 이에 따라 가속 컴퓨팅에 맞춤한 제품들을 내놓고 있습니다. 시스템 제조사들의 경우, 이미 열 개가 넘는 NVIDIA-Certified System을 출시했습니다. 이 가속 컴퓨터들은 모든 비즈니스 부문에서 즉시 사용이 가능하죠.
이들은 엔터프라이즈급 가속 컴퓨팅의 시대를 여는 수단이 되어줍니다. 이를 돕기 위해 NVIDIA는 NVIDIA AI Enterprise와 Base Command, Fleet Command 등의 제품과 사전 구축된 가속 애플리케이션들로 구성된 풀스택 솔루션을 NGC 카탈로그에서 제공 중입니다.
에너지 효율적 미래
존 헤네시(John Hennessey)와 데이비드 패터슨(David Patterson) 등의 컴퓨팅 베테랑들에 따르면 가속 컴퓨팅은 “성공으로 가는 유일한 길”입니다. 이들은 2017년에 컴퓨팅계의 노벨상에 해당하는 튜링상(Turing Award) 수상을 기념하는 자리에서 이러한 추세를 “도메인별 아키텍처”로 향해가는 움직임이라고 묘사한 바 있죠.
이 접근법이 미래의 상징으로 자리잡은 주된 이유는 높은 에너지 효율입니다. 일례로 AI 추론에서 GPU는 CPU보다 42배 월등한 에너지 효율을 제공합니다.
실제로 AI를 구동하는 전세계 CPU 전용 서버 일체를 GPU 가속 시스템으로 전환하면 연간 10조 와트시(watt-hour)에 달하는 엄청난 에너지를 절약할 수 있습니다. 이는 140만 가구의 1년치 에너지 소비량을 아끼는 것과 같죠.
가속 컴퓨팅의 전문가들 역시 이 같은 에너지 효율의 장점을 누리고 있습니다.
세계에서 에너지 효율이 가장 높은 슈퍼컴퓨터를 가리는 그린500(Green500)의 상위 40개 시스템 중 35개가 NVIDIA 테크놀로지로 구동되며, 그 중 9개가 10위권 내에 위치해 있습니다. 순위에 포함된 슈퍼컴퓨터 중에서도 NVIDIA GPU를 탑재한 시스템이 그렇지 않은 경우에 비해 3.5배 높은 에너지 효율을 기록하고 있어 이 같은 추세는 지속적으로 강화될 전망입니다.
보다 자세한 내용은 GTC의 가속 컴퓨팅 관련 대담을 확인하거나, 아래의 엔터프라이즈급 가속 컴퓨팅 관련 영상을 시청하세요.