방대한 환경 데이터 처리속도를 획기적으로 높이는데 기여한 엔비디아 GPU

by NVIDIA Korea
0506 블로그

해수면 온도나 풍속과 같은 환경 변수를 연구하는 과학자들은 방대한 양의 통계 데이터와 이를 처리하는데 소요되는 시간을 잘 조절해야 합니다.

사우디 아라비아의 킹 압둘라 과학기술대학교(KAUST) 연구팀은 이 두 마리 토끼를 동시에 잡기 위해 엔비디아 GPU를 사용해 이전 대비 두 배 빠른 속도로 통계 데이터를 처리하는 대규모 고화질 지역 모델을 구축했습니다. KAUST 연구팀은 세계적인 GPU 컨퍼런스인 GTC 디지털(GTC Digital)에서 과학자들이 예측의 정확성을 향상시키는 데 도움을 주는 소프트웨어를 선보였습니다.

KAUST 연구팀이 개발한 소프트웨어 패키지 엑사지오스탯(ExaGeoStat)은 수 백만 곳의 장소에서 수집한 데이터를 처리할 수 있죠. 엑사지오스탯은 엑사지오스탯알(ExaGeoStatR)을 통해 프로그래밍 언어 R로도 사용이 가능해 R언어에 익숙한 과학자들도 GPU를 가속화할 수 있습니다.

KAUST 연구원 사메 압둘라는 “통계학자들은 R언어에 대한 의존도가 높지만, 기존 소프트웨어들은 처리가능한 데이터 크기에 한계가 있다 보니 방대한 환경 데이터를 분석하는 데에는 유용하지 않았습니다. 우리의 목표는 과학자들이 CUDA 플랫폼에 대해 잘 알지 못해도 R 언어로 GPU로 가속화된 실험을 할 수 있도록 하는 것입니다”라고 말했습니다.

압둘라 연구팀은 여러 종류의 엔비디아 데이터 센터 GPU를 사용하고 있는데요. 가장 최근에는 혼합 정밀 컴퓨팅(mixed-precision computing)으로 기상 시뮬레이션의 속도를 높이는 엔비디아 V100 텐서 코어(Tensor Core) GPU를 도입했습니다.

기상 예측을 더욱 쉽고 빠르게

기후와 기상 모델 시뮬레이션은 매우 복잡하고 많은 시간이 소요되 전세계적으로 막대한 슈퍼컴퓨터 자원이 사용됩니다. 그러나 엑사지오스탯을 사용하면 이런 방대한 데이터를 분석하는 속도가 크게 빨라 집니다.

이 애플리케이션은 한 지역 내에서 각기 다른 곳의 기온, 토양 수분, 풍속 같은 측정치를 예측합니다. 예를 들어, 데이터 상으로 리야드의 기온이 섭씨 21라면, 이 애플리케이션은 동 시간대에 동쪽에 위치한 아부다비의 기온을 추정해서 알려 줍니다.

압둘라 연구팀은 예측의 범위를 확대하여 한 지역내에 있는 여러 장소 뿐 아니라 여러 시간대에 대한 기상정보도 예측하려고 연구 중입니다. 예를 들어, 현재의 뉴욕 데이터를 기반으로 필라델피아의 다음 주 풍속을 예측하는 것이죠.

이 소프트웨어는 방대한 규모의 시뮬레이션으로 예측하는 데 필요한 시스템 메모리를 줄여줘 과학자들이 예전보다 더 많은 기상 데이터를 다룰 수 있게 합니다. 따라서 데이터 연구자들은 시뮬레이션할 수 있는 지리적 범위가 넓어져 더 많은 곳에 대한 예측을 할 수 있게 된 겁니다.

연구팀은 주로 중동지역을 중심으로 약 2백만 개 지점의 데이터 모델을 실행합니다. 또 미시시피강 유역의 토양 수분 데이터에 엑사지오스탯을 적용해 미국의 여러 지역에서 더 많은 환경 데이터를 모델링하기로 계획 중입니다.

연구팀이 CPU 대신 GPU를 사용해 모델을 한번 반복처리 하는 데 소요된 시간은 400초에서 45초로 거의 10배가 빨라졌습니다. 전체 시뮬레이션을 수렴하는데 필요한 반복처리 횟수는 약 175회였습니다.

압둘라 연구원은 “연구소 컴퓨팅 센터에 V100 GPU를 탑재한 뒤 애플리케이션 실행 속도가 큰 폭으로 빨라졌습니다. 지금까지는 배정밀도(double precision)과 단정밀도(single precision)를 사용해 왔지만 텐서 코어를 사용한 뒤로는 반정밀도(half precision)로 시작하는 것도 기능해졌습니다”라고 말했습니다.

혼합 밀도(mixed-precision) 알고리즘을 사용하면 고성능, 고속 시뮬레이션 외에도 에너지 절감효과도 있습니다. 모델 실행에 필요한 시간과 전력 소모량이 줄어들기 때문이죠.

연구팀이 단정밀도와 배정밀도를 혼합해 사용하면서 엔비디아 V100 GPU 시스템에서 알고리즘 평균 속도가 1.9배 빨라졌습니다. 압둘라 연구팀의 차기 목표는 엔비디아 텐서 코어 기반 반정밀도 컴퓨팅이 애플리케이션을 얼마나 가속화할지 평가하는 것인데요. 연구팀은 이를 위해 KAUST의 엔비디아 V100 GPU와 함께 세상에서 가장 빠른 슈퍼컴퓨터인 오크리지 국립연구소의 서밋(Summit)를 사용할 예정입니다.

압둘라 팀의 연구에 대한 보다 상세한 내용은 GTC 디지털의 온디멘드 영상을 확인하세요. 이 공동연구에는 익스트림 컴퓨팅 연구센터(Extreme Computing Research Center) 소속 하템 리타이프, 데이브 키예스, 마르크 젠톤, 잉 선 등이 참여하였으며, KAUST의 통계프로그램이 사용됐습니다.

블로그 상단 메인 이미지는 중동지역과 아라비아해의 풍속 데이터를 캡처한 모습 입니다.