별들의 날씨를 분석하는 NVIDIA 기술

NVIDIA GPU를 탑재한 슈퍼컴퓨터가 25개 외계 행성의 허블 데이터 내 경향성을 찾아냅니다
by NVIDIA Korea

최근 발표된 한 논문은 지구로부터 멀리 떨어져 있는 행성들의 대기를 전례 없이 자세한 수준으로 묘사했다는 평가를 받습니다.

해당 연구진은 은하계 안팎 존재들의 기원을 찾고자 태양계에서 멀리 떨어져 있는 별 주변을 도는 행성들인 외계 행성 25개를 연구했습니다. 보다 구체적으로는 일명 뜨거운 목성(hot Jupiter)들을 분석한 것인데요. 가장 거대하고 그래서 감지도 쉬운 이 외계 행성의 대다수는 대기의 온도가 1640도를 넘을 정도로 무척 뜨겁습니다.

연구자들은 NVIDIA GPU가 탑재된 고성능 컴퓨터로 외계 행성의 뜨거운 대기를 분석해 지구를 비롯한 행성들에 대한 우리의 이해를 증진하고자 했습니다.

뜨거운 목성이라는 돌파구

이 논문의 책임 저자이자 유니버시티 칼리지 런던(UCL) 소속 연구원인 쿠엔틴 체인저트(Quentin Changeat)는 뜨거운 목성이 “지구에서는 재현이 거의 불가능한 환경 조건의 물리학을 연구할 놀라운 기회”라고 설명합니다.

외계 행성들의 대집단 전반에서 나타나는 경향성을 분석함으로써 거대한 질문들에 새로운 시각으로 접근할 수 있다는 것인데요.

해당 논문에 공동 저자로 이름을 올렸고 UCL 우주외화학데이터센터(UCL Centre for Space Exochemistry Data)에서 수치계산법을 담당하는 아흐메드 F. 알레파예(Ahmed F. Al-Refaie)는 이 연구가 “지구와 여러 행성들의 탄생 과정을 더욱 훌륭히 설명할 모델들을 구축하게 해줍니다”라고 평가합니다.

허블의 빅데이터 분석하기

연구진은 지금까지의 외계 행성 조사를 통틀어 가장 많은 데이터를 사용했습니다. 주로 허블 우주 망원경을 통해 수집되어 파일로 보관된 1,000시간 분량의 관측치가 동원됐죠.

이번 연구에서 가장 힘들었지만 체인저트가 가장 크게 매료되기도 했던 과정은 결과의 신뢰성과 유의미성을 극대화하기 위해 25개 외계 행성 전체의 데이터에서 일관성 있게 실행되는 소규모의 모델군을 가려내는 것이었습니다.

“이 기간에 무척 놀라운 경험을 했습니다. 나는 온갖 종류의 솔루션을 때로는 괴상한 것까지 조합해내고는 했는데, NVIDIA GPU 덕분에 아주 신속하게 답을 얻을 수 있었습니다”

수백만 번의 연산

이렇게 얻어낸 결과들은 엄청난 수준의 연산을 요했습니다. 25개의 외계 행성별로 20여개의 모델을 각각 25만 번씩 실행해야 했죠.

이 작업에 투입된 케임브리지대학교(University of Cambridge)의 슈퍼컴퓨터 윌크스3(Wilkes3)NVIDIA Quantum InfiniBand 네트워크에 320개의 NVIDIA A100 Tensor Core GPU를 탑재하고 있습니다.

알레파예는 “기존에 사용하던 V100이나 P100과 비교해 A100은 2배가량 개선된 성능을 보여주리라 예상했지만, 솔직히 그 차이는 어마어마했습니다”고 전합니다.

혁신적으로 개선된 결과

A100 GPU는 CPU 대비 200배 향상된 성능을 제공했습니다.

연구진은 GPU당 32개의 프로세스를 패킹해 CPU 대비 6,400배에 달하는 속도 향상을 달성했습니다. 윌크스3의 각 노드는 A100 GPU 4개로 최대 25,600개의 CPU 코어에 맞먹는 성능을 제공했죠.

이처럼 굉장한 속도 개선은 놀라운 수준의 애플리케이션 병렬화 덕분입니다. 윌크스3는 수십만 개의 빛 파장이 외계 행성의 대기를 통과하는 과정을 GPU로 시뮬레이션합니다.

CPU로는 수주일이 걸리던 작업들이 A100에서는 수분 내에 완료되는 셈입니다.

A100 GPU는 복잡한 물리 모델을 매우 신속히 실행했고, 그 결과 모델의 병목 구간이 일종의 CPU 기반 시스템이 되어 다음 탐색점을 통계적으로 결정하는 단순 작업의 처리를 담당했습니다.

알레파예는 이렇게 설명합니다. “정작 대기의 시뮬레이션은 그다지 까다롭지 않다는 사실이 약간 우습기도 하고 다소 충격적이기도 했습니다. 이에 힘입어 우리는 데이터 내에 있는 것들을 제대로 들여다볼 능력을 갖게 되었습니다”

풍부한 소프트웨어

알레파예는 CUDA 프로파일러로 작업을 최적화하고, PyCUDA로 팀이 사용하는 코드를 최적화하며, cuBlas로 일부 연산 루틴의 속도를 높입니다.

“NVIDIA의 폭넓은 소프트웨어를 다양하게 활용해볼 수 있습니다. 일단 적절한 툴을 확보하고 나면 연구의 속도 또한 매우 빨라집니다”

이들 연구진은 앞으로 훨씬 더 까다로워질 작업에 대비해 가능한 모든 대응책을 최대한 확보한다는 계획입니다.

망원경 개선하기

오는 6월 제임스 웹 우주 망원경(James Webb Space Telescope)이 관측을 시작합니다. 허블을 비롯한 기존의 장비와 달리 이 망원경은 외계 행성을 관측할 특수 목적으로 만들어졌죠.

연구진은 이 망원경이 수집할 데이터를 더 높은 해상도로 작업할 방법들의 개발에 이미 착수했습니다. 예를 들어 1차원 모델 대신 2, 3차원 모델을 사용하고 시간의 경과에 따른 변화 등 더 많은 파라미터를 처리하는 방안을 연구하고 있습니다.

체인저트는 “행성에 발생한 폭풍이 현재의 데이터에서는 보이지 않을지 몰라도, 다음 세대의 데이터에서는 확인이 가능할 것입니다”라고 전망합니다.

HPC+AI 탐사하기

데이터의 쇄도는 딥 러닝을 활용할 기회를 열어줍니다. 체인저트 연구팀의 AI 전문가들이 탐색 중인 것도 바로 이 부분이죠.

체인저트는 지금 무척 흥미로운 시간을 보내고 있습니다. 볼티모어의 우주망원경연구소(Space Telescope Science Institute)에 유럽우주국(ESA) 연구원으로 합류해 그곳의 전문가/엔지니어들과 직접 교류하고 있는데요.

“여러 분야의 전문가들과 협업하는 것은 즐거운 일입니다. 우리 연구진에도 천체 관측가, 데이터 분석가, 머신 러닝과 소프트웨어 전문가들이 함께했습니다. 이 논문이 탄생할 수 있었던 것도 그 덕분입니다”

논문의 더 자세한 내용은 여기를 확인하세요.

이미지 제공: ESA/허블, N. 바트만(N. Bartmann)