아랍에미리트 유전체 연구에서 엔비디아 GPU 기반 슈퍼컴퓨터 ‘아르테미스’의 역할은?

아랍에미리트 아부다비 보건부 프로젝트 그룹 G42가 엔비디아 DGX 기반 아르테미스(Artemis) 슈퍼컴퓨터로 유전체 분석과 코로나19 인구 게놈 프로그램을 가속화하고 있습니다
by NVIDIA Korea
5.19 블로그 이미지

우리가 무엇으로 만들어졌는지 생각해 본적 있나요?

답은 유전체에 있습니다. 유전체란 개개인의 특징을 결정하는 고유한 유전자 코드입니다. 이 DNA 분자의 특정한 조합 때문에 우리는 각기 다른 특징을 갖춘 사람이 될 수 있는 거죠.

한 사람 또는 집단의 유전자 코드 전체에 대한 연구는 질병에 대한 이해도를 높이고, 정밀 의학을 구현하며, 약물유전체학(유전자가 약물에 대한 개인의 반응에 영향을 주는 방식)을 발전시킵니다.

아랍에미리트 아부다비 보건부(DoH)의 정부 프로젝트의 일환으로 설립된 ‘그룹 42’(Group 42, 이하 G42)는 아르테미스(Artemis) 슈퍼컴퓨터를 사용해 인간의 유전체(게놈)를 해독하고 환자 치료를 향상시키고 있습니다. 엔비디아 GPU로 구동되는 아르테미스는 세상에서 26번째로 빠른 슈퍼컴퓨터입니다.

아부다비에 위치한 G42는 총체적이고 확장 가능한 인공지능(AI)과 클라우드 컴퓨팅 서비스를 개발하고 배포합니다. G42는 자체 인공지능창업연구소(Inception Institute of Artificial Intelligence)를 통해 AI, 빅데이터, 머신 러닝에 대한 기초연구를 하고 있죠.

세계 최고의 AI 슈퍼컴퓨터를 구축하는 데는 보통 6개월 이상이 걸립니다. 그러나 G42는 엔비디아와 함께 단 3주만에 DGX 슈퍼POD(DGX SuperPOD) 레퍼런스 아키텍처와 멜라녹스 AI 네트워크 패브릭을 사용해 아르테미스를 구축하고 배포했습니다.

아랍에미리트 국민 유전체 프로그램

아르테미스는 81개의 엔비디아 DGX 시스템으로 구축돼 총 7.2펠라톱스(PF)급의 배정밀도 HPL 성능을 갖춰 G42의 기존 시스템보다 워크로드의 처리속도가 무려 120배 빨라졌습니다.

이제 슈퍼컴퓨터는 인구 게놈 프로그램(Population Genome Program)에 활용되고 있습니다. 아랍에미리트 정부가 시행하는 이 프로젝트의 목표는 아부다비 시민들의 유전체에 대한 과학적 이해와 국가 의료보건의 수준을 향상시키는 것입니다.

그 동안 아랍에미리트 국민에 대한 수준 높은 유전체 연구결과가 부족하다 보니 아랍 인구에 대한 유전적 변이를 이해하기가 쉽지 않았는데요. 이번 인구 게놈 프로그램을 통해 아랍에미리트 국민들만의 독특한 유전체 연구결과가 도출되고 충분한 데이터가 축적될 겁니다.

이 프로그램의 목표는 세계 최초로 이 유전체 데이터를 의료보건 관리 프로세스에 통합하는 것입니다.

아부다비 보건부 장관 H.E. 셰이크 압둘라 빈 모하메드 알 하메드 (Sheikh Abdulla Bin Mohamed Al Hamed)는 기자회견에서 “우리의 최우선 과제는 적극적인 혁신으로 아부다비 에미리트에 종합적인 의료 프로그램을 제공하는 것입니다. 이번 프로젝트에서는 전세계적으로 가장 관심을 끌고 있는 두가지 기술, DNA 시퀀싱과 AI가 함께 활용됩니다”라고 말했습니다.

유전체 데이터 처리를 가속화하는 엔비디아 GPU

프로그램의 첫 번째 단계에서는 10,000명의 유전체가 테스트될 예정입니다. G42는 최대 데이터를 처리하고 분석의 정확도를 위해 세계 최고의 유전체 시퀀싱 선도기업인 BGI 와 옥스퍼드 나노포어(Oxford Nanopore)와 협력해 롱리드(long-read)와 쇼트리드(short-read) 시퀀싱 플랫폼을 함께 사용할 것입니다.

먼저 익명화된 DNA 샘플이 옥스퍼트 나노포어 프로메트아이온(PromethION) 고성능 시퀀싱 장치를 통해 수집·처리됩니다. 이 장치는 엣지에서 AI를 구현하는 엔비디아 GPU 기술이 탑재돼 있어 유전체 데이터 처리 속도를 향상시키죠.

처리된 데이터는 AI 기반 분석을 위해 인구 통계를 분석하는 엔비디아 파라브릭스(Parabricks) 소프트웨어를 통해 아르테미스 슈퍼컴퓨터에 그래픽 형식으로 제공됩니다.

처리된 데이터 결과는 연구계와 의료계에 제공되어 훨씬 효과적인 환자 치료법 개발에 쓰이는데요. 이를 통해 암, 정신 분열증, 자폐증, 심혈관 및 신경 질환과 같은 질병에 대한 최첨단 치료법이 개발될 수 있습니다.

G42의 게놈 프로그램 팀장 박 민 S.(Min S. Park)는 “G42는 엔비디아 GPU 기술을 통해 UAE의 인구 게놈 프로그램에 최적화된 AI 플랫폼을 제공하고 데이터 처리를 가속화할 수 있었습니다. 이런 협업은 환자 치료 개선을 위해 전문가, 데이터와 기술을 통합해 UAE 전역에 개인에게 특화된 치료 프로그램을 개발한다는 G42의 목표를 달성하는데 큰 도움이 됩니다”라고 말했습니다.

코로나19에 맞서는 슈퍼컴퓨팅

G42는 최근 아부다비 마스다르 시티(Masdar City)에 새롭게 설립된 탐지 연구소(detection laboratory)에서 진행중인 코로나19 연구에 슈퍼컴퓨팅 기술을 도입했습니다. 이 연구소는 매일 수만 건의 실시간 역전사 중합 효소 연쇄 반응(RT-PCR) 검사를 진행하고 있는데요. 이 검사를 통해 환자에게서 채취한 샘플에서 SARS-CoV-2 바이러스의 유무를 탐지할 수 있습니다.

이와 함께, G42는 코로나19 진단 키트 생산, 열 센서 공급, 자국과 국제 보건 당국과의 공조체계 마련을 통해 바이러스 확산을 막기 위한 효과적인 예방·탐지 프로토콜을 구축하는 일도 추진 중입니다.

펑 샤오(Peng Xian) G42 CEO는 “과학기술은 코로나바이러스 확산을 막는 데 핵심적인 역할을 할 것입니다. 아르테미스의 슈퍼 컴퓨팅 성능은 수작업으로 진행되는 실험을 컴퓨터 시뮬레이션으로 대체해 백신 개발 시간을 단축하고 백신 개발을 가속화하는 일부터, 바이러스 발생지 맵핑과 추세 예측, 그리고 바이러스 변이 예측에 이르기까지 여러가지 방면으로 크게 도움을 줄 것”이라고 말했습니다.