미국양자역학연구팀, 엔비디아 GPU로 코로나19 퇴치 위한 연산 가속화

마이크로소프트 애저 클라우드에서 2배 빠른 연산속도 구현한 엔비디아 V100 GPU를 소개합니다
by NVIDIA Korea
0821 블로그 2

안슈만 쿠마르(Anshuman Kumar)는 첨단 디지털 기술로 코로나바이러스의 비밀을 밝혀내려고 합니다.미국 캘리포니아 대학교 리버사이드(UCR)에서 쿠마르의 연구팀은 코로나 바이러스의 원자간 상호작용을 전례 없는 규모로 계산하려고 합니다. 이 시도가 성공한다면 코로나바이러스의 분자가 약품 분자와 결합해 건강한 세포 감염을 방지할 수 있는 코로나19 퇴치법에 대한 실마리가 밝혀지게 될 겁니다.

쿠마르는 양자역학이라는 미세한 나노 세계에 대한 연구를 완전히 새로운 차원으로 이끈 UCR 연구팀의 일원입니다. UCR 연구팀은 약 5,000개의 원자로 구성된 바이러스성 단백질과 상호작용하는 데 필요한 에너지 단위인, 소위 ‘장벽 높이’(barrier height)를 측정하는 것을 목표로 연구하고 있습니다.

이 연구에는 최대 수백개의 원자로 구성된 분자의 물리력(force)을 최근까지 측정해온 최첨단 기술대비 10배 이상의 성능이 필요한데요.

엔비디아 GPU, 코로나 치료제 개발 가속화

바이러스가 소위 ‘리간드’(ligand)라고 불리는 중화 분자와 결합할 가능성을 양자의 물리력이 어떻게 결정하는가에 대한 데이터가 있다면 코로나19 퇴치를 위한 약품 개발에 나선 제약회사들의 연구를 가속화할 수 있을 것입니다.

해당 프로젝트를 감독하는 UCR의 화학공학, 재료과학, 물리학과 부교수인 브라이언 웡(Bryan Wong)은 “원자 수준에서 뉴턴의 힘(Newtonian forces)은 아무런 영향을 미치지 않기 때문에 자연의 법칙에 따라 양자역학을 사용해야 합니다. 우리 연구팀의 목표는 마이크로소프트 애저(Azure) 클라우드에서 엔비디아 GPU를 이용해 연산을 빠르고 효율적으로 진행해 솔루션을 개발할 수 있는 방법을 찾아내는 것”이라고 말했습니다.

연구원들은 지난 4월 건강한 세포를 빠르게 감염시키는데 중요한 역할을 한다고 알려진 코로나바이러스 단백질을 사용해 연구에 착수했습니다. 6월에는 매번 최대 10일이 소요되는 수 차례의 사전 연산 작업을 마무리하고 있습니다.

그 다음 단계는 바로 ‘장벽 높이’를 발견하는 것인데요, 이 작업에는 더 복잡하고 너 많은 시간이 소요되는 연산이 필요합니다. 한 쌍의 단백질/리간드를 분석하는데 5주 가량 소요될 수 있는 대규모 연산 작업입니다.

클라우드 속 초강력 엔진, 엔비디아 GPU

연구팀은 연구 속도를 가속화하기 위해 ‘코로나19 고성능 컴퓨팅 컨소시엄’을 통해 마이크로소프트의 ‘AI 보건 프로그램’에서 보조금을 지원 받았는데요. 이 프로그램에는 마이크로소프트 퍼블릭 클라우드 서비스 ‘애저’(Azure)에서 실행되는 고성능 컴퓨팅과 엔비디아의 지원도 포함됩니다.

쿠마르는 양자 연산 과학 프로그램의 GPU 가속 버전을 실행했습니다. 이미 이 프로그램은 온프레미스 엔비디아 GPU 기반 클러스터에서 실행되고 있었지만 연구팀은 연산이 V100 텐서 코어(Tensor Core) GPU에서 이뤄질 수 있도록 클라우드로 이전하길 바랬죠.

쿠마르는 엔비디아 솔루션 아키텍트 스캇 맥밀런(Scott McMillan)의 도움을 받아 엔비디아가 개발·관리하는 오픈소스 툴인 ‘HPC 컨테이너 메이커’(Container Maker)를 사용해 단 하루 만에 프로그램을 애저로 마이그레이션할 수 있었습니다. HPC 컨테이너 메이커는 사용자가 몇번의 클릭 만으로 프로그램을 비롯해 런타임 환경, 종속 항목 같은 핵심 구성요소를 인식해 컨테이너를 정의할 수 있게 도와줍니다.

이미지
안슈만 쿠마는 엔비디아 오픈소스 프로그램을 사용해 UCR 소프트웨어를 마이크로소프트 애저 클라우드의 최신 GPU로 이전했습니다.

UCR 연구진이 한 번도 컨테이너나 클라우드 서비스를 사용해본 경험이 없었다는 것을 생각해보면 이번 마이그레이션은 엄청난 일이었죠.

쿠마르 연구원은 “일단 정확한 라이브러리와 종속성을 파악하고 나면 그 다음 부터는 순조롭게 처리할 수 있습니다. 스크립트를 작성하고 코드 이미지만 만들면 되죠. 이렇게 하고 난 뒤부터는 애저 클라우드의 GPU 처리 속도가 교내 시스템 대비 2배가 빨라졌습니다”라고 덧붙였습니다.

엔비디아 팀은 코드에 최신 버전의 쿠다(CUDA)와 마그마(Magma) 연산 라이브러리가 사용됐는지 확인해 완성도를 높였습니다. 그 중 한 전문가는 멀티 GPU 스케일링을 구현하는 루틴을 업데이트하기 위해 스택을 철저하게 확인해주기도 했죠.

새로운 동료와 팀 마스코트

쿠마르 연구팀은 UCR에 별도로 마련된 컴퓨터 생물학 연구소에서도 코로나19퇴치를 지원하는 HPC 컨소시엄에서 보조금 지원을 받게 됐다는 소식을 듣고 난 뒤 예상치 못한 도움을 받게 됐습니다. 컴퓨터 생물학 연구소는 통계 샘플링 기술을 이용해 결합 프로세스를 관찰하며 드물게 일어나는 결합(binding)이 좀 더 자주 일어날 수 있는 방법을 찾고 있었는데요.

웡 부교수는 “협업을 하면 프로젝트 퀄리티가 높아질 것이라고 생각해 컴퓨터 생물학 연구소에 먼저 연락했습니다. 안슈만이 썼던 GPU 코드를 사용하면 이 연구소 샘플링 연구에도 도움이 될 것이라고 생각했죠”라고 덧붙였습니다.

쿠마르 연구원은 “이 프로젝트가 전세계에 도움을 줄 수 있다고 생각하면 여기에 참여하게 된 것이 정말 자랑스럽습니다”라고 소감을 밝혔습니다.

최근 이 연구팀에 새로운 마스코트가 생겼는데요. 빌리(Billy)라는 큰 다람쥐가 웡 부교수의 사무실 창가에 자리를 잡으며 더 빠르고 민첩한 팀이 되겠다는 연구팀의 목표를 상징하게 됐습니다.

엔비디아에서 의료분야 뉴스를 구독하세요.

상단의 사진: 알록달록한 리본은 코로나바이러스 복제에 중요한 역할을 한다고 알려진 Mpro 단백질이다. 빨간색 가닥은 리간드에 결합하는 생물 분자를 나타낸다. (이미지 제공: UCR)