생명을 구하고 에너지를 절약하기 위해 NVIDIA 가속 컴퓨팅으로 암 연구 속도를 높이는 Wellcome Sanger Institute

영국에 위치한 이 연구소의 DNA 시퀀싱 연구소는 매년 수만 개의 게놈을 분석하여 암 발생 및 치료 효과에 대한 인사이트를 제공합니다.
by NVIDIA Korea

국제 인간 게놈 프로젝트의 핵심 주역인 Wellcome Sanger Institute는 에너지를 절약하는 동시에 생명을 구하기 위해 NVIDIA 가속 컴퓨팅으로 전환하고 있습니다.

세계 최대 규모의 시퀀싱 시설을 갖춘 영국에 본사를 둔 이 연구소는 48페타베이스(48경 염기쌍) 이상의 DNA 및 RNA 서열을 판독하여 건강과 질병의 중요한 인사이트를 발견했습니다.

암, 노화 및 체세포 돌연변이(CASM) 프로그램은 매년 수만 개의 암 게놈을 염기서열 분석하여 암 형성을 촉진하는 돌연변이 과정과 치료 효과를 결정하는 유전적 변이를 연구합니다.

이러한 대규모 이니셔티브를 해결하기 위해 Sanger Institute는 가속 컴퓨팅을 활용하여 단 몇 분 만에 데이터를 처리하는 확장 가능한 유전체학 분석 소프트웨어 제품군인 NVIDIA Parabricks와 함께 NVIDIA DGX 시스템의 사용을 모색하고 있습니다.

“Sanger Institute는 매년 수십만 개의 체세포 샘플을 처리합니다.”라고 Wellcome Sanger Institute의 CASM 수석 소프트웨어 개발자인 Jingwei Wang은 말합니다. “NVIDIA 가속 컴퓨팅과 Parabricks는 샘플 분석 시 상당한 시간, 비용 및 에너지를 절약할 수 있을 것이며, 더 높은 성능과 효율성을 위해 NVIDIA Grace 및 Grace Hopper와 같은 고급 아키텍처를 탐색할 수 있게 되어 기대가 큽니다.”

런타임 및 에너지 소비 감소

Sanger Institute는 게놈 전체 기능 스크린 및 약물 테스트를 위한 암 샘플의 고처리량 모델을 개발합니다.

NVIDIA 가속 컴퓨팅 및 소프트웨어는 연구소의 게놈당 분석 런타임과 에너지 소비를 크게 줄여줍니다.

대규모 참조 게놈에 대해 DNA 서열을 매핑하는 소프트웨어 패키지인 Burrows-Wheeler Aligner(BWA)로 게놈 분석을 가속화하기 위해 Sanger는 CPU에서 실행되는 독점적인 CaVEMan 워크플로우를 사용하며 NVIDIA GPU의 Parabricks를 활용하고 있습니다.

이 연구소는 128개의 듀얼 소켓 CPU 서버에 비해 하나의 NVIDIA DGX 시스템을 사용하여 런타임은 1.6배, 비용은 24배, 에너지 소비는 최대 42배까지 줄였습니다.

이 연구소에서 매년 10,000개의 게놈을 시퀀싱할 때마다 약 1억 2,500만 시간의 CPU가 소비됩니다.

즉, Sanger 연구소는 GPU에서 파라브릭과 함께 BWA를 사용하도록 전환함으로써 매년 100만 달러와 1,000메가와트시를 절약할 수 있습니다. 이는 평균적인 미국 가정에서 한 세기 동안 전력을 공급하는 데 필요한 에너지의 양에 해당합니다.

업계 리더와의 협업

Sanger Institute의 NVIDIA 가속 시퀀싱 랩은 데이터가 들어오고 인텔리전스가 나오는 AI 팩토리라고 할 수 있습니다.

AI 팩토리는 가장 계산 집약적인 작업을 위한 고급 풀스택 가속 컴퓨팅 플랫폼을 호스팅하는 차세대 데이터센터입니다.

새로운 암 유전자와 돌연변이 과정을 발견하기 위해 중요한 과학적 질문을 탐구하고 있는 Sanger Institute는 AI 팩토리에 NVIDIA 인프라를 사용하여 운영 및 에너지 효율성을 높이고 있습니다.

또한, AI 팩토리를 구축하는 기업 및 조직은 에너지 관리 및 자동화 기업인 Schneider Electric과 같은 업계 간 협업에 참여하여 가장 에너지 효율적인 방식으로 까다로운 워크로드를 실행하기 위한 데이터센터 설계를 최적화하고 있습니다.

Sanger 연구소는 Schneider Electric과 협력하여 데이터센터 가동 중단 시간을 최소화하고 에너지 소비를 줄이는 데 핵심적인 다른 기술 중에서도 무정전 전원 공급 장치 및 냉각 장비를 DNA 시퀀싱 랩의 데이터센터에 장착하고 있습니다.

Schneider Electric은 3월에 열린 NVIDIA GTC 컨퍼런스에서 NVIDIA 가속 컴퓨팅 클러스터에 맞춤화된 AI 데이터센터 레퍼런스 디자인을 출시하여 다양한 산업 분야의 조직이 인프라를 최적화할 수 있도록 지원한다고 발표했습니다.

데이터 처리, 엔지니어링 시뮬레이션, 전자 설계 자동화, 컴퓨터 지원 약물 설계 및 생성형 AI를 위해 구축된 이 참조 설계는 고전력 분배, 액체 냉각 시스템 및 확장 가능한 고성능의 지속 가능한 데이터 센터의 다른 측면에 초점을 맞출 것입니다.

이번 주 Economist가 주최하는 NYC 기후 주간 패널에서 Sanger, Schneider Electric, NVIDIA의 대표들이 각자의 작업에 대해 이야기할 예정입니다.

지속 가능한 컴퓨팅과 잠재적으로 생명을 구할 수 있는 Sanger 연구소의 연구에 대해 자세히 알아보세요.

주요 이미지 제공: Wellcome Sanger Institute.