생물의학의 획기적인 발전 위한 NVIDIA와 브로드 연구소의 파트너십

파트너십으로 게놈 분석 워크플로우를 가속화하며, 표적 치료법의 발견과 개발을 위한 대규모 언어 모델을 공동 개발합니다
by NVIDIA Korea

NVIDIA는 매사추세츠 공과대학교(MIT)와 하버드대학교(Harvard)의 브로드 연구소(Broad Institute)와 파트너십을 체결했습니다.

NVIDIA는 학계, 스타트업, 제약 대기업의 바이오메디컬 연구원 등 25,000명 이상의 사용자와 테라 클라우드 플랫폼을 위해 방대한 양의 의료 데이터를 신속하게 분석하는 데 필요한 AI 가속 툴을 제공합니다.

이번 협업은 NVIDIA의 AI 전문지식과 의료 컴퓨팅 플랫폼을 브로드 연구소의 저명한 연구자들이나 과학자들, 개방형 플랫폼과 연결하기 위해 마련했습니다.

다음의 세 가지 핵심 분야에 초점을 둡니다.

  • NVIDIA Clara Parabricks 테라 플랫폼에서 사용 가능: 시퀀싱 데이터의 2차 분석을 위한 GPU 가속 소프트웨어 제품군인 Parabricks를 이제 6개의 새로운 테라 워크플로우에서 사용할 수 있게 됐습니다. 사용자는 CPU 기반 환경에서 24시간 걸리는 전체 게놈 분석 작업을 Clara Parabricks를 사용하면 단 1시간 남짓 만에 끝낼 수 있을뿐만 아니라 컴퓨팅 비용을 절반 이상 줄일 수 있습니다.
  • 대형 언어 모델(LLM) 구축: 연구진은 생물학의 대형 언어 모델용으로 AI 애플리케이션 프레임워크인 NVIDIA BioNeMo를 통해 인간 생물학에 대한 이해를 높이기 위해, 생명체의 구성 요소 DNA와 RNA의 기초 모델을 개발할 예정입니다.
  • 게놈 분석 툴킷(GATK, Genome Analysis Toolkit) 대한 러닝 향상: NVIDIA는 100,000명 이상의 연구자가 사용하는 산업 표준인 브로드 연구소의 GATK 툴킷에 직접 새로운 딥 러닝 모델을 제공하고 있는데요. 이 툴킷은 질병과 관련된 유전적 변이를 식별하는 데 도움을 줍니다. 이는 약물을 발견하려는 연구원에게 새로운 치료법 개발을 지원하게 될 것입니다.

NVIDIA 의료 부문 부사장 킴벌리 파월(Kimberly Powell)은 “의료 생태계 전반에 걸쳐 질병을 이해하고, 진단을 개발하며, 치료법을 전달하는 데 획기적인 발전을 이끄는 더욱 뛰어난 계산 툴이 필요합니다. 브로드 연구소와 협력을 확대하면서 저희는 대규모 언어 모델의 힘을 활용해 궁극적으로 공동 솔루션을 제공하고 연구자의 통찰력과 환자에게 제공할 수 있는 실제적인 혜택 간에 격차를 좁힐 수 있습니다”고 말했습니다.

브로드 연구소는 연구자를 서로 연결해주는 오픈 클라우드 플랫폼을 제공하고 과학의 획기적인 발전을 이루는 데 필요한 데이터 세트와 툴을 제공함으로써 차세대 협업 바이오메디컬 연구를 이끌어내는 것이 목표입니다.

브로드 연구소의 최고 데이터 책임자인 앤서니 필리파키스(Anthony Philippakis)는 “데이터 혁명의 중심에 서있는 생명 과학 분야에서 연구자들은 바이오의학에 머신 러닝을 도입하기 위한 새로운 접근 방식이 매우 필요한 상황입니다. 이번 협업으로 데이터 공유와 협업 프로세스의 임무를 유전체학 연구로 확장하는 것이 목표입니다”라고 말했죠.

질병 연구를 위한 대규모 언어 모델

NVIDIA BioNeMo 프레임워크에는 훈련, 추론, 확장을 간소화하는 단백질 및 화학에 대한 사전 훈련된 대규모 언어모델(LLM)이 포함돼 있습니다. BioNeMo는 NVIDIA NeMo Megatron 프레임워크의 확장판으로서 화학, 단백질, DNA/RNA 서열에 대해 도메인별로 전문화되어 있다.

BioNeMo를 통해 개발자는 수십억 개의 매개 변수를 가진 생물 대규모 언어모델(LLM)을 효과적으로 훈련하고 배치할 수 있죠. 두 조직의 협업은 이런 작업에 새로운 모델을 만들어 BioNeMo 컬렉션을 확장하고 테라 플랫폼에서 사용할 수 있게 만듭니다.

도메인별 AI 위한 NVIDIA 소프트웨어

NVIDIA Parabricks GPU 가속 워크플로우는 광범위한 게놈 데이터를 분석하는 데 처리 시간을 줄이며 비용을 절감합니다. 브로드 연구소의 게놈 분석 툴킷(GATK) 모범 사례인 생식 계열 워크플로우의 경우는 GPU에서 파라브릭스를 통해 분석하면 속도가 최대 24배까지 향상되며 비용을 절반 이상 절감할 수 있죠.

또한 브로드 연구소 연구진은 의료 이미징 AI를 위한 오픈 소스 딥 러닝 프레임워크인 모나이(MONAI)는 물론, 게놈 단세포 분석에 사용되고 데이터 준비 속도를 높여주는 GPU 가속 데이터 과학 툴킷인 NVIDIA RAPIDS도 사용할 수 있습니다.

Clara Parabricks와 테라 통합에 대해 더 자세히 알아보고 여기에서 NVIDIA BioNeMo LLM 서비스 얼리 엑세스에 가입해보세요.

NVIDIA와 브로드 연구소의 바이오메디컬 연구를 위한 AI 가속화에 대한 영상을 확인해보세요.