최근 스탠포드 대학교(Standford Univ.)의 연구팀은 인공지능(AI)과 가속 컴퓨팅을 통해 가속화된 워크플로우를 이용한 벤치마크 세트인 가장 빠른 DNA 염기서열 분석(sequencing) 기술을 선보이며 기네스 세계 기록(Guinness World Records)을 세웠습니다.
DNA 염기서열 분석을 단 5시간 2분 만에 달성하면서 임상의는 이제 중환자로부터 채혈을 받은 당일에 유전질환 진단도 내릴 수 있게 됐습니다. 최근 기네스 세계기록 심사위원은 이 성과에 대해 스탠포드 대학교 졸업생이자 NVIDIA 설립자 겸 CEO의 이름을 따서 만든 스탠포드 대학의 ‘젠슨 황(Jen-Hsun Huang) 엔지니어링 센터’에서 기네스 상을 수여했습니다.
이 세계 기록을 이끈 획기적인 연구는 스탠포드 의과대학의 의학 교수인 이완 애슐리(Euan Ashley) 박사가 주도했습니다. 협력 연구자로는 스탠포드 대학교, NVIDIA, 옥스퍼드 나노포어 테크놀로지, 구글, 베일러 의과대학, 캘리포니아 대학교 산타크루즈 캠퍼스 연구원들이 포함돼 있습니다.
NVIDIA 헬스케어 담당 부사장인 킴벌리 파월(Kimberly Powell)은 행사 자리에서 “우리 모두는 이번 성과가 기적이나 다름없다고 만장일치로 동의한다고 생각합니다. 이번 업적은 역사책에서 찾아볼 수 있을 만한 것으로 것으로 유전체학이 앞장서고 있는 디지털 생물학 혁명에서 향후 5년 내지 10년 동안 달성할 멋진 작업에 영감을 줄 것입니다”라고 말했습니다.
게놈(Genome)으로 최단 시간으로 진단
연구진은 염기서열 분석 워크플로우 내의 모든 단계를 최적화함으로써 기록적인 속도를 달성했는데요. 시간당 100기가베이스(1기가베이스=10억 뉴클레오티드) 이상의 데이터를 생성하기 위해 옥스포드 나노포어의 프로메티온 플로 셀(PromethlON Flow Cell)에서 높은 처리량의 나노포어 염기서열 분석을 사용했습니다. 또한 구글 클라우드의 NVIDIA GPU도 사용해 기본 콜링(base calling)과 변이 콜링(variant calling)을 가속화했습니다.
구글 리서치(Google Research)의 저명한 과학자 그레그 코라도(Greg Corrado)는 행사에서 “이런 혁신은 한 개인이나 개별 팀이 달성할 수 있는 것이 아닙니다. 이런 문제를 해결하려면 정말 사람들이 단체로 힘을 모아야 합니다”라고 말했습니다.
옥스포드 나노포어의 AI 기반 콜링에서부터 게놈에서 수백만 개의 변이를 식별하는 과정인 변이 콜링에 이르기까지 모든 단계를 가속화하기 위해 연구진은 컴퓨터 유전체학 애플리케이션 프레임워크인 NVIDIA Clara Parabricks를 기반으로 작업했는데요. 또한 구글과 UC 산타크루즈의 컴퓨터 유전체학 연구소의 협업으로 개발된 파이프라인 페퍼 마진 딥베리언트(PEPPER-Margin-DeepVariant)의 GPU 가속 버전도 사용했습니다.
코라도 박사는 “향후 생물학과 의학 분야에서 보게 될 혁신은 과거의 고립된 R&D 센터보다 이런 종류의 협력에 훨씬 더 많이 좌우될 것으로 생각합니다”라고 말했습니다.
환자 치료를 위한 새로운 가능성
초고속 게놈 염기서열 분석의 의미는 단순히 세계 기록 달성에 있지 않습니다. 유전자 진단 시간이 몇 주에서 몇 시간으로 단축되면 의료진은 신속한 진단으로 중요한 시간을 낭비하지 않고 중환자들을 빠르게 치료할 수 있습니다.
또한 기술에 대한 접근성이 높아져 더 많은 병원과 연구소들이 전체 염기서열 분석 기술을 환자 치료를 위한 중요한 도구로 사용할 수 있게 될 전망입니다.
NVIDIA 헬스케어 부사장인 킴벌리 파월은 “유전체학은 여전히 시작 단계에 불과합니다. 아직 표준적인 치료가 아니죠. 하지만 비용과 복잡성을 줄이고 널리 쓰이게 만들면 치료 표준의 일부가 될 수 있다고 믿습니다”라고 말했습니다.
연구팀은 5시간의 기록으로 만족하지 않기 때문에 DNA 염기서열 분석 시간을 더 줄일 수 있는 방법을 이미 모색 중입니다.
옥스포드 나노포어 테크놀로지의 CEO인 고든 상헤라(Gordon Sanghera)는 “저희가 한 가지 약속할 것이 있습니다. 바로 저희는 이완 팀과 NVIDIA 그리고 구글과 협력해 현재 기록을 빠른 시일 안에 다시 경신할 것입니다”라고 포부를 밝혔습니다.
NVIDIA GTC에 무료로 등록해 이완 애슐리 박사로부터 이 연구에 대해 더욱 자세한 내용을 들어보세요. 애슐리 박사가 3월 23일 오전 6시(한국시간)에 “신속한 진단이 매우 중요한 중환자를 위한 가속 염기서열 분석(When Every Second Counts: Accelerated Genome Sequencing for Critical Care)”이란 주제로 강연을 할 예정입니다.
여기를 클릭해 NVIDIA 헬스케어 뉴스도 구독해보세요.