엔비디아 Clara로 코로나19 환자 산소 요구량 예측 AI 모델 구축

NVIDIA Clara 연합학습(federated learning)은 데이터를 공유하지 않고도 필요사항을 예측하고 지리적 위치, 환자 수 또는 데이터 규모에 관계없이 보다 일반화 가능한 AI 모델을 구축합니다
by NVIDIA Korea
1008 GTC Federated Learning

엔비디아와 매사추세츠 제너럴 브리검 병원(Massachusetts General Brigham Hospital) 연구진이 코로나19 증상으로 응급실에 들어오는 환자에 대해 초기 검사만으로 산소 보충이 필요한지 판단하는 AI 모델을 개발했습니다.

‘CORISK’라는 이름의 모델은 매사추세츠 제너럴 브리검 병원의 리콴정(Quanzung Li) 박사에 의해 개발됐는데요. 의료 영상과 건강 기록을 결합한 이 모델은 많은 국가에서 코로나19 2차 유행으로 인한 환자가 발생할 수 있는 상황에서 의사들이 환자 입원을 보다 효과적으로 관리하도록 지원합니다.

1008 캡션 1
산소예측 AI 워크플로우

의사들이 신뢰하고 최대한 많은 병원에서 일반화시킬 수 있는 AI 모델을 개발하기 위해 엔비디아와 매사추세츠 제너럴 브리검 병원은 전 세계 20개 병원과 손잡고 가장 방대하고 다양한 연합학습 이니셔티브인 ‘EXAM(EMR CXR AI Model)’을 시작했습니다.

이번 글로벌 협업은 시작된 지 불과 2주 만에 곡선 아래 면적(AUC)이 0.94(AUC 목표값 1.0)인 모델을 생성하여 신규 환자가 필요로 하는 산소 농도에 대해 우수한 예측 결과를 도출해 냈습니다. 연합학습 모델은 엔비디아 Clara on NGC의 일환으로 향후 몇 주 안에 출시될 예정입니다.

‘EXAM’ 이니셔티브 살펴보기

엔비디아 클라라(Clara) 연합학습 프레임워크를 사용하여 각 병원 연구진들은 연합학습이라고 부르는 개인 정보보호 기술을 통해 글로벌 모델에서 흉부 X선, 환자 바이탈 및 실험실 값을 넣어 로컬 모델을 훈련시키고 모델 가중치 서브셋을 공유할 수 있었습니다.

이 모델의 궁극적인 목표는 응급실에 들어오는 사람이 산소 보충을 필요로 할 지를 예측하는 것으로, 의사들이 중환자실 배치를 포함하여 환자에 대한 적절한 치료 수준을 결정하는 데 도움을 줄 것으로 기대됩니다.

매사추세츠 제너럴 브리검 병원에서 AI 개발 및 구축을 총괄하는 이타이 다얀(Ittai Dayan) 박사는 엔비디아와 함께 EXAM 이니셔티브를 공동 주도하고, 연합학습 훈련의 출발점으로 CORISK를 활용하도록 도모했는데요. 이러한 성과는 북미와 남미, 캐나다, 유럽, 아시아 전역의 다양한 다국적 환자 데이터셋에서 나온 분산 데이터에 대해 모델을 훈련시킴으로써 달성할 수 있었습니다.

매사추세츠 제너럴 브리검 병원 및 부속 병원 외 참여 기관은 다음과 같습니다.

  • 한국 경북대병원
  • 워싱턴 DC 국립아동병원(Children’s National Hospital)
  • NIHR 캠브리지 생물의학연구센터(Cambridge Biomedical Research Centre)
  • 도쿄 자위대 중앙병원(Self-Defense Forces Central Hospital)
  • 국립대만대(National Taiwan University) MeDA 연구소
  • MAHC 및 대만 국민건강보험청(Taiwan National Health Insurance Administration)
  • 태국 쭐랄롱꼰대(Chulalongkorn University) 의과대학
  • 브라질 DASA 임상검사센터(Diagnosticos da America SA)
  • 샌프란시스코 캘리포니아대학(University of California)
  • 샌디에고 보훈병원(Veterans Affairs Hospital)
  • 토론토대학(University of Toronto)
  • 메릴랜드 베데스다 국립보건원(National Institutes of Health in Bethesda)
  • 위스콘신대 매디슨 의과 및 공중 보건 대학(University of Wisconsin-Madison School of Medicine and Public Health)
  • 뉴욕 메모리얼 슬로언 케터링 암센터(Memorial Sloan Kettering Cancer Center)
  • 뉴욕 마운트 시나이 헬스 시스템(Mount Sinai Health System).

각 의료기관은 엔비디아 클라라를 이용해 로컬 모델을 훈련하고 EXAM에 참여하고 있는데요. 각 기관은 환자 흉부 X선과 기타 민감 정보를 한 곳에 모으는 대신 데이터를 위해 안전한 사내 서버를 사용하고 있습니다. 아마존웹서비스(AWS) 기반의 별도 서버가 글로벌 심층신경망을 보유하고 있으며, 각 참여 병원에는 자체 데이터셋으로 훈련할 수 있도록 모델의 복사본이 제공된다고 합니다.

대규모 글로벌 협업

약물 발견을 개선하고 AI의 혜택을 현장진료(POC)에 활용하기 위한 대규모 연합학습 프로젝트도 진행 중에 있습니다.

연합학습 기법을 통해 어떻게 데이터의 개인정보를 침해하지 않고도 파트너 제약사에 AI 훈련을 위한 세계 최대의 협력적 약물 복합 데이터셋을 제공할 수 있는지를 입증하기 위해 오우킨(Owkin)은 엔비디아, 킹스 칼리지 런던(King’s College London)과 십여 개 이상의 기업들과 함께 영국 기반 약물 발견 컨소시엄 멜로디(MELLODDY)를 통해 협업 중입니다.

젠슨 황 엔비디아 CEO는 GTC 2020 기조연설에서 AI가 신약 개발을 가속화하는 방법을 소개하기도 했습니다.

킹스 칼리지 런던은 ‘가치 기반 의료 프로젝트를 위한 런던 의료영상 및 인공지능센터(London Medical Imaging and Artificial Intelligence Centre for Value-Based Healthcare)’ 프로젝트의 일환으로 연합학습을 통해 뇌졸중과 신경학적 장애를 분류하고, 암의 근본 원인을 파악하며, 환자에게 최적의 치료를 추천하는 데 있어 획기적 성과를 낼 수 있기를 고대하고 있습니다.

다국적 데이터셋을 활용한 코로나-19용 또 다른 AI 모델에 대한 자세한 정보는 여기 논문에서, 연합학습의 배경이 되는 과학에 대한 자세한 내용은 링크를 통해 확인할 수 있습니다.