미국 최고의 의료 센터 및 연구 기관의 전문가들로 구성된 위원회가 종양 세분화를 위한 AI 모델을 훈련하기 위해 연합 학습 및 AI 지원 주석의 영향을 평가하기 위해 NVIDIA 기반 연합 학습을 활용하고 있습니다.
연합 학습은 데이터 보안이나 개인정보 보호에 영향을 주지 않으면서 다양한 데이터 소스의 데이터로 훈련된 보다 정확하고 일반화 가능한 AI 모델을 개발하기 위한 기술입니다. 이를 통해 여러 조직이 민감한 데이터가 서버를 떠나지 않고도 AI 모델 개발을 위해 협업할 수 있습니다.
“개인정보 보호 및 데이터 관리의 제약으로 인해 여러 사이트에서 데이터를 공유하고 한 곳에 모으는 일이 점점 더 복잡해지고 있으며, 연구 기관이 데이터 공유 계약을 맺는 속도보다 이미징 AI가 더 빠르게 발전하고 있습니다.”라고 University of Wisconsin-Madison의 방사선학과 부교수인 John Garrett은 말합니다. “연합 학습을 채택하여 여러 사이트에서 한 번에 모델을 구축하고 테스트하는 것이 현실적으로 따라잡을 수 있는 유일한 방법입니다. 연합 학습은 없어서는 안 될 도구입니다.”
Garrett은 임상의, 연구자, 엔지니어로 구성된 의료영상정보학회(SIIM) 머신 러닝 툴 및 연구 분과위원회에서 의료 영상용 AI의 개발과 적용을 발전시키는 것을 목표로 하는 활동을 하고 있습니다. NVIDIA는 SIIM의 회원사로, 2019년부터 연합 학습 프로젝트에서 이 위원회와 협력하고 있습니다.
“연합 학습 기술을 통해 GDPR, HIPAA 등의 개인정보 보호 규정을 준수하면서 데이터 프라이버시와 보안을 강화할 수 있습니다.”라고 위원회 위원장인 Khaled Younis는 말합니다. “또한 모델 정확도와 일반화도 향상되었습니다.”
케이스 웨스턴, 조지타운 대학교, 메이요 클리닉, 캘리포니아 대학교 샌디에이고, 플로리다 대학교, 밴더빌트 대학교의 협력자를 포함한 연구팀은 최신 프로젝트를 지원하기 위해 강력한 보안 기능, 고급 개인정보 보호 기술 및 유연한 시스템 아키텍처를 포함하는 오픈 소스 프레임워크인 NVIDIA FLARE(NVFlare)를 활용했습니다.
NVIDIA 아카데미 하드웨어 지원 프로그램을 통해 위원회는 4대의 NVIDIA RTX A5000 GPU를 지원받아 참여 연구 기관에 배포하여 연합 학습을 위한 워크스테이션을 구축했습니다. 추가 협력자들은 클라우드와 온프레미스 서버에서 NVIDIA GPU를 사용하여 NVFLare의 유연성을 강조했습니다.
연합 학습을 위한 코드 해독
프로젝트에 참여한 6개 의료 센터는 신장암의 일종인 신세포암에 초점을 맞춘 약 50개의 의료 영상 연구 데이터를 각각 제공했습니다.
“연합 학습의 아이디어는 훈련 중에 데이터를 교환하는 것이 아니라 모델을 교환한다는 것입니다.”라고 컴퓨터 과학 조교수이자 밴더빌트 대학교의 생의학 데이터 표현 및 학습 연구실 책임자인 Yuankai Huo는 말합니다.
연합 학습 프레임워크에서는 초기 글로벌 모델이 모델 파라미터를 클라이언트 서버에 브로드캐스트합니다. 각 서버는 이러한 매개변수를 사용하여 조직의 독점 데이터로 학습된 모델의 로컬 버전을 설정합니다. 그런 다음 각 로컬 모델의 업데이트된 매개변수가 글로벌 모델로 다시 전송되고, 여기서 집계되어 새로운 글로벌 모델이 생성됩니다. 이 사이클은 각 학습 라운드에서 모델의 예측이 더 이상 개선되지 않을 때까지 반복됩니다.
이 그룹은 모델 아키텍처와 하이퍼파라미터를 실험하여 학습 속도, 정확도, 원하는 수준의 정밀도로 모델을 학습하는 데 필요한 이미징 학습 횟수를 최적화했습니다.
NVIDIA MONAI를 통한 AI 지원 주석 처리
프로젝트의 첫 번째 단계에서는 모델에 사용된 훈련 데이터에 수동으로 라벨을 붙였습니다. 다음 단계에서는 AI 지원 주석을 위해 NVIDIA MONAI를 사용하여 기존 주석 방법과 비교하여 AI의 도움으로 세분화된 훈련 데이터에서 모델 성능이 어떻게 다른지 평가하고 있습니다.
“연합 학습 활동에서 가장 큰 어려움은 일반적으로 여러 현장의 데이터가 매우 균일하지 않다는 점입니다. 사람들은 서로 다른 이미징 장비를 사용하고 프로토콜이 다르며 데이터에 라벨을 다르게 붙입니다.”라고 Garrett은 말합니다. “저희는 MONAI를 추가하여 연합 학습 모델을 한 번 더 훈련함으로써 전반적인 주석 정확도가 향상되는지 알아보고자 합니다.”
이 팀은 사용자가 맞춤형 AI 주석 앱을 개발할 수 있는 이미지 라벨링 도구인 MONAI Label을 사용하여 새로운 데이터 세트를 만드는 데 필요한 시간과 노력을 줄이고 있습니다. 전문가들은 AI가 생성한 세그먼테이션을 모델 학습에 사용하기 전에 이를 검증하고 다듬습니다.
수동 및 AI 지원 주석 단계의 데이터는 NVIDIA MONAI를 제품에 통합한 선도적인 의료 영상 데이터 및 AI 플랫폼인 Flywheel에서 호스팅됩니다.
프로젝트가 완료되면 팀은 향후 작업을 지원하기 위해 방법론, 주석이 달린 데이터 세트 및 사전 학습된 모델을 게시할 계획입니다.
“저희는 이러한 도구를 탐구하는 데 그치지 않고 다른 사람들이 의료 분야에서 이러한 도구를 배우고 사용할 수 있도록 연구 결과를 발표하는 데도 관심이 있습니다.”라고 Garrett은 말합니다.
NVIDIA 아카데미 하드웨어 지원 프로그램 신청하기
NVIDIA 아카데미 하드웨어 지원 프로그램은 연구자에게 세계 최고 수준의 컴퓨팅 액세스 및 리소스를 제공하여 학술 연구를 발전시킵니다. 현재 시뮬레이션 및 모델링, 생성형 AI 및 거대 언어 모델 분야의 프로젝트를 가속화하기 위해 NVIDIA 기술을 사용하는 공인 학술 기관의 전임 교수진을 대상으로 지원서를 받고 있습니다.
다음 지원 주기부터는 연합 학습을 포함한 데이터 사이언스, 그래픽 및 비전, 엣지 AI 분야의 프로젝트에 초점을 맞출 예정입니다.