베네수엘라 골드러시 속에서 말라리아를 탐지하는 모델을 개발하다

한때 말라리아가 없던 베네수엘라는 말라리아의 재유행에 직면해 있지만, 연구자들은 말라리아 탐지에 도움이 되는 모델을 훈련시켰습니다.
by NVIDIA Korea
AI의 반격: 연구원, 베네수엘라 골드러시 속에서 말라리아를 탐지하는 모델 개발

베네수엘라에서는 금 채굴이 말라리아 재확산을 초래한 바 있습니다. 이에 연구자들은 이 문제를 해결하기 위해 AI를 개발하기 시작했죠.

베네수엘라 볼리바르 주에서는 금광 채굴을 위한 산림 파괴로 인해 모기 개체군이 교란되었고, 이 모기들이 광부들을 물어 치명적인 기생충을 전파하고 있습니다.

베네수엘라는 1961년 세계보건기구(WHO)로부터 말라리아 박멸 국가로 인증받았습니다. WHO에 따르면, 2023년 전 세계적으로 말라리아 발생 건수는 2억 6,300만 건, 사망자는 59만 7,000명에 달하는 것으로 추정됩니다.

베네수엘라의 이번 말라리아 발생 지역은 농촌으로 의료 클리닉 접근성이 제한적이어서, 전문 인력이 현미경으로 진단하는 것이 부족한 상황입니다.

하지만 의학과 기술의 교차점에 있는 연구자들은 AI와 NVIDIA GPU를 활용해 해결책을 마련했습니다. 최근 이들은 네이처(Nature)지에 논문을 발표하며, 혈액 샘플에서 말라리아 기생충을 자동으로 감지하는 CNN(Convolutional Neural Network)을 개발했다고 밝혔습니다.

“한때 베네수엘라에서 말라리아는 거의 박멸된 상태였습니다.”라고 25세의 Diego Ramos-Briceño는 말했습니다. 그는 의학 박사 과정을 밟으면서 공학 학사 학위를 취득했는데요, 작년에는 약 13만 5,000건의 말라리아 사례가 있었다고 밝히기도 했습니다.

혈액 샘플에서 말라리아 기생충 식별하기

해당 연구팀(Ramos-Briceño, Alessandro Flammia-D’Aleo, Gerardo Fernández-López, Fhabián Carrión-Nessi 그리고 David Forero-Peña)은 CNN을 활용해 두꺼운 혈액 도말 표본에서 Plasmodium falciparum과 Plasmodium vivax를 식별하는 데 99.51%의 정확도를 달성했습니다.

이 모델을 개발하기 위해 연구팀은 방글라데시 치타공 의과대학 병원에서 라벨이 부착된 5,941개의 두꺼운 혈액 도말 현미경 이미지 데이터 세트를 확보했는데요, 연구팀은 이 데이터 세트를 처리하여 약 19만 개의 라벨링된 이미지를 생성했습니다.

“신경망이 학습하기를 원했던 것은 기생충의 형태였기 때문에 6,000개에 가까운 현미경 수준의 이미지 중에서 모든 기생충을 추출하고 데이터 증강(Augmentation)과 세분화를 통해 모델 학습을 위한 거의 19만 개의 이미지를 확보했습니다.”라고 Ramos-Briceño는 밝혔습니다.

연구 논문에 따르면 이 모델은 기존의 현미경 검사 방법도 정확성과 일관성의 한계로 인해 어려움을 겪고 있는 상황에서 나온 것입니다.

모델 훈련, 추론에 게이밍 GPU와 CUDA 활용하기

말라리아 논문 연구팀은 컴퓨터 사이언스 교사의 연구 멘토링을 받으 RTX 3060 GPU를 활용해 모델 훈련을 실행하였습니다.

Ramos-Briceño는 “PyTorch Lightning과 NVIDIA CUDA 가속화를 통해 효율적인 병렬 연산을 수행할 수 있었기 때문에 CPU를 사용했을 때보다 행렬 연산과 신경망 준비 속도를 크게 높일 수 있었습니다.”라고 말했습니다.

추론의 경우, 이러한 GPU를 사용하면 혈액 샘플에서 말라리아를 몇 초 안에 판별할 수 있다고 하는데요.

숙련된 현미경 전문의가 부족한 병원에서는 이 모델을 사용하고 전이 학습을 위해 자체 데이터를 도입하여 모델이 제출하는 이미지 유형과 조명 조건들을 비롯한 다야한 요소들을 처리하여 최적의 성능을 발휘하도록 할 수 있다고 밝혔습니다.

Ramos-Briceño는 “도시 환경에서 멀리 떨어져 있고 자원에 더 많이 접근할 수 있는 지역사회의 경우 말라리아 문제에 접근할 수 있는 방법이 될 수 있습니다.”라고 이번 연구 결과의 소감을 밝혔습니다.