NYU와 엔비디아, 환자 재입원 예측을 위한 대규모 언어 모델 개발 협력

병원에서 퇴원하는 것은 환자 당사자에게 중요한 이정표이지만 때로는 회복이 끝났다는 것을 의미하는 것은 아닙니다. 미국 병원 환자의 약 15%가 첫 퇴원 후 30일 이내에 재입원하게 되는데, 이는 종종 환자와 병원 모두에게 더 나쁜 결과와 더 높은 비용을 안겨다 주기도 합니다.

뉴욕대학교의 학술 의료 센터인 뉴욕대학교 랭곤 헬스(NYU Langone Health)의 연구원들은 엔비디아 전문가들과 협력하여 환자의 30일 이내 재입원 위험과 다른 임상 결과를 예측하는 대규모 언어 모델(LLM)을 개발했습니다.

6개 입원 환자 시설의 의료 시스템에 구축된 이 모델은 과학 저널인 Nature에 소개되었으며, 의사에게 재입원 가능성을 줄이기 위해 임상적 개입이 필요한 환자를 식별하는 데 도움이 될 수 있는 AI 기반 인사이트를 제공합니다.

“환자를 퇴원시킬 때는 환자가 다시 입원할 필요가 없을 것이라고 예상하거나 더 오래 입원시켜야 한다고 생각하지 않습니다.”라고 NYU 그로스만 의과대학의 영상의학과 및 신경외과 조교수이자 NYUTron의 수석 협력자인 Eric Oermann 박사는 밝혔습니다. 이제 AI 모델의 분석을 통해 임상의가 환자의 재입원 위험이 높은 상황을 미리 예방하거나 해결할 수 있게 되었습니다.

이 모델은 지금까지 뉴욕대학교 의료 시스템에서 퇴원한 5만 명 이상의 환자에게 적용되었으며, 이메일 알림을 통해 의사에게 재입원 위험에 대한 예측을 공유해왔는데요, Oermann 교수팀은 다음 단계로 NYUTron의 분석에 기반한 개입이 재입원율을 낮추는지를 테스트하기 위한 임상시험을 계획하고 있습니다.

빠른 재입원 등의 위험에 대처하기

미국 정부는 병원이 제공하는 치료의 질을 나타내는 지표로 30일 재입원율을 추적하고 있습니다. 재입원율이 높은 의료기관에는 벌금이 부과되며, 이는 병원이 퇴원 프로세스를 개선하도록 장려하는 수준의 정밀한 조사입니다.

최근 퇴원한 환자가 병원에 재입원해야 하는 이유는 감염, 항생제 과다 처방, 수술 배액관을 너무 일찍 제거한 경우 등 여러 가지가 있을 수 있습니다. 이러한 위험 요인을 조기에 발견할 수 있다면 의사는 치료 계획을 조정하거나 병원에서 환자를 더 오래 모니터링하여 개입할 수 있습니다.

“1980년대부터 환자의 재입원을 예측하는 계산 모델은 있었지만, 우리는 이를 의료 시스템 규모의 임상 텍스트 코퍼스가 필요한 자연어 처리 작업으로 취급하고 있습니다.”라고 Oermann은 말합니다. “우리는 사람들이 이전에 고려하지 않았던 인사이트를 포착할 수 있는지 알아보기 위해 전자 의료 기록의 비정형 데이터에 대해 LLM을 훈련시켰습니다.”

NYUTron은 약 40만 명의 환자에 해당하는 40억 단어 이상의 임상 기록이 포함된 NYU Langone Health의 10년간의 의료 기록에 대해 사전 학습을 했습니다. 이 모델은 재입원을 예측하는 최첨단 머신러닝 모델에 비해 정확도가 10% 이상 향상되었습니다.

30일 재입원이라는 초기 활용 사례에 대해 LLM을 학습시킨 후, 팀은 약 1주일 만에 4개의 다른 예측 알고리즘을 생성할 수 있었습니다. 여기에는 환자의 입원 기간, 병원 내 사망 가능성, 환자의 보험 청구가 거부될 가능성 예측이 포함됩니다.

Oermann은 “병원 운영은 어떤 면에서 호텔 관리와 비슷합니다. 병원을 더 효율적으로 운영하는 데 도움이 되는 인사이트는 더 많은 병상을 확보하고 더 많은 환자를 더 잘 치료하는 것을 의미합니다.”라고 이야기합니다.

훈련에서 배포까지 LLM 활용하기

NYUTron은 수억 개의 파라미터가 포함된 LLM으로, 대규모 NVIDIA A100 텐서 코어 GPU 클러스터에서 NVIDIA NeMo Megatron 프레임워크를 사용하여 훈련되었습니다.

“현재 언어 모델에 대한 많은 논의는 수백 또는 수천 개의 GPU를 사용하여 복잡한 데이터 세트로 학습된 수십억 개의 파라미터가 포함된 거대한 범용 모델에 관한 것입니다.”라고 Oermann은 말합니다. “대신 고도로 정제된 데이터로 학습된 중간 규모의 모델을 사용하여 의료 분야에 특화된 작업을 수행하고 있습니다.”

실제 병원에서 추론할 수 있도록 모델을 최적화하기 위해 연구팀은 엔비디아 TensorRT 소프트웨어 개발 키트를 사용하여 간소화된 AI 모델 배포를 위한 수정된 버전의 엔비디아 Triton 오픈 소스 소프트웨어를 개발했습니다.

“이러한 모델을 실제 의료 환경에 배포하려면 효율적으로 실행되어야 합니다.”라고 Oermann은 말합니다. “Triton은 추론 프레임워크에서 원하는 모든 것을 제공할 수 있기에 모델을 매우 빠르게 구축할 수 있었습니다.”

Oermann의 팀은 LLM을 사전 학습한 후 특정 병원의 데이터를 사용하여 현장에서 미세 조정하면서 정확도를 크게 높일 수 있으며, 이러한 특성은 다른 의료 기관에서 유사한 모델을 배포하는 데 도움이 될 수 있다는 사실을 발견했습니다.

“모든 병원이 대규모 언어 모델을 사내에서 처음부터 학습시킬 수 있는 리소스를 갖추고 있는 것은 아니지만, NYUTron과 같이 사전 학습된 모델을 채택한 다음 클라우드의 GPU를 사용하여 소량의 로컬 데이터 샘플만으로 미세 조정할 수 있었습니다.”라고 소감을 밝혔습니다. “이는 의료 업계에 종사하는 거의 모든 사람이 이용할 수 있는 수준입니다.”

NYUTron에 대해 자세히 알아보려면 네이처 논문을 읽고 이 NVIDIA와 NYU의 온디맨드 대담 영상을 시청해보세요.