파리의 공공 종합병원(AP-HP)은 데이터부문의 선두를 달리며 코로나19와의 전쟁 최전선에서 맞서 싸우고 있습니다.
AP-HP는 39개 병원으로 구성된 네트워크와 함께 연간 830만 명의 환자를 치료하며 코로나19 대응에 큰 역할을 하고 있습니다.
코로나19 로 인해 어마어마한 양의 데이터가 생겨났는데요. 이중에는 팬데믹 영향 완화에 도움이 될 위치데이터(geodata)도 포함되어 있습니다. AP-HP는 코로나 이전부터 7개 대학과 연계해 대량의 의료 데이터를 분석할 수 있는 능력을 갖고 있었습니다. 암 확진 사례와 위치데이터를 결합한 대시보드를 개발하기도 했죠. 그러니 AP-HP가 이번 팬데믹 상황에서 그 역할을 확대하고자 한 것도 당연한 일이었습니다.
코로나19로 발생한 엄청난 양의 데이터는 AP-HP의 데이터 분석 역량을 시험대에 오르게 했습니다. 이 막중한 도전과제를 해결하기 위해 AP-HP의 정보시스템 관리자들은 키네티카(Kinetica) 기업과 손을 잡았습니다. 키네티카는 스트리밍 데이터 웨어하우스와 실시간 애널리틱스를 제공하는 기업으로, AI 스타트업을 지원하는NVIDIA Inception 프로그램의 회원사이기도 하죠.
AP-HP는 키네티카의 지원으로 엔비디아의 GPU를 활용해 확진자의 위치 데이터를 신속하게 이용할 수 있게 됐는데요. 덕분에 속도가 생명인 코로나19와의 싸움에서 우위를 선점할 수 있습니다.
AP-HP는 또한 NVIDIA RAPIDS를 사용해 플랫폼에 통합된 머신 러닝 알고리즘의 속도를 높였습니다. RAPIDS는 GPU 병렬화와 높은 메모리 대역폭을 활용해 애널리틱스 툴과 데이터 사이언스 파이프라인을 가속화합니다.
AP-HP 프로젝트를 이끌고 있는 헥터 카운투어리스(Hector Countouris)는 “실시간 분석을 수행할 능력이 있다는 건은 팬데믹 상황에서 아주 중요합니다.”라고 말합니다. “분석해야 할 데이터가 계속 늘어나니까요.”
코로나19 접촉자 데이터 분석
헥터 카운투어리스와 그의 동료들이 가장 주안점을 두고 있는 것은 코로나19 관련 위치데이터를 활용해 바이러스의 ‘감염 빈발 지역(hot spots)’을 규명하고 발병의 역학을 이해하는 것입니다. 집단감염 지역을 찾으면 지역 사회 차원의 의사결정에 도움이 될 수 있죠.
AP-HP 프로젝트는 또한 코로나19 환자를 감염 초기에 진단할 수 있는 새로운 신호들을 검토하고 있는데요. 여기에는 다른 지역기관에서 전달받은 데이터를 통한 연구도 포함됩니다.
코로나19 확진자들은 유관 기관에 전화해 최근 동선을 알리고 접촉자 추적에 도움이 될 만한 정보를 제공합니다. 광범위한 데이터를 기반으로 접촉자를 추적하고, 감염에 노출된 가능성이 있을 경우 적시에 경고를 보내게 된 건 이번이 최초인데요. 덕분에 코로나19의 집단감염 발전 양상을 관찰할 새로운 역량을 얻게 될 것입니다.
헥터 카운투어리스는 “하루 빨리 집단감염이 진화하는 방식을 실시간으로 추적할 수 있게 되길 바랍니다”라며 기대감을 보였습니다.
프로젝트의 목표는 공중보건 정책결정자들이 예방 통제 수단을 이해하고 그 효과를 평가할 수 있게 돕는 것입니다. 확진자로부터 수집한 데이터를 인구통계학적 데이터와 결합시키면 바이러스의 확산 상황, 그리고 사회경제적 요소 등이 그 확산에 기여하는 바가 있는지 여부를 연구할 수 있죠.
GPU로 데이터 병목현상 해소
키네티카를 만나기 전, 대부분의 데이터 프로젝트들은 데이터 로딩에 굉장히 많은 시간을 소요해야 했습니다. 때문에 신속한 분석을 진행하지 못했고, 실시간 효용을 내지 못하는 문제가 발생했죠.
헥터 카운투어리스는 “이제 이런 데이터 병목현상은 없습니다. 데이터를 지속적으로 통합하고 대시보드로 만들어 정책결정자들에게 제공하는 데에는 몇 시간이면 되죠. 강력한 실시간 파이프라인이 계속 데이터를 수집해주는 덕분에 대시보드의 품질을 올리는 데 집중할 수 있습니다”라고 평가합니다.
이전에는 구체적이고 이용가능한 상태의 데이터를 얻으려면 전 처리 과정을 여러 차례 거쳐야 했습니다. NVIDIA V100 Tensor Core GPU로 구동되는 키네티카의 스트리밍 데이터 웨어하우스가 있으면 그 과정이 훨씬 신속해지고 사용자는 한층 더 풍부한 데이터세트에 액세스할 수 있게 되죠.
키네티카 플랫폼은 NVIDIA NGC에서 이용할 수 있습니다. NVIDIA NGC는 기업이 익스트림 애널리틱스, 머신 러닝, 데이터 가상화를 신속히 운용할 수 있도록 지원하는 GPU 최적화 AI 컨테이너 카탈로그인데요. NVIDIA NGC로 복잡함을 제거하고 온프레미스 또는 퍼블릭 클라우드와 하이브리드 클라우드 전반에서 모델을 구축할 수 있습니다.
카운투어리스는 “GPU 없이는 위치데이터에 대한 사용자의 기대를 충족시킬 수 없을 것입니다. 데이터의 양도 무척 많을뿐더러, 서비스를 공급해야 할 사용자들도 너무나 많거든요”라고 말했습니다.
AP-HP의 코로나19 관련 연구는 향후 비상사태에 대한 후속 연구의 기반을 마련했습니다. AP-HP의 데이터를 향한 관심은 앞으로도 계속될 것입니다.
헥터 카운투어리스는 “우리가 의사 결정 과정에 도움을 줬고, 병원이 우리의 데이터를 사용하고 있다는 사실이 곧 성공의 척도입니다. 앞으로도 할 일이 많습니다. 이것은 시작에 불과해요”라고 덧붙였습니다.
헥터 카운투어리스는 지난 10월에 열린 GTC에서 AP-HP 프로젝트 팀의 성과를 발표했는데요. 여기에서 해당 세션을 다시볼 수 있습니다.
한편, 키네티카는 10월 16일 오후 2시(태평양시간)에 열린 HLTH 컨퍼런스의 엔비디아 스타트업 빌리지 부스(NVIDIA Startup Village Booth)에 참여하기도 했습니다.