헬스케어 딥 러닝 강의 5종: 레벨 별 다양한 DLI 강의를 소개합니다

by NVIDIA Korea

엔비디아 딥 러닝 인스티튜트(이하 DLI)는 딥 뉴럴 네트워크를 어떻게 설계하고 훈련하며 배포하는지에 대한 최신 딥 러닝 기술 교육 세션을 제공하는 글로벌 교육 프로그램입니다. DLI Self-Paced Lab은 온라인으로 간편하게 들을 수 있는 DLI 강의로, 실습 플랫폼 Qwiklabs 상에서 무료, 또는 소정의 강의료를 지불하고 들을 수 있는데요.

 

DLI Self-Paced Lab은 아마존 웹 서비스(AWS)및 구글 클라우드(Google Cloud)가 제공하는 글로벌 핸즈온 소프트웨어 트레이닝 실습 플랫폼인 Qwiklabs을 기반으로 합니다. 아직 Qwiklabs 아이디를 생성하지 않았다면, 엔비디아 블로그에 제시된 튜토리얼에 따라 가입부터 진행해 주세요.

가입을 마쳤다면 추가적으로 어떠한 들어볼 수 있는지 확인해 보세요.

 

Qwiklab 가입과 강의 확인까지 모두 마치셨다면 오늘은 현재 들어볼 수 있는 여러 DLI 랩 중에서도 헬스케어 분야와 관련된 5개 랩을 소개하고자 합니다.

 

헬스케어 분야에 어떻게 딥 러닝을 적용시킬까?

헬스케어 분야에서의 딥 러닝 기술은 의료영상을 분석 하여 병을 진단하거나 기존의 데이터를 학습해 질병 발병 여부를 미리 예측하는데 많이 활용되고 있으며, 빠른 진단과 정확한 질병 판단에 도움을 주는 기술의 보조 역할의 중요성과 필요성은 계속 커지고 있습니다.

의료영상 분석의 주요한 과제들은 질병의 발병 여부를 파악하는 과제에 딥러닝 기술이 가장 많이 적용되고 있기 때문에 영상을 분류(classification)하고 객체를 탐지(detection)하고, 객체 경계를 세그멘테이션(segmentation)하는 기술이 중요합니다. 따라서 영상에서 특징을 추출하는 데에 특화된 컨볼루셔널 뉴럴 네트워크(Convolutional Neural Network, CNN)가 가장 많이 활용되지요.

엔비디아 Qwiklabs에서는 실제 의료 데이터를 가지고 딥 러닝 기술을 적용시켜보는 실습을 할 수 있는데요, 어떤 내용을 공부할 수 있는지 자세히 알아보겠습니다!


<Medical Image Segmentation with DIGITS>

https://nvidia.qwiklab.com/focuses/2794

  • 강의 시간: 90분 (설치 소요 시간: 4분)
  • 강의 대상: 초급자
  • 프레임워크: Caffe

이미지 세그맨테이션은 이미지의 각 픽셀을 특정 클래스에 배치하는 작업으로, 이 랩에서는 시맨틱 이미지 세그멘테이션 문제에 대한 다양한 접근법을 탐구합니다. 구체적으로는 캐나다 써니브룩(Sunnybrook) 병원의 심장병 데이터를 사용해서 뉴럴 네트워크가 MRI 영상에서 좌심실의 위치를 파악하도록 트레이닝하게 될 텐데요.

본 랩의 강의 목표는 시맨틱 세그맨테이션을 위해 널리 사용되는 이미지 분류 뉴럴 네트워크 사용법을 이해하고, 사용자 정의 파이썬(Python) 레이어로 Caffe 프레임워크를 확장하는 것입니다. 또한 수강생들은 전이 학습(transfer learning)의 개념에 익숙해 지면서 FCN(Fully Convolutional Networks) 계열의 두 가지 뉴럴 네트워크를 트레이닝 해보게 됩니다.

 

<Image Classification with TensorFlow: Radiomics – 1p19q Chromosome Status Classification>

https://nvidia.qwiklab.com/focuses/3044

  • 강의 시간: 90분 (설치 소요 시간: 5분)
  • 강의 대상: 중급자
  • 프레임워크: Caffe
  • 필수 요건: CNN 및 유전체학에 대한 기초지식 습득자

MRI 영상에서 Radiomics(*맨눈으로는 평가가 불가능한 대량의 정량적 영상 형태를 자료특성 알고리즘을 통해 병변을 특성화하는 기법)를 탐지하기 위한 딥 러닝 사용법은 뇌종양 환자에게 보다 효과적인 치료법을 제공하고, 환자의 건강 상태를 개선 할 수 있습니다.

방사선유전학(Radiogenomics), 특히 영상유전체학은 암 이미징 기능과 유전자 발현 사이의 상관 관계를 나타냅니다, 영상유전체학은 침윤성 생검을 사용하지 않고도 질병의 유전체를 확인하는 표지인자(biomarker)를 만드는 데 활용될 수 있습니다.

이 랩은 케라스(Keras) 및 텐서플로우(TensorFlow)를 통해 딥 러닝 중에서도 CNN을 사용하는 1p19q 공동 결실(*유전학에서 염색체의 유전성 물질을 상실하는 것) 표지인자를 탐지하는 것에 중점을 둡니다.

 

<Modeling Time Series Data with Recurrent Neural Networks in Keras>

https://nvidia.qwiklab.com/focuses/3043

  • 강의 시간: 90분 (설치 소요 시간: 5분)
  • 강의 대상: 중급자
  • 프레임워크: Theano
  • 필수 요건: CNN 트레이닝 경험자

이 랩에서는 전자건강기록 (EHR)에 제공된 정보를 기반으로 환자의 질병의 심각성 예측을 위해 헬스케어 환경에서 얼마나 딥 러닝이 활용될 수 있는지 탐색합니다. 파이썬 라이브러리 판다스(pandas)를 사용해서 HDF5 포맷으로 제공되는 데이터세트를 관리하고, 딥 러닝 프레임워크인 케라스로 리커런트 뉴럴 네트워크(Recurrent Neural Networks,  RNN)를 구축합니다.

구체적으로는 LSTM (Long-Short Term Memory Network)이라고 하는 특별한 종류의 RNN을 구축하게 될 텐데요. 여기서의 대략적인 개념은 의료진으로 하여금 언제든 환자 사망 예측을 해낼 수 있도록 하는 딥 러닝 기술로 강화된 분석 프레임 워크를 개발하는 것입니다. 이러한 솔루션은 치료 결정의 영향력을 평가하려고 할 때에 임상의에게 중요한 피드백을 제공하거나 바쁜 병원 치료환경에서 위험에 처한 환자를 확인하기 위한 조기 경고 신호를 제기합니다.

 

<Medical Image Analysis with R and MXNet>

https://nvidia.qwiklab.com/focuses/2793

  • 강의 시간: 90분 (설치 소요 시간: 4분)
  • 강의 대상: 중급자
  • 프레임워크: MXNet
  • 본 강의 수강 전 <Image Classification Using DIGITS> 우선 수강 권장

이 랩에서는 연례 의료 데이터 과학자 대회인 데이터 사이언스 볼 두 번째대회(Data Science Bowl, NDSB2)를 살펴볼 예정입니다. 대회 당시, NDSB2이 제시한 과제는 박동하는 심장의 MRI에서 파생된 영상 시퀀스로부터 방출 분획을 추정하는 것이었는데요.

본질적으로, 방출 분획은 심장 내 혈액량에서 심장 외 혈액량을 뺀 값입니다. 즉, 단일 박동(팽창 및 수축)에 대해 인간의 심장으로부터 방출되는 혈액의 부피인 것인데요. 여기에서 대략적인 개념은 너무 작거나 큰, 비정상적인 분출률이 심각한 의학적 상태를 나타냅니다.

일반적인 실험실 환경에서 의료 전문가가 단일 폐동맥 스캔을 분석하는 데에는 20 분 이상의 시간이 소요되는데요. 본 랩에서는 딥 러닝 프레임 워크 MXNet과 대중적인 R 프로그래밍 언어를 사용해서 강력한 GPU 가속 CNN 솔루션을 구축합니다. 또한 일반적인 고려사항 및 딥 러닝을 위한 공통 전략뿐만 아니라 트레이닝을 위한 대형 이미지 데이터세트를 준비하는 과정에 대해서도 간략하게 설명합니다.

 

<Deep Learning for Genomics using DragoNN with Keras and Theano>

https://nvidia.qwiklab.com/focuses/3046

  • 강의 시간: 90분 (설치 소요 시간: 4분)
  • 강의 대상: 중급자
  • 프레임워크: MXNet
  • 필수 요건: 유전체학에 대한 기본지식 습득자

이 랩에서는 DragoNN(Deep RegulAtory GenOmics Neural Network) 툴킷을 사용해서 시뮬레이션 및 실제 규제 유전체학 데이터를 다루게 될 텐데요.

먼저 딥 러닝 모델을 해석하여 예측 가능한 유전체 서열 패턴을 발견하는 방법을 배웁니다. 시뮬레이션 실험을 거친 실제 유전체 데이터에 대해 DragoNN 툴킷을 사용해서 대중적인 DragoNN 아키텍처를 분석하고, DragoNN 모델을 사용해서 규제 순서를 모델링하고, 해석하는 데 필요한 지침을 탐색합니다. 그리고 DragoNN이 유전체학 및 고성능 모델에서의 학습 문제를 해결하기 위한 좋은 선택일지 살펴보게 됩니다.

 

그럼 엔비디아에서 제공하는 DLI Self-Paced Lab을 통해 헬스케어 분야에 적용할 수 있는 딥 러닝 기술을 좀 더 알아보시기 바랍니다!