Caffe 프레임워크로 배우는 딥 러닝 강의 3종 세트를 확인해보세요!

by NVIDIA Korea

엔비디아 DLI Self-Paced Lab은 뉴럴 네트워크의 설계부터 훈련, 배포까지 최신 기술들을 직접 학습해볼 수 있는 온라인 핸즈온 강의입니다. 자신의 딥 러닝 학습 수준에 따라서 관심이 있는 강의를 선택해서 집에서도 편안하게 들어볼 수 있어 학생들뿐만 아니라 바쁜 개발자, 데이터 사이언티스트 분들에게도 무척 유용한데요.

오늘 소개해 드릴 DLI 랩은 프로모션 이벤트 참여자들이 특히 관심을 많이 가져주신 Caffe 프레임워크를 사용하는 입문자용 실습 강의들입니다.

*아래 랩들을 수강하기 전에 딥 러닝 입문 강의를 아직 듣지 않았다면, 가장 기본이 되는 강의이자 무료 강의인 <Applications of Deep Learning with Caffe, Theano, and Torch> 랩을 미리 들어보실 것을 추천드립니다.


<Signal Processing Using DIGITS>

https://nvidia.qwiklab.com/focuses/1578

  • 강의 시간: 115분 (설치 소요 시간: 2분)
  • 강의 대상: 입문자
  • 프레임워크: Caffe

 

강의 소개

Caffe는 흔히 이미지 처리에 특화된 딥 러닝 프레임워크로 알려져 있습니다. 때문에 음향, 지진, 무선 통신, 또는 레이더 등 다양한 센서에서 취합된 데이터 처리 방법을 볼 수 있는 자료는 상당히 희귀한데요. 이 랩을 통해서는 컨볼루셔널 뉴럴 네트워크(Convolutional Neural Network, CNN)을 사용해서 무선 주파수(RF) 신호를 처리하는 기본 방법을 확인해 볼 수 있습니다. 아래에서 랩의 주요 아젠다를 확인해 보세요.

  • 이미지 데이터가 아닌 데이터를 이미지 데이터처럼 다루는 방법
  • DIGITS에서 딥 러닝 워크플로우를 구현하는 방법
  • 성능을 테스트하고 성능 향상을 안내하는 프로그래밍 방식

 

신호 탐지에 대하여

무선주파수 신호, 또는 생체의학, 온도 등과 같은 감각의 유사 신호들을 측정할 때에 우리들은 종종 특정 신호의 식별 기능을 탐지하는 일에 주력하곤 합니다. 그런데 측정하고자 하는 신호가 노이즈로 인해 약화될 경우, 신호 식별은 쉽지 않습니다.

전통적인 신호 검출 방법은 에너지 검출, “매칭 필터링(matched filtering)” 또는 기타 상관 기반 처리 기술(correlation-based processing techniques)과 같은 다양한 범주의 기술을 사용합니다. 유용한 데이터 길이는 제한되고, 장기 집적 시간이 용이하지 않으므로 단기 무선 주파수는 탐지하기가 까다로울 수 있습니다. 특히 지속시간이 짧고 약한 신호는 탐지하기가 가장 어려운데요. 이 랩에서 CNN을 활용해서 노이즈의 신호를 탐지하는 기존 신호 처리 문제를 해결하는 간단한 방법을 안내 받을 수 있습니다. 무선주파수를 분석하는 방법을 확인함으로써 신호의 에너지를 미리 정해놓은 지속 시간 및 주파수 대역폭을 기준으로 시각화할 수 있습니다.

이처럼 딥 러닝은 많은 문제에 대한 해결책을 제시하는데요. 때로는 이보다 독특한 문제를 다루어야 하는 경우도 있습니다. 어떠한 문제들까지 해결할 수 있는지 확인하고 싶다면 아래 랩을 꼭 들어보세요.


<Object Detection with DIGITS>

https://nvidia.qwiklab.com/focuses/1204

  • 강의 시간: 115분 (설치 소요 시간: 3분)
  • 강의 대상: 입문자
  • 프레임워크: Caffe
  • 원활한 이해와 학습을 위해 본 강의를 듣기 전에 <Image Classification with DIGITS> 우선 수강 필요

 

강의 소개

이 실습 강의에서는 항공사진에서 물체를 탐지하기 위해 DIGITS와 Caffe를  활용하는 방법을 다양한 예제를 통해 학습합니다. 랩에서 제시되는 예시들은 항공 해양사진에서 구체적인 고래 이미지들을 탐지하는 NOAA(미국해양대기관리처) Right Whale Recognition 경진대회(https://www.kaggle.com/c/noaa-right-whale-recognition)에서 영감을 얻은 것인데요.

이 랩을 통해서 항공사진 내 개별 고래를 식별하는 자체 솔루션을 개발해볼 수 있습니다.

이미지 1. 어미 고래와 새끼 고래가 함께 있는 예제

 

이 랩에서는 기존 NOAA Right Whale Recognition 경진대회와는 약간 다르게 문제를 풀어봅니다. 수강생들은 사진 상에서 어떠한 고래가 제시되어 있는지 식별하려고 하기보다는 사진 내에서 고래의 위치를 파악하기 위해 CNN을 트레이닝시킬 것입니다. 고래가 제시되어 있을 수도 있고, 없을 수도 있는 이 문제는 객체 탐지(object detection)이라고 일컬어지는데요. 컴퓨터가 사람이나 차량, 건물 등을 정확히 분간해 낼 수 있게 하는 기술입니다.

기존 대회에서 성공을 거둔 많은 도전자들은 크롭된 이미지와 정규화된 이미지를 사용해서 이미지를 식별하기에 앞서 사진에서 고래를 먼저 탐지하고, 위치를 파악함으로써 높은 점수를 받았습니다.

 

이번 랩에서는 하기의 문제들을 어떻게 풀어갈 수 있을지 자세히 살펴볼 수 있답니다.

문제 1. 이미지들로부터 크롭된 랜덤 이미지를 배경 이미지로 활용할 경우 무엇이 문제가 되는가?

문제 2. 이 모델의 분류 정확도를 향상시킬 수 있는 방법은 무엇인가?

문제 3. 오버랩된 사각형 그리드에 요구되는 연산 시간이 늘어날 경우 어떻게 대처할 수 있는가?

 

초심자, 입문자로서  딥 뉴럴 네트워크를 트레이닝하는 방법을 학습하고, 시각화 및 추론에 대한 기본적인 추론을 수행해 보셨다면 이제 초급자 대상의 네트워크를 배포하는 기술을 학습할 수 있는 하기 랩을 확인해 보세요.

암 치료에 도움이 되는 이미지를 분류하든, 자율주행 차량에서 보행자를 피하기 위해 물체를 탐지하는 문제든 모두 뉴럴 네트워크 배포를 통해 해결할 수 있는데요. 아래 랩 소개에서 보다 자세한 내용을 살펴보세요.

 

<Neural Network Deployment with DIGITS and TensorRT>

https://nvidia.qwiklab.com/focuses/1207

  • 강의 시간: 115분 (설치 소요 시간: 7분)
  • 강의 대상: 초급자
  • 프레임워크: Caffe
  • 원활한 이해와 학습을 위해 본 강의를 듣기 전에 <Image Classification with DIGITS> 우선 수강 필요

 

강의 소개

이 랩에서는 모델 정의 파일과 DIGITS로부터 트레이닝된 가중치를 가져와서 pycaffe 및 TensorRT를 사용해서 배포할 수 있습니다. 수강생들은 배치사이즈가 처리량과 지연시간에 미치는 영향을 살펴 보게 됩니다. 또한 고성능 추론 엔진을 사용할 때 워크플로우와 성능의 차이를 확인할 수 있습니다. 이러한 기술과 노하우를 기존의 랩과 결합하면 데이터 세트에서부터 생산에 이르기까지 머신 러닝에서의 지도 학습 문제를 해결하는 단서를 찾을 수 있습니다.

 

엔비디아 텐서(Tensor)RT

GIE라고도 일컬어지는 엔비디아 텐서RT는 프로덕션 환경을 위한 고성능 딥 러닝 추론 솔루션입니다. 전력 효율성과 반응 속도는 딥 러닝 애플리케이션 배포에 있어 두 가지 주요 측정지표인데요. 이는 두 지표가 사용자 경험과 제공된 서비스 비용에 직접적인 영향을 미치기 때문입니다. 텐서RT는 런타임 성능을 위해 트레이닝된 뉴럴 네트워크를 자동으로 최적화하고, 웹/모바일, 임베디드 및 자동차 애플리케이션을 위한 GPU 가속 추론을 제공합니다.

 

텐서 RT 사용에는 두 단계가 있습니다: 바로 구축과 배포입니다.

이 랩에서는 DIGITS에서 트레이닝된 GoogLeNet 모델용 텐서RT 런타임을 구축할 예정입니다.

 

DLI Self-Paced Lab 강의는 아마존 웹 서비스(AWS)및 구글 클라우드(Google Cloud)가 제공하는 글로벌 핸즈온 소프트웨어 트레이닝 실습 플랫폼인 Qwiklabs을 기반으로 합니다. 아직 Qwiklabs 아이디를 생성하지 않았다면, 엔비디아 블로그에 제시된 튜토리얼에 따라 가입부터 진행해 주세요.

가입을 마쳤다면 추가적으로 어떠한 들어볼 수 있는지 확인해 보세요!