댄 루벤스타인(Dan Rubenstein) 교수는 세계에서 멸종위기에 가장 임박한 종 중 하나인 그레비얼룩말을 구하는 데에 그의 연구 인생을 바쳐왔습니다. 최근 그는 딥 러닝에 기반한 이미지 인식 소프트웨어와 크라우드소싱의 결합 덕분에 이전보다 데이터를 더 정확하고 빠르게 수집할 수 있게 되었는데요. 앞으로의 멸종위기종 보존 노력에 있어서도 큰 진전이 있을 전망입니다! 루벤스타인 교수는 그레비얼룩말의 개체수가 급감한 1980년에 그레비얼룩말 연구를 시작했습니다. 당시 추세대로라면 6년 후, 그레비얼룩말은 멸종될 처지였죠. 이들의 멸종을 막기 위해 프린스턴 대학의 동물학 교수로 있던 루벤스타인 교수는 그레비얼룩말을 필름에 담고 현장에서 인화하기 시작 했습니다.
그레비얼룩말 암컷 새끼 (사진: 모건 캘리(Morgan Kelly) 제공: 프린스턴 대학 대외담당)
루벤스타인 교수는 사진 기록 작업이 여의치 않자 그레비얼룩말의 지문과 같은 줄무늬 패턴을 수기로 기록하기 시작했습니다. 이 작업은 효과는 있었지만 시간이 너무 많이 드는 일이었는데요. 그는 디지털 사진의 도래와 소프트웨어 도입이 그레비얼룩말의 개별 특징과 개체를 정리하는 작업에 큰 기폭제가 되었다고 말합니다. 루벤스타인 교수는 “환경적 특성이 동물의 행동에 어떻게 영향을 미치는지를 정하는 개별 결정을 이해하기 위해서는 개체별 인식이 중요합니다”고 말합니다.
그레이트 그레비얼룩말 랠리(Great Grevy’s Rally)
최근 루벤스타인 교수의 연구 작업의 판도를 바꿀 또다른 서비스가 나타났습니다. 바로, 딥 러닝으로 구동되는 이미지 인식 소프트웨어인 핫스포터(HotSpotter)와 “그레이트 그레비얼룩말 랠리”인데요. 혁신적인 센서스(census) 작업인 그레이트 그레비얼룩말 랠리에 약 500여명의 시민들과 환경 보호 활동가들이 자발적으로 참여했습니다. 핫스포터(HotSpotter)란 나선형신경망(Convolution Neural Network, CNN) 알고리즘 입니다. 뉴욕 트로이의 렌셀러 폴리테크닉 대학교(Rensselaer Polytechnic Institute) 컴퓨터과학과에 재직중인 척 스튜어트(Chuck Stewart) 교수는 핫스포터를 개발해 엔비디아 GPU 기반 시스템으로 트레이닝을 시키고 있습니다.
얼룩말의 줄무늬를 바코드처럼 판독하다
핫스포터는 이미지를 훑으면서, 얼룩말 특유의 바코드 같은 줄무늬와 체형으로 개체를 구분하고, 포즈를 파악하며 이미지의 품질을 분석합니다. 이미지 당 처리시간은 약 1초 남짓 걸려, 예전의 수작업보다는 훨씬 빨라진 셈입니다. 핫스포터는 그레이트 그레비얼룩말 랠리의 기술 엔진이라고 할 수 있는데요. 올해 1월에 개최된 이 랠리에는 수백 명의 과학자, 레인저, 케냐인들이 자발적으로 참여하였습니다. 참가자들은 삼삼오오 흩어져서 이틀간 2만5천 제곱 킬로미터 규모의 초원을 누비며 GPS추적이 가능한 카메라로 그레비얼룩말을 가능한 많이 촬영했습니다. 그 결과, 약 4만장의 이미지가 수집되었죠.
케냐 전역에서 수백 명의 시민들이 그레비얼룩말 촬영에 참여하다.
바로 여기서 핫스포터의 진가가 드러납니다. 수집된 4만장의 이미지 중에서, 1만 5천장이 그레비얼룩말을 원하는 방향에서 선명하게 포착했습니다. (개체 확인을 쉽게 하기 위해서 연구진들은 오른쪽 면의 사진을 원했습니다) 핫스포터가 1만 5천장의 이미지 분석을 마친 후, 그레이트 그레비얼룩말 랠리가 얼마나 성공적이었는지를 밝힌 것인데요. 분석 결과에 따르면 참가자들은 약 2천마리에 이르는 확인된, 이름을 가진 그레비얼룩말을 촬영했습니다. 이는 케냐에 서식하는 그레비얼룩말 수의 약 80% 이상 입니다. (에티오피아에도 수백 마리가 살고 있죠.)
그레비얼룩말 촬영 결과
랠리 첫날에 촬영된 그레비얼룩말은 약 1,400마리였습니다. 이튿날에는 이전에 파악된 적이 없는 500마리가 추가로 포착되었고, 전날에 이어 중복 촬영된 개체수는 900마리였습니다. 이러한 센서스 연구 결과, 루벤스타인 교수는 그레비얼룩말 개체수가 2,350마리 가량이라고 추산했으며, 이는 이전 보다 더 신빙성이 있는 수치라고 밝혔습니다. 루벤스타인 교수는 “이번 랠리로 인해 예전에는 막연한 추산 숫자였던 것이 신뢰할 수 있는 숫자가 되었습니다.”라며 “결과적으로, 더 많은 사람들이 주목하게 되었죠.”고 말했습니다. 무엇보다도 핫스포터 알고리즘 덕분에 연구진들은 중요한 사실을 알아냈습니다. 그레비얼룩말 개체수의 약 30%가 유아기, 청년기라는 점입니다. 연구진에 따르면, 개체수가 안정되고 지속성을 유지하는 데 결정적인 단계에 있다는 것입니다.
그레비얼룩말이 자주 출몰하는 곳 등의 분포도가 촬영으로 드러나면서, 주요 지점에 물을 마시고, 풀을 뜯을 수 있게끔 해줄 필요가 있다는 점이 부각되었습니다. 연구진과 과학자들은 이를 기반으로 초지 복원을 추진하고, 물 접근성을 개선시키고, 야생동물 친화적인 인프라를 구축하고, 그레비얼룩말 개체수가 낮은 지역에서 사자의 포식률을 조정하기 위해 공조할 계획입니다.
GPU의 역할, 점점 중요해져
GPU 기반으로 개발된 핫스포터는 사진 분석 중 포착(detection) 단계에서도 GPU로 구동됩니다. 사진 이미지를 검색할 때 그레비얼룩말의 존재유무와 특징이 카테고리 별로 분류되고 표시되는 것이죠. 스튜어트(Stewart)는 GPU의 경우 포착 프로세스가 이미지당 1초 미만이어서 CPU 대비 20배-30배 가량 빠르다고 말했습니다. 척 스튜어트 교수는 “GPU 덕분에 고급 알고리즘을 사용해 더 많은 이미지 모음으로 트레이닝을 시킬 수 있습니다”고 말했습니다. 현재 척 스튜어트 교수를 비롯한 렌셀러 폴리테크닉 대학교 연구진은 고래상어, 가오리, 돌고래 등 해양동물의 포착과 구분을 하기 위해 보다 완전한 알고리즘 세트를 개발 중입니다. 이 역시 GPU의 지원이 필요합니다. 척 스튜어트 교수의 기술 개발로 수작업을 자동화 시키고, 연구진이 이미지 데이터에서 얻은 인사이트 분석에 전념할 수 있다면, 루벤스타인 교수와 같은 생태학자들이 동물 보호 부문에서 예전보다 더 큰 성과를 이룰 수 있을 전망입니다. 루벤스타인 교수는 “작업 과정에서 사람들의 느린 속도를 배제할 수 있게 되는 것이 관건입니다”고 말합니다.