지진을 연구하는 지질학자가 ‘딥 러닝’에 빠진 이유

by NVIDIA Korea
deep learning_geologist

인도네시아 해안에서 규모 9.1의 지진과 쓰나미가 강타해 10여개국에서 20만 명 이상이 사상자를 낸지 15년이 지났지만, 지질학자들은 여전히 지각 속의 복잡한 단층 시스템을 이해하기 위해 노력하고 있습니다.

지질학자들은 주요 단층을 쉽게 찾을 수 있지만, 이런 대규모 지형은 암석 속의 작은 단층이나 균열 등과 연결돼 있습니다. 작은 단층들은 3D 이미지를 통해 각각의 조각들을 몇 주에 걸쳐 연구해야만 식별하는 것이 가능하기 때문에 상당히 어려운 일입니다.

미국 텍사스주 오스틴에 위치한 텍사스 대학교의 연구원들은 3D 지진파 이미지에서 지진 단층 시스템을 식별해, 연구원들의 시간과 자원을 절약하는 딥 러닝 모델로 이 복잡한 과정을 혁신하고 있습니다. 대부분의 지질학자들이 놓치는 경우가 많은 작고 미세한 단층을 발견해 내는 뉴럴 네트워크를 훈련하기 위해 개발자들은 엔비디아 GPU와 합성 데이터를 함께 사용했습니다.

단층 시스템을 검토하면 어떤 지형이 다른 지형 보다 오래됐는지 확인하고, 대륙판이 해양판과 만나는 대륙 주변부 같은 관심지역을 연구하는데 도움이 됩니다.

지진연구는 석유나 천연가스를 추출하는 에너지 업계의 시추작업에도 사용되며, 탄소격리의 반대 공정, 즉 지면에 이산화탄소를 다시 주입해 기후변화의 영향을 완화하는 데에도 사용됩니다.

텍사스 대학교 오스틴 캠퍼스의 지질학 교수 세르게이 포멜(Sergey Fomel)은 “딥 러닝을 사용하면 정확도가 약간 높아지는 것이 아니라, 완전히 다른 차원의 정확성과 효율성을 제공받을 수 있습니다”라며, “균열된 부분을 드릴로 뚫어야 할 때가 있고, 그렇지 않아야 할 때가 있습니다. 어떻게 하든, 우선적으로 균열의 위치를 파약해야 합니다”라고 말했습니다.

지반 상층부 균열 추적

지진 단층 시스템은 매우 복잡해 관련 데이터를 수동으로 분석하면 주요 단층과 연결된 미세한 균열이나 길게 갈라진 틈을 놓칠 수 있습니다. 사람이 일일이 주석을 단 데이터세트를 학습한 딥 러닝 모델도 마찬가지로 이런 작은 균열을 놓치게 됩니다.

이러한 문제를 해결하기 위해, 연구원들은 지진 단층의 합성 데이터를 만들었습니다. 합성 데이터를 사용한다는 것은 과학자들이 데이터 세트에서 각각의 주요/비주요 단층의 위치를 이미 파악하고 있다는 것을 의미했습니다. 과학자들은 이 지상실측정보 기준치(ground-truth baseline)로 수동 라벨링을 하는 것보다 높은 정확도를 제공하는 AI 모델을 훈련할 수 있었습니다.

연구팀의 딥 러닝 모델은 3D 용적 데이터를 분석해 이미지의 모든 픽셀마다 단층이 존재하는지에 대한 확률을 계산합니다. 그 다음, 뉴럴 네트워크가 단층이 있을 가능성이 높다고 표시한 곳을 지질학자들이 검토하고 분석합니다.

Faults

포멜 교수는 “지질학자들은 지질시대에 어떤 일들이 일어났는지 연구합니다. 정확히 어떤 일이 있었는지 알아보기 위해서 AI 모델의 결과를 분석해야 하지만, 우리는 지질학자들이 이것을 수동으로 하지 않아도 되도록 지원하고 싶습니다. 지질학자들이 수동작업을 하는데 시간을 낭비해서는 안됩니다”라고 말했습니다.

포멜 교수는 엔비디아 GPU로 추론을 하는 연구팀의 CNN 기반 모델로 단층 시스템을 분석하는데 단 몇 초가 걸리는 일을 수동으로 하면 최대 1개월이 걸릴 수 있다고 말했습니다. 그 전에 사용했던 자동화 방식은 몇 시간이 걸렸고 정확성도 크게 떨어졌습니다.

포멜 교수는 “딥 러닝을 사용하면 정확도가 약간 높아지는 것이 아니라, 완전히 다른 차원의 정확성과 효율성을 제공받을 수 있습니다. 딥 러닝은 자동해석분야의 게임 체인저입니다”라고 말했습니다.

  • 연구진은 엔비디아 GPU로 구동되는 텍사스 첨단 컴퓨팅 센터(Texas Advanced Computing Center)의 매버릭2(Maverick2) 시스템에서 자체 뉴럴 네트워크를 훈련했습니다. 연구진의 딥 러닝 모델은 파이토치(PyTorch)와 텐서플로우(TensorFlow) 딥 러닝 프레임워크를 사용해 만들어졌으며, 지구물리학 데이터 분석을 위해서는 마다가르카르(Madagascar) 소프트웨어 패키지가 사용됐습니다.

이 알고리즘은 단층 외에도 염체, 퇴적층과 채널 등 지질학자들이 연구하는 다른 지형을 감지하는 데에도 사용될 수 있습니다. 연구원들은 지질구조에 대한 상세 정보를 얻을 수 있는 측정 데이터인 지진 데이터를 바탕으로 지질 시대를 계산하는 뉴럴 네트워크도 개발하고 있습니다.