유방 X선을 분석하는 방사선 전문의에 따라 환자의 유방암 발병 가능성을 보여주는 유방 밀도 판독 값이 크게 달라집니다.
한 연구에 따르면 방사선 전문의들은 유방 X선 사진 중 60~85% 가량을 ‘치밀도가 불균일 하거나 높은 치밀도를 보이는 유방’ 또는 ‘매우 심한 치밀 유방’에 해당하는 암 발병 위험 영역으로 분류했습니다.
MIT 연구진은 유방 X선 사진에 대한 방사선 전문의의 다양한 해석 편차를 줄이기 위해 신경망을 사용하고 있습니다.
매사추세츠 종합병원 검진센터의 방사선 전문의들은 MIT가 개발한 딥 러닝 모델을 사용합니다. 이 모델이 대규모 임상 의료의 일상 진료에 배포된 것은 이번이 처음이라고 연구원들은 전합니다.
위험에 대한 가시성 확대
매년 미국에서 실시되는 유방 X선 검사는 약 3,300만 건에 달합니다. 이 검사는 증상이 나타나기 전 유방암 여부를 판단해 줄 뿐만 아니라, 다른 중요한 평가의 지표가 되기도 합니다.
유방 X선 사진을 평가할 때, 방사선 전문의는 유방 조직의 밀도와 분포에 따라 네 단계, 지방으로 된 유방(fatty), 유선 조직이 넓게 퍼져 있는 유방(scattered), 치밀도가 불균일 하거나 높은 치밀도를 보이는 유방 (heterogeneously dense), 극도의 고밀도를 보이는 유방(extremely dense)으로 구분합니다.
이중 3, 4 단계는 주의를 요합니다. 유방 X선 결과 이 중 하나로 판명되면 치밀도가 높고 유방 지지 조직 비율이 높다는 뜻입니다. 지방 조직과 달리 지지 조직은 유방 X선 상에서 덜 투명하게 보이기 때문에, 유방의 다른 부분을 판독하기 어려워 이상 부위를 발견하기 더욱 어렵게 만듭니다.
또한 암을 유발하는 독립적 위험 요인이기도 합니다. 치밀도가 높은 유방을 가진 여성은 그렇지 않은 여성에 비해 유방암에 걸릴 확률이 4~5배 높습니다.
40~74세 미국 여성 중 절반 가량이 치밀 유방을 갖고 있는 것으로 나타났는데요, 이는 장기적인 유방암 발병 고위험률로 인해 MRI와 같은 다른 검사를 진행해야 할 수도 있음을 의미합니다.
딥 러닝은 환자들에 가장 일관된 검사 결과를 제공해 환자들이 위험에 대해 더 잘 이해할 수 있도록 도와줍니다.
유방 밀도는 전체 유방 X선 사진에 기반해 측정된 전체적 특징입니다. MIT 대학원생이자 논문 공동 저자인 카일 스완슨(Kyle Swanson)은 유방 밀도는 신경망이 분석하기 쉬운 특징을 가지고 있다고 설명합니다.
MIT 컴퓨터 과학, 인공지능 연구소 박사 과정에 재학중인 애덤 얄라(Adam Yala) 논문 공동 저자는 “이는 단순히 ‘치밀 조직이 있는지’에 대한 것뿐만이 아니라, ‘구조가 어떻게 이뤄졌는지, 전체적인 모습은 어떠한지’를 보여준다’고 말합니다. ‘신경망이 학습하는 건 이런 전체적 패턴’ 이라는 것이 그의 설명입니다.
연구진은 딥 러닝 도구를 여러 방사선의가 판독한 수 천 개의 라벨을 부착한 디지털 유방 X선 사진으로 훈련시켰습니다.
그 결과 신경망이 내린 유방X선 판독은 개별 방사선 전문의보다 여러 방사선 전문의가 내린 종합적 판독 결과와 거의 일치했습니다. 임상 의료에서 이는 방사선 전문의들이 이 종합 결과를 염두에 두고 판독 관련 의사결정을 내리는데 도움이 됩니다.
딥 러닝을 임상 의료 현장으로
매사추세츠 종합병원 검진센터 방사선 전문의들은 올해 1월부터 임상 진료 일환으로 딥 러닝 모델을 사용하고 있습니다. 유방 X선 분석 시 이들은 딥 러닝 모델의 평가를 보고 그에 동의하는지 여부를 결정합니다.
딥 러닝 모델의 성공적인 성과를 평가하기 위해, 연구진은 1만여 스캔 이미지를 보고 신경망이 내린 평가가 방사선 전문의에 의해 수용되는 빈도를 기록했습니다.
방사선 전문의가 딥 러닝 모델의 판단을 보지 않고 자체적으로 유방 X선 이미지를 판독했을 때, 일치율은 87%였습니다. 그러나 딥 러닝 모델의 판단을 보여준 후의 판독 결과 일치율은 94%에 달했습니다.
이번 논문 결과가 보여주는 것은 딥 러닝 모델은 숙련된 방사선의 수준으로 스캔을 판독할 수 있으며, 치밀도 평가 일관성을 향상시킬 수 있다는 점입니다. 딥 러닝을 사용하지 않는 다른 자동화 방식은 방사선 전문의 소견과 이 정도까지 일치하지는 않았다는 것이 얄라 박사의 설명입니다.
지금까지 방사선 전문의가 딥 러닝을 사용해 판독한 유방 X선 이미지는 1만 8,000여건 가량입니다. 연구진은 파이토치(PyTorch) 딥 러닝 프레임워크를 사용해 개발된 컨볼루션 신경망(convolutional neural networks) 교육에 엔비디아GPU를 사용했습니다.
얄라 박사는 목표는 주관적 소견 편차를 줄이고, 환자 위험에 대한 올바른 평가가 도출될 수 있도록 하는 것이라고 말합니다. 그는 “이건 누가 운이 좋고 나쁘고의 문제가 아니다. 어떤 의사든 동일한 평가를 내릴 수 있어야 한다”고 말했습니다.
치밀도 평가는 단지 첫 단계에 불과합니다. 연구진은 암 발병 위험이 높은 환자를 대상으로 5년 앞서 감지할 수 있는 딥 러닝 도구도 개발하고 있습니다.