라이언 커피(Ryan Coffee)는 막대한 영향력이 있는 분자 영상을 만듭니다.
SLAC 국립가속기연구소(SLAC National Accelerator Laboratory)의 선임 과학자(위 사진)인 그는 시각화로 광합성의 비밀을 풀 수 있다고 말하는데요. 이미 햇빛이 어떻게 피부암을 일으킬 수 있는지 보여주기도 했습니다.
이는 장기적으로 화학자들이 생명을 구하는 약물을 개발하고 한 번 충전으로 더 멀리 갈 수 있는 전기 자동차 배터리를 설계하는 데 도움이 될 수 있습니다.
이러한 유형의 연구에 영감을 주는 영상을 만들기 위해 라이언 커피의 팀은 고성능 컴퓨터(HPC), AI, 우수한 프로젝터가 필요하죠.
더 밝은 빛
LCLS(Linac Coherent Light Source)라는 이름의 이 프로젝터는 1km 길이의 선형 가속기를 사용해 X선을 초당 최대 120회 펄스합니다.
이는 할리우드 영화에는 충분하지만 라이언 커피가 만드는 영상에는 충분하지 않죠.
원자, 분자와 광학의 교차점에 있는 물리학 전문가인 커피는 “우리는 전자 구름이 분자 주위에서 어떻게 비누 거품처럼 움직이는지, 어떻게 특정 방식으로 전자 구름을 짜낼 수 있고 에너지가 나오는지 확인해야 합니다”라고 말했습니다.
내년에 예정된 업그레이드를 통해 이 거대한 장비는 초당 100,000프레임을 처리할 수 있게 됩니다. 2년 후에는 LCLS II라는 또 다른 보강으로 성능을 초당 백만 프레임으로 끌어올릴 것입니다.
이렇게 빠르게 깜박이는 프레임을 무작위 순서로 정렬하기 위해서는 HPC와 AI가 필요합니다.
AI 모델의 영상 학습
라이언 커피의 목표는 LCLS II 앞에 AI 모델을 앉히는 것인데요. AI 모델은 매우 빠른 영상을 보며 인간의 눈으로는 따라갈 수 없는 원자의 움직임을 학습할 것입니다.
이 작업에는 미국 캘리포니아 멘로 파크에 있는 장비 옆에서 실행되는 가장 빠른 GPU에 대한 추론이 필요합니다. 한편, LCLS II의 데이터 스트리밍은 아르곤 국립 연구소(Argonne National Laboratory)의 NVIDIA A100 Tensor Core GPU 뱅크에서 모델을 지속적으로 재훈련하는 데 사용될 예정입니다.
이는 전형적인 엣지의 HPC 사례이며, 별과 원자를 관측하는 거대한 과학 장비의 시대에 점점 더 보편화되고 있는 사례입니다.
지금까지 커피의 팀은 초당 100,000번 추론하는 동안 10~20분마다 오토인코더 모델을 재훈련할 수 있었습니다.
SLAC의 전체 AI 이니셔티브의 핵심 멤버인 커피는 “우리는 이미 전자 거품이 앞뒤로 출렁이는 것을 볼 수 있는 아토초 펄스의 영역에 있습니다”라고 말했습니다.
더 광범위한 AI 협업
다음 단계는 더 거대합니다.
커피의 분자 영상 작업 데이터는 일종의 초고해상도 스틸 카메라인 아르곤의 어드밴스드 프로톤 소스(Advanced Proton Source)의 데이터와 안전하게 공유됩니다.
이를 실현하기 위해 여러 조직과 협력하고 있는 커피는 “우리는 안전한 연합 머신 러닝을 통해 이 두 데이터 세트를 함께 가져와 강력한 공유 트랜스포머 모델을 만들 수 있습니다”라고 말했습니다.
과학자들은 트랜스포머를 이용해 연구와 같이 데이터가 많이 필요한 여러 애플리케이션을 위한 합성 데이터를 생성할 수 있습니다.
이는 의료 분야의 연합 학습(federated learning)과 유사한 과학에 특화된 노력인데요. 두 분야 모두 데이터 개인정보를 보호하고 보안을 유지하면서 강력한 AI 모델을 구축해야 하죠.
그는 “우리는 사람들이 많은 언어로 훈련된 대규모 언어 모델에서 최상의 결과를 얻는다는 것을 알고 있습니다. 따라서 우리는 과학에서도 더 나은 모델을 만들기 위해 동일한 것에 대해 다양한 관점을 취하려 합니다”라고 말했습니다.
양자 미래
라이언 커피는 자신이 연구하는 원자력(atomic force)으로 미래의 컴퓨터를 구동할 수 있다고 설명합니다.
그는 “동일한 양자 상태에 있는 전자 거품 스택을 상상해보세요. 바로 슈퍼 전도체입니다. 하단에 전자 하나를 추가했을 때 저항이 없기 때문에 전자 하나가 순간적으로 상단으로 튀어나옵니다”라고 말했습니다.
양자 컴퓨팅에서 얽힘(entanglement)이라고 불리는 이 개념은 두 입자가 행성의 반대편에 있더라도 고정 단계에서 상태를 전환할 수 있음을 의미합니다.
이를 통해 라이언 커피와 같은 연구원들은 LCLS II와 같은 강력한 장비와 강력한 AI 모델을 실시간으로 훈련하는 원격 HPC 센터를 즉시 연결할 수 있게 될 것입니다.
공상과학 소설처럼 들릴 수 있지만 가능한 얘기입니다.
커피는 자신의 실험이 오늘날의 컴퓨터를 능가할 때, 즉 대체 아키텍처와 AI가 필요한 때를 예견합니다. 이러한 큰 그림이 그를 고무시키죠.
“나는 양자 역학의 반직관성을 좋아합니다. 특히 인간이 적용할 수 있는 실제적이고 측정 가능한 결과가 있는 경우에는 더 그렇습니다. 그게 바로 묘미입니다.”