미 국립에너지연구소 과학컴퓨팅센터(NERSC)의 펄머터(Perlmutter) 슈퍼컴퓨터에 엔비디아 쿠퀀텀(NVIDIA cuQuantum) 소프트웨어 개발 키트 기반의 최신 페니레인(PennyLane) 오픈 소스 소프트웨어가 사용됐다고 밝혔습니다. 페니레인은 토론토에 본사를 둔 자나두(Xanadu)의 양자 프로그래밍 프레임워크로, 고성능 엔비디아 GPU 클러스터에서 시뮬레이션을 실행할 수 있습니다.
미국 에너지부 산하 브룩헤이븐 국립연구소(Brookhaven National Laboratory)의 계산 과학자 겸 머신 러닝 그룹 책임자인 유신재(Shinjae Yoo) 박사는 롱아일렌드 대서양 연안에서 10마일가량 떨어진 곳에서 연구를 진행합니다. 새로운 소프트웨어로 인해 처음으로 슈퍼컴퓨터에서의 양자 컴퓨팅 시뮬레이션 실행이 가능해졌으며, 유신재 박사 외에도 많은 연구자가 이를 활용하고 있습니다.
바다와 같은 대규모 데이터세트를 처리해야 할 경우, 성능이 중요합니다. 유신재 박사는 펄머터를 구성하는 최대 256개의 엔비디아 A100 텐서 코어 GPU(A100 Tensor Core GPUs)에서 프로그램을 실행해 약 30개의 큐비트를 시뮬레이션합니다.
큐비트는 양자 컴퓨터에 사용되는 강력한 계산기이며, 큐비트 30개는 오늘날 대부분의 연구자들이 모델링할 수 있는 큐비트 수의 약 2배에 해당됩니다.
강력한 성능과 쉬운 사용법
소위 멀티노드 버전이라고 불리는 페니레인을 엔비디아 쿠퀀텀 SDK와 함께 사용하면 복잡한 양자 시스템의 대규모 시뮬레이션 가속화 작업을 단순화할 수 있습니다.
유 박사는 “이제 인턴들까지도 가장 큰 규모의 시뮬레이션을 실행할 수 있는 기회가 열렸기 때문에 매우 기대가 된다”고 말했습니다. 그는 팀과 함께 페니레인을 사용하는 6개의 프로젝트를 진행 중에 있습니다.
유 박사의 연구는 고에너지 물리학과 머신러닝 발전을 목표로 합니다. 다른 연구자들도 양자 시뮬레이션을 사용해 화학과 재료과학을 새로운 차원으로 끌어올리고 있습니다.
양자 컴퓨팅은 기업 R&D 센터에서도 활발히 활용되고 있습니다.
예를 들어, 자나두는 롤스로이스(Rolls-Royce)와 같은 기업을 위해 지속가능한 항공을 위한 최첨단 제트 엔진을 설계하기 위한 양자 알고리즘 개발을 지원합니다. 더불어 폭스바겐 그룹(Volkswagen Group)이 전기차를 위한 더 강력한 배터리를 개발할 수 있도록 돕습니다.
펄머터에서 4개의 추가 프로젝트 진행
한편, 양자 컴퓨팅 프로그램 책임자인 캐서린 클림코(Katherine Klymko)에 따르면 NERSC에서 멀티노드 페니레인을 사용하는 다른 프로젝트가 올해 최소 4개 이상 진행 중입니다. 여기에는 나사 에임스(NASA Ames) 연구센터와 앨라배마 대학교(University of Alabama)의 연구도 포함됩니다.
클림코는 “화학 분야의 연구자들이 연구하고 싶어하는 분자 복합체는 기존의 컴퓨터로 처리하기에 너무 컸습니다. 페니레인과 같은 도구를 사용하면 현재 기존에 수행할 수 있었던 작업을 확장해 궁극적으로 대규모 양자 컴퓨터에서 알고리즘 실행이 가능하도록 준비할 수 있습니다”라고 밝혔습니다.
AI와 양자 개념의 결합
페니레인은 혁신적인 아이디어의 산물이기도 한데요. 이 소프트웨어는 역전파 등의 널리 사용되는 딥러닝 기법과 파이토치(PyTorch)와 같은 도구를 양자 컴퓨터 프로그래밍에 적용합니다.
그리고 자나두는 가능한 한 많은 유형의 양자 컴퓨터에서 실행되도록 코드를 설계했습니다. 페니레인은 2018년 논문에서 소개된 직후부터 양자 커뮤니티의 주목을 받았습니다.
논문 저자이자 페니레인의 개발자이자 양자 물리학자 겸 자나두 제품 디렉터인 조시 아이작(Josh Izaac)은 “최첨단 연구에 대한 접근성을 높인 우리의 콘텐츠에 사람들은 흥미를 느꼈다”고 전해왔습니다.
더 많은 큐비트에 대한 수요
페니레인의 성능을 책임지고 있는 자나두의 수석 양자 소프트웨어 개발자 리 J. 오리어던(Lee J. O’Riordan)은 “요즘 페니레인 포럼에서 ‘더 많은 큐비트를 원한다’는 의견을 흔히 볼 수 있다”고 말했습니다.
그는 “2022년 단일 GPU에서 쿠퀀텀으로 작업을 시작했을 때, 전반적으로 10배의 속도 향상을 달성했습니다. 연말까지 1,000개 노드, 즉 4,000개의 GPU로 확장할 계획이며, 이는 40큐비트 이상의 시뮬레이션이 가능해짐을 의미합니다”고 말했습니다.
과학자들은 해당 성능으로 어떤 문제를 해결할 수 있을지 구체화해 나가고 있습니다.
양자 컴퓨터를 설계하는 기업들은 더 나은 시스템을 구축하기 위한 아이디어를 테스트하는 데 이 성능을 활용할 예정입니다. 이러한 작업은 페니레인의 새로운 소프트웨어 기능으로 이어져 시스템 성능을 향상시키는 선순환 구조를 형성합니다.
GPU를 통한 원활한 확장
오리어던은 일찍이 GPU가 페니레인의 성능 확장에 가장 적합한 수단이라는 것을 알아차렸습니다. 작년, 그는 양자 프로그램을 100개 이상의 GPU로 분할해 60개 이상의 큐비트를 30개 큐비트 하위 회로로 분할해 시뮬레이션하는 방법에 대한 논문을 공동 집필했습니다.
그는 “저희는 작업을 더 큰 워크로드로 확장하고 싶었기 때문에 엔비디아가 쿠퀀텀에 멀티노드 기능을 추가한다는 소식을 듣고 가능한 한 빨리 이를 지원하고 싶었습니다”고 말했습니다.
이로써 4개월 만에 멀티노드 페니레인이 탄생했습니다.
오리어던은 “대규모의 분산형 GPU 프로젝트로서는 정말 빠른 시간이었습니다. 쿠퀀텀에서 일하는 모든 사람이 통합이 최대한 수월할 수 있도록 도왔습니다”고 말했습니다.
자나두 블로그에서는 개발자가 페니레인과 쿠퀀텀을 사용해 30큐비트 이상의 대규모 시스템을 시뮬레이션하는 방법을 자세히 설명합니다.
오리어던은 “팀은 여전히 데이터를 수집하고 있지만, 지금까지 샘플 기반 워크로드에서 거의 선형적인 확장을 확인했습니다”고 말했습니다.
이는 엔비디아 젠슨 황 CEO의 “더 많이 구매할수록 더 많이 절약할 수 있습니다” 라는 말에서도 볼 수 있습니다.