스웨덴의 슈퍼컴퓨터 기반으로 꽃피우는 혁신적인 연구!

린셰핑대학교의 NVIDIA DGX SuperPOD 기반 시스템 ‘베르셀리우스’가 AI 연구에 박차를 가합니다
by NVIDIA Korea

200년 전 화학계의 개척에 기여했던 스웨덴 출신 의사가 이제 또 다른 혁신을 이끌 기회를 얻었습니다.

옌스 야코브 베르셀리우스(Jöns Jacob Berzelius)를 기리는 의미에서 그의 이름을 딴 슈퍼컴퓨터가 AI를 다음 세기의 핵심 테크놀로지로 만들겠다는 목표를 세운 것인데요.

베르셀리우스는 H20와 같은 현대식 원소 기호를 만들고 실리콘을 비롯한 일부 원소를 발견한 인물입니다. 그의 생가에서 70킬로미터도 채 떨어지지 않은 린셰핑대학교(Linköping University, LiU) 캠퍼스에 설치된 300페타플롭스급 슈퍼컴퓨터는 베르셀리우스가 그랬듯 미래의 혁신을 주도할 준비를 하고 있습니다.

린셰핑대학교 내셔널 슈퍼컴퓨터 센터(NSC)의 니클라스 안데손(Niclas Andersson) 기술감독은 “스웨덴에는 베르셀리우스의 이름을 딴 광장과 거리가 많습니다. 하지만 일반인들은 그에 대해 잘 모를 가능성이 높죠”라고 말합니다. NSC는 이 NVIDIA DGX SuperPOD 기반 슈퍼컴퓨터의 거점입니다.

베르셀리우스(BerzeLiUs) 시스템은 현재 스웨덴 최고로 꼽히는 컴퓨터보다 2배 빠른 성능을 자랑하며 세계 500대 슈퍼컴퓨터의 최신 순위에서 상위 10% 안에 랭크될 전망입니다.

AI 혁신을 위한 진취적 목표

베르셀리우스 슈퍼컴퓨터를 활용해 진행할 진취적 연구들이 큰 반향을 불러일으킬 것으로 기대되고 있습니다. 먼저 무선 통신, 사이버 보안, 대규모 IoT, 효율적 프로그래밍 부문에서의 도약을 목표로 하는 2년짜리 프로젝트가 최대 7개까지 시작될 예정입니다.

월등한 성능: 베르셀리우스 시스템. 사진 제공: 토르 발크드(Thor Balkhed), 린셰핑대학교

또한 스웨덴과 싱가포르 난양기술대학교(Singapore’s Nanyang Technical University, NTU)의 연구자들이 베르셀리우스 시스템을 기반으로 6개의 새로운 주제에 대한 협업에 돌입합니다. 여기에는 시각화를 통한 데이터 애널리틱스의 증진 방안 모색, 보다 안전한 AI 알고리즘 개발, 다중의 AI 모델들을 연결해 NTU 캠퍼스 내 버스 네트워크의 스케줄을 조율하는 방법의 마련 등이 포함됩니다.

이 프로젝트들은 AI 혁신을 추구하는 스웨덴 최대 민간 연구 이니셔티브의 일환입니다. 15년간 진행되어 온 ‘발렌베리 인공지능, 오토노머스 시스템 및 소프트웨어 프로그램(WASP)’은 36명 이상의 다국적 연구자로 구성된 전문가 집단을 보유하고 있으며 참여 기업도 40여곳에 달합니다.

더 나은 세상을 위한 과학 지원

AI 혁신을 위한 이 같은 노력을 진두지휘하고 있는 단체는 스웨덴 최대 규모의 민간 리서치 자본인 크누트 앤드 앨리스 발렌베리 재단(Knut and Alice Wallenberg Foundation)입니다. 발렌베리 재단은 WASP 추진에 투입된 55억 크로나(6억5,000만 달러)의 대부분을 책임졌습니다. 이와 별개로 작년 10월에는 린셰핑대학교에 3억 크로나(3,360만 달러)를 기부해 WASP와 기타 연구자들을 위한 베르셀리우스 슈퍼컴퓨터의 구축과 운영을 지원하기도 했죠.

지난 12월, WASP는 에릭슨(Ericsson), 이케아(IKEA), 볼보(Volvo) 등의 기업과 스웨덴 최대 규모 은행인 SEB 그룹의 연사를 초빙해 가상 행사를 주최한 바 있습니다. 이 자리에서 발렌베리 재단의 부회장이자 스웨덴에서 가장 유명한 기업인 가문의 후손이기도 한 마쿠스 발렌베리(Marcus Wallenberg)는 사회에 긍정적 영향을 가져올 연구를 위해 학계와 산업계의 협력이 필수적이라고 강조했습니다. 발렌베리 부회장은 베르셀리우스 시스템의 설치 완료를 기념해 젠슨 황(Jensen Huang) NVIDIA CEO와 대담을 나누기도 했죠.

화학계가 이룩한 초창기의 진보들이 그랬듯 AI 또한 의심의 여지없이 우리 일상의 일부로 자리잡고 있습니다.

NSC에서 25년간 HPC(고성능 컴퓨팅) 연구에 전념해 온 안데손 기술감독은 “AI는 삶의 모든 부분에 자리할 것입니다. 지금으로서는 상상조차 할 수 없는 여러 영역들에 AI가 도입될 것”이라고 전망합니다.

새로운 공식: HPC+AI

그는 “HPC는 전통적으로 시뮬레이션에 초점을 맞춥니다. AI가 출현한 지금, 시뮬레이션은 컴퓨팅의 활용 범위를 크게 넓혀줄 새로운 종류의 데이터 애널리틱스에서 하나의 인풋(input)으로 기능하고 있죠. 이는 거대한 변화입니다”라고 평가합니다.

특히 베르셀리우스 시스템은 대규모 데이터세트와 모델의 처리가 가능하도록 연구의 확장성을 넓혀 AI를 통한 혁신들에 동력을 제공할 것입니다.

옌스 야코브 베르셀리우스

안데손 기술감독은 이렇게 말합니다. “지금까지의 작업 대부분이 DGX만큼은 강력하지 못한 단일 머신에서 진행되어 왔습니다. 따라서 향후 몇 년 동안은 확장성을 가진 알고리즘들의 개발을 지원하는 것이 가장 중요합니다. 또한 GPU 노드 다수의 사용을 요할 대규모 문제들도 산재해 있죠.”

베르셀리우스 시스템의 구성

베르셀리우스 시스템은 200Gbit/s의 NVIDIA Mellanox InfiniBand HDR 네트워크에서 상호연결되는 NVIDIA DGX A100 시스템 60개로 구성됩니다. 동일한 네트워크가 데이터다이렉트 네트워크(DataDirect Network) 스토리지 서버 4개의 1.5페타바이트급 플래시 메모리와 프로세서들을 연결합니다.

단일 InfiniBand 네트워크는 베르셀리우스 시스템에 데이터가 신속히 전달되도록 지원하는데요, 결국 AI의 생명은 이 데이터라고 할 수 있죠. 안데손 기술감독은 “60개의 DGX A100 시스템이 대량의 데이터를 신속히 흡수할 수 있기 때문에 우리의 첫 번째 업그레이드의 내용은 더 많은 스토리지를 구입하는 일이 될 것”이라고 말합니다.

이를 앞당기기 위해 NSC는 베르셀리우스의 구축과 통합을 담당하는 아토스(Atos)와 NVIDIA 측에 시스템 소프트웨어의 구성을 요청했습니다. 이 스택에는 아토스의 코덱스 AI 스위트(Codex AI Suite), NVIDIA의 AI 와 HPC용 GPU 최적화 소프트웨어 허브인 NGC에 대한 액세스가 포함될 예정입니다.

결국 컴퓨팅의 모든 ‘비트와 바이트’는 베르셀리우스처럼 사회의 발전을 견인하는 진보를 만들어낼 이들의 손에 달려 있습니다.

안데손 기술감독은 이렇게 말합니다. “우리에게는 AI 세계의 새로운 탐험가들이 더 많이 필요합니다. 종래에는 AI가 연구의 모든 체계에 스며들어 변화를 주도하게 될 테니까요.”