NVIDIA Jetson 엣지 AI 플랫폼이 서던 메소디스트 대학교(Southern Methodist University)가 제작한 베이비 슈퍼컴퓨터에 탑재됐습니다.
“DIY”와 “슈퍼컴퓨터”는 일반적으로 함께 사용되는 단어가 아니죠. 하지만 미국 댈러스 소재 서던 메소디스트 대학교(이하 SMU)의 학생들은 16개의 NVIDIA Jetson Nano 모듈, 4개의 전원 공급 장치, 60개 이상의 수제 전선, 네트워크 스위치, 냉각 팬을 사용해 DIY(do-it-yourself) 슈퍼컴퓨터를 만들었습니다.
“베이비 슈퍼컴퓨터”라고 불리는 SUM의 프로젝트는 창고 하나를 가득 채우거나 데이터센터 혹은 클라우드에 들어갈 수 있는 일반적인 크기의 슈퍼컴퓨터를 접할 수 없는 사람들을 교육하는 것을 목표로 하죠.
미니 슈퍼컴퓨터는 책상에 올릴 수 있는 크기입니다. 따라서 학생들은 직접 만져보고 클러스터 구성 요소에 대해 배울 수 있습니다. 터치 스크린에는 모든 노드의 상태와 함께 대시보드가 표시됩니다.
SMU 내부 IT 조직 연구 및 데이터 사이언스 팀장인 에릭 고닷(Eric Godat)는 “해당 프로젝트는 컴퓨터 클러스터에 들어가는 핵심 요소를 보여주기 위해 시작됐습니다”고 말했습니다.
베이비 슈퍼컴퓨터는 11월 13일부터 18일까지 댈러스에서 열리는 슈퍼컴퓨팅 컨퍼런스인 SC22에 전시될 예정입니다.
SMU 팀은 SMU 대학의 고성능 컴퓨팅 프로그램과 AI 가속 연구를 위한 NVIDIA DGX SuperPOD의 최근 배포에 대해 연구원과 공급업체, 학생들과 소통할 수 있는 부스를 개최합니다.
더불어 SMU 정보기술 위원회는 NVIDIA 파트너 네트워크의 일원인 마크 III 시스템즈(Mark III Systems)와 협력해 콘퍼런스 참석자에게 캠퍼스 데이터센터 투어를 제공해 DGX SuperPOD가 작동하는 모습을 선보일 예정입니다. 자세한 내용은 SMU 부스 #3834에서 확인할 수 있습니다.
SMU의 수석 컴퓨터 공학 전공자이자 클러스터 발명에 기여한 코너 오젠(Connor Ozenne)의 멘토 역할을 한 고닷은 “우리는 베이비 컴퓨터를 콘퍼런스에 가져가 사람들이 ‘오, 그게 뭐야?’라고 물으며 관심을 갖게 만들고자 합니다”라고 말했죠.
오젠은 경력을 위해 AI와 머신 러닝을 웹 디자인에 통합하는 것을 목표로 합니다. 그는 “고등학교에서 외국어 요건을 대체하기 위해 컴퓨터 사이언스를 공부하기 시작했습니다. 고등학교 1학년 때 첫 프로젝트를 하면서 이것이 내가 평생 하고 싶은 일이라는 것을 깨달았습니다”라고 전했는데요.
오젠은 SMU의 STAR(Student Technology Associate in Residence, 레지던스 학생 기술 연합회원)입니다. 그는 2년 전 여름 처음으로 베이비 슈퍼컴퓨터의 디자인과 예산안을 고닷 팀에 제안했죠. 그는 2천 달러의 보조금과 엄청난 열정으로 프로젝트를 시작했습니다.
베이비 슈퍼컴퓨터의 탄생
오젠은 다른 학생과 협업해 무(無)에서 베이비 슈퍼컴퓨터를 창조했습니다.
고닷은 “학생들은 감전되지 않고 전선을 벗겨내는 방법을 배워야 했습니다. 전원 공급 장치부터 네트워킹에 이르기까지 모든 것을 스스로 조립했습니다. 우리는 단지 작은 불씨를 피워냈을 뿐”이라고 설명했습니다.
오젠은 “초기 버전은 판지를 방열판으로 사용해 NVIDIA Jetson Nano 개발자 키트를 연결하는 전선이 테이블에 뒤죽박죽 엉켜 있었습니다. 다른 소형 컴퓨팅 장치는 온보드 GPU를 가지고 있지 않기 때문에 NVIDIA Jetson 모듈을 사용하기로 결정했습니다. NVIDIA Jetson Nano를 통해 더 많은 AI와 머신 러닝 문제를 해결할 수 있었습니다”라고 덧붙였습니다.
오젠은 판지로 만든 슈퍼컴퓨터 케이스를 폼으로 업그레이드했고, 또 얼마 지나지 않아 SMU의 학생들을 위한 제작 공간인 이노베이션 짐(innovation gym)에서 레이저를 이용해 3D 벡터 파일에서 잘라낸 아크릴 판으로 슈퍼컴퓨터 케이스를 만들었습니다.
오젠은 ”모든 것이 새로운 경험이었고, 실험실에서 즐겁게 수많은 밤을 보내며 중요한 것들을 학습할 수 있었습니다”라고 소감을 전했다.
진행 중인 작업
오젠에 따르면, 프로젝트가 무에서 유사 슈퍼컴퓨터 수준으로 발전하는 데 걸린 기간은 불과 4개월이었고, 여전히 프로젝트는 진행 중입니다.
팀은 현재 NVIDIA JetPack 소프트웨어 개발 키트를 사용해 미니 클러스터의 소프트웨어 스택을 개발하고 있으며, 이것이 일부 소규모 머신 러닝 작업을 수행할 수 있도록 준비하고 있습니다. 더불어 베이비 슈퍼컴퓨터는 최근 발표된 NVIDIA Jetson Orin Nano 모듈을 통해 레벨 업 할 수 있습니다.
고닷은 “최근 캠퍼스에 NVIDIA DGX SuperPOD가 생겼습니다. 따라서 실제 컴퓨팅 환경 조성에 베이비 슈퍼컴퓨터를 사용할 필요는 없습니다. 하지만 미니 클러스터는 슈퍼컴퓨터 작동 방식을 교육하는 데 있어 매우 효과적인 도구입니다. 이를 사용하면 학생들이 전선 제거, 병렬 파일 시스템 관리, 카드 리이미징(reimaging), 클러스터 소프트웨어 배포를 실험해볼 수 있습니다”고 말했죠.
160개의 NVIDIA A100 Tensor Core GPU를 포함하는 SMU의 NVIDIA DGX SuperPOD는 분자 역학, 계산 화학, 천체 물리학, 양자 역학과 기타 많은 연구 주제에 대한 AI 모델 훈련에 슈퍼컴퓨터를 사용하는 교수진을 위한 알파 롤아웃 단계에 있습니다.
고닷은 NVIDIA DGX 팀과 협력해 DGX SuperPOD를 유연하게 구성해 수십 가지의 다양한 AI, 머신 러닝, 데이터 처리, HPC 프로젝트를 지원합니다.
SMU에서 이론 입자물리학 박사 학위를 받은 고닷은 “매일이 다르고 새로운 것이 좋습니다. 나는 예술 학교에서 AI 관련 프로젝트를 할 수 있고, 다음날 로스쿨에 있고, 그 다음 날에는 입자물리학과에 있을 수도 있습니다”라고 말했죠.
오젠도 “AI를 위한 애플리케이션은 어디에나 있습니다”라고 말하며, 동의했습니다.
고닷과 기타 전문가와 함께 AI 센터 오브 엑셀런스(AI Center of Excellence)에 대해 자세히 알아볼 수 있는 NVIDIA GTC 세션을 여기에서 확인해보세요.
SC22에서 NVIDIA와 함께 전시장에서 파트너 부스를 둘러보고, 일주일 동안 진행되는 특별 연설과 데모, 기타 세션을 포함한 가상 콘텐츠를 체험할 수 있습니다.