고성능 컴퓨팅(HPC)의 고민을 해결하는 NVIDIA 플랫폼

NVIDIA Holoscan과 BlueField DPU, MetroX-3은 안전한 액세스와 데이터 마이그레이션뿐만 아니라 엣지에서 실시간 스트리밍 처리를 지원합니다
by NVIDIA Korea

과학계 자체라고도 할 수 있는 연구자들은 전세계에 걸쳐 협력하고 있습니다.

서로 멀리 떨어진 곳에서 업무를 공유하는 대학과 기업이 현미경이나 센서에서 컴퓨터 서버나 캠퍼스 네트워크로 전송되는 데이터를 보고 이해하기 위해서는 이를 해석할 수 있는 공통의 언어와 안전한 수단을 필요로 하죠. 저장이나 전송 또는 분석을 해야 하는 데이터의 양이 점차 증가함에 따라 이런 문제는 갈수록 까다로워지고 있는데요.

NVIDIA는 이런 문제를 해결하기 위해 엣지 컴퓨팅과 인공지능(AI)을 결합해 과학적 엣지 기기에서 스트리밍 데이터를 캡처하고 통합한 뒤에 기기가 장거리에서 서로 통신할 수 있도록 만드는 고성능 컴퓨팅(HPC) 플랫폼을 도입했습니다.

이 플랫폼은 크게 세 가지 구성요소로 이루어졌습니다. NVIDIA Holoscan은 데이터 사이언티스트들과 도메인 전문가들이 데이터 스트리밍 센서를 위해 GPU 가속 파이프라인을 구축하는 데 쓸 수 있는 소프트웨어 개발 키트(SDK)입니다. MetroX-3는 NVIDIA Quantum-2 InfiniBand 플랫폼의 연결을 확장하는 새로운 장거리 시스템이죠. 또한 NVIDIA BlueField-3 DPU는 데이터 마이그레이션을 안전하고 지능적으로 제공합니다.

HPC 엣지 컴퓨팅을 위한 새로운 NVIDIA 플랫폼을 사용하면 서로 안전하게 통신하면서 문제를 협력하여 해결하고 서로 다른 기기와 알고리즘을 하나의 대형 슈퍼컴퓨터로 작동시킬 수 있죠.

HPC 엣지용 Holoscan

NVIDIA IGX, HGX, DGX 시스템을 비롯한 GPU 컴퓨팅 플랫폼을 통해 가속화된 NVIDIA Holoscan은 전세계에 걸쳐 과학 기기에서 만들어지는 방대한 데이터 스트림을 처리하는 데 필요한 최고의 성능을 제공합니다.

HPC용 NVIDIA Holoscan에는 센서 데이터 처리를 원시데이터가 실시간 인사이트로 변환할 수 있게 확장 가능하면서도, 이미지가 아닌 포맷에 맞출 수 있게 충분히 유연하게 작업할 수 있도록 돕는 C++ 와 Python용 새로운 API가 포함됩니다.

또한 Holoscan는 제로카피(zero-copy) 데이터가 교환 가능하도록 메모리를 분할 관리하므로, 개발자들은 파일과 메모리 입출력 관리를 걱정할 필요 없이 작업에 집중할 수 있죠.

다음 달이 되면 모든 HPC 개발자들이 Holoscan의 새로운 기능들을 이용할 수 있게 됩니다! Holoscan 0.4 SDK 조기 액세스에 대한 알림을 받으려면, 여기를 클릭해 등록해보세요.

원거리도 해결하는 Metro X-3

다음 달 출시되는 NVIDIA MetroX-3 원격 시스템은 NVIDIA Quantum-2 InfiniBand 플랫폼의 최신 클라우드 네이티브 기능을 엣지에서 HPC 데이터센터 코어로 확장합니다. 이를 통해 GPU 간에 서로 최대 40km 떨어진 거리에 있어도 InfiniBand 네트워크를 통해 데이터를 안전하게 공유할 수 있죠.

원격으로 메모리에 직접 액세스할 수 있는 이점을 활용하면 데이터나 컴퓨팅 작업을 InfiniBand에 연결된 단일의 미니 클러스터에서 메인 데이터센터로 쉽게 마이그레이션하거나 위치가 서로 분산된 컴퓨팅 클러스터를 결합해 전반적인 성능과 확장성을 높일 수 있습니다.

데이터센터 운영자는 NVIDIA Unified Fabric Manager를 통해 MetroX-3 시스템을 관리함으로써 InfiniBand에 연결된 모든 데이터센터 네트워크에서 프로비저닝이나 모니터링, 운영을 효율적으로 할 수 있습니다.

HPC를 안전하고 효율적으로 만드는 BlueField

NVIDIA BlueField 데이터처리 장치는 고급 네트워킹, 저장, 보안 서비스를 오프로드하거나 가속화, 혹은 따로 분리하여 최신 HPC의 성능과 효율성을 향상시킵니다.

슈퍼컴퓨팅 컨퍼런스 2022(SC22)에서 시스템 소프트웨어 기업인 제타르(Zettar)가 BlueField-3를 기반으로 하는 데이터 마이그레이션과 스토리지 오프로드 솔루션을 선보였는데요. 데이터 마이그레이션 작업을 4U 랙 공간의 데이터센터로 통합할 수 있는 제타르 소프트웨어를 이용하려면 현재 x86 기반 솔루션을 갖춘 13U가 필요합니다.

자세한 내용은 엣지 HPC 컴퓨팅용 NVIDIA 신규 플랫폼에서 확인해보세요!