전 세계 데이터센터의 다양한 가속 컴퓨팅 니즈에 부응하기 위한 엔비디아 MGX 서버 사양이 발표되었습니다. 해당 사양은 시스템 제조사에 모듈식 참조 아키텍처를 제공해 인공지능, 고성능 컴퓨팅(high performance computing, 이하 HPC), 옴니버스(Omniverse) 애플리케이션에 맞는 다양한 서버 변형을 빠르고 경제적으로 구축할 수 있게 해줍니다.
애즈락랙(ASRock Rack), 에이수스(ASUS), 기가바이트(GIGABYTE), 페가트론(Pegatron), QCT, 슈퍼마이크로(Supermicro)는 MGX를 도입해 개발 비용을 최대 3/4 줄이고, 개발 시간도 2/3 줄여 6개월까지 단축할 수 있을 전망입니다.
엔비디아의 GPU 제품 담당 부사장인 카우츠브 상하니(Kaustubh Sanghani)는 “기업들은 특정 비즈니스와 애플리케이션 요구에 맞는 데이터센터를 설계할 때 더 많은 가속 컴퓨팅 옵션을 찾습니다. 고객들이 기업용 AI를 부트스트랩(bootstrap) 하는 데 있어 상당한 시간과 비용을 절약할 수 있도록 도움을 주고자 MGX를 개발했습니다”라고 밝혔습니다.
제조사는 MGX를 통해 서버 섀시의 가속 컴퓨팅에 최적화된 기본 시스템 아키텍처로 시작한 다음, GPU, DPU, CPU를 선택할 수 있는데요, 설계 변형은 HPC, 데이터 사이언스, 대규모 언어 모델(LLM), 엣지 컴퓨팅, 그래픽 및 비디오, 기업용 AI, 설계 및 시뮬레이션과 같은 고유한 워크로드를 처리할 수 있습니다. AI 훈련, 5G와 같은 여러 작업을 단일 시스템에서 처리할 수 있으며, 손쉽게 차세대 하드웨어로 업그레이드할 수 있습니다. MGX는 또한 클라우드, 엔터프라이즈 데이터센터에 쉽게 통합될 수 있습니다.
업계 선도 기업들과의 협업
QCT와 슈퍼마이크로는 8월에 공개되는 MGX 설계를 적용한 제품을 최초로 시장에 출시하는 기업입니다. 이번에 발표된 슈퍼마이크로의 ARS-221GL-NR 시스템에는 엔비디아 그레이스(Grace) CPU 슈퍼칩(Superchip)이 포함되며, QCT의 S74G-2U 시스템에는 엔비디아 GH200 그레이스 호퍼(Grace Hopper) 슈퍼칩이 포함될 예정입니다.
또한, 소프트뱅크(SoftBank Corp.)는 일본 전역에 여러 하이퍼스케일 데이터센터를 구축하고 MGX를 사용하여 생성형 AI와 5G 애플리케이션 간에 GPU 리소스를 동적으로 할당할 계획이랍니다.
소프트뱅크의 사장 겸 CEO인 미야카와 준이치(Miyakawa Junichi)는 “생성형 AI가 비즈니스 및 소비자 라이프스타일 전반에 걸쳐 확산됨에 따라, 적절한 비용으로 적합한 인프라를 구축하는 것은 네트워크 사업자의 가장 큰 과제 중 하나입니다. 엔비디아 MGX를 통해 이러한 과제를 해결하고 실시간 워크로드 요구사항에 따라 AI, 5G 등을 다용도로 사용할 수 있을 것으로 기대합니다”라고 소감을 밝혔습니다.
다양한 니즈에 맞는 다양한 설계
데이터센터는 점점 증가하는 컴퓨팅 기능 및 기후 변화에 대처하기 위한 탄소 배출량 감소 요구사항을 충족하면서 동시에 비용은 절감해야 하는 압박을 받고 있는 상황입니다.
엔비디아의 가속 컴퓨팅 서버는 오랫동안 뛰어난 컴퓨팅 성능과 에너지 효율성을 제공해 왔습니다. 시스템 제조사는 이제 MGX의 모듈식 설계를 통해 각 고객의 고유한 예산, 전력 공급, 열 설계, 기계적 요구사항을 보다 효과적으로 충족할 수 있습니다.
다양한 폼팩터로 최대의 유연성 제공
MGX는 다양한 폼팩터에서 작동하며 다음과 같은 현재 및 미래 세대의 엔비디아 하드웨어와 호환됩니다.
- 섀시: 1U, 2U, 4U(공냉식 또는 수냉식)
- GPU: 최신 H100, L40, L4를 포함한 엔비디아 GPU 전체 포트폴리오
- CPU: 엔비디아 그레이스 CPU 슈퍼칩, GH200 그레이스 호퍼 슈퍼칩, x86 CPUs
- 네트워킹: 엔비디아 블루필드(BlueField)-3 DPU, 커넥트X(ConnectX)-7 네트워크 어댑터
MGX는 엔비디아 제품과의 유연한 다세대 호환성을 제공해 시스템 빌더가 기존 설계를 재사용하고 고가의 재설계 없이 차세대 제품을 쉽게 채택할 수 있도록 하며, 이러한 호환성은 엔비디아 HGX와의 가장 큰 차이점입니다. 반면 HGX는 최고 수준의 AI 및 HPC 시스템을 만들기 위해 확장 가능하도록 맞춤화된 NVLink로 연결된 다중 GPU 베이스보드를 기반으로 합니다.
가속화를 더욱 촉진하는 소프트웨어
MGX는 하드웨어 외에도 개발자와 기업이 AI, HPC, 기타 애플리케이션을 구축하고 가속화할 수 있는 엔비디아의 전체 소프트웨어 스택에서 지원됩니다. 여기에는 엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아 AI 엔터프라이즈(Enterprise)가 포함되는데요, 엔비디아 AI 엔터프라이즈는 100개 이상의 프레임워크, 사전 훈련된 모델, 개발 도구를 통해 AI 및 데이터 사이언스를 가속, 완벽하게 지원되는 기업용 AI 개발 및 배포를 제공합니다.
MGX는 오픈 컴퓨트 프로젝트(Open Compute Project)와 미국전자산업협회(Electronic Industries Alliance) 서버 랙과 호환돼 엔터프라이즈 및 클라우드 데이터센터에 빠르게 통합될 수 있습니다.
엔비디아 MGX 서버 사양 관련 자세한 정보를 확인하고 싶다면 젠슨 황 CEO의 Computex 2023 키노트에서 확인하세요.