우리 시대의 가장 강력한 기술인 인공지능(AI)은 새로운 세대의 컴퓨터를 필요로 합니다.
기업이 AI와 데이터 애널리틱스로 향하는 여정을 위해 NVIDIA 파트너사는 새로운 종류의 가속화 서버를 제공해 데이터 센터를 강력하게 지원합니다. 이를 위해 세계 최고의 시스템 제조업체들이 앞다퉈 최신 워크로드를 위한 업계 유일의 서버 테스트인 NVIDIA 인증 시스템(NVIDIA-Certified Systems)을 통과하고 있는데요.
NVIDIA 인증 시스템은 NVIDIA Mellanox 네트워크에서 구동되는 최신 엔비디아 GPU를 통해 AI를 가속화합니다. 도입된 엔비디아 인증 시스템은 레거시 시스템이 놓치고 있는 수많은 데이터로부터 통찰력을 도출하도록 지원합니다.
최근 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(HPE), 인스퍼(Inspur), 슈퍼마이크로(Supermicro)가 NVIDIA A100 텐서 코어GPU를 탑재한 제품을 발표했습니다.
- 델 EMC 파워엣지(PowerEdge) R7525 및 R740 랙 서버
- 기가바이트 R281-G30, R282-Z96, G242-Z11, G482-Z54, G492-Z51 시스템
- HPE 아폴로(Apollo) 6500 Gen10, HPE 프로라이언트(ProLiant) DL380 Gen10 서버
- 인스퍼 NF5488A5
- 슈퍼마이크로 A+ 서버 AS -4124GS-TNR, AS -2124GQ-NART
해당 서버들은 모범 설계 사례를 준수하는 NVIDIA 인증 시스템을 통과한 제품으로 머신러닝, 데이터 애널리틱스 등과 관련된 까다로운 과제를 해결할 수 있음을 의미합니다.
엔터프라이즈 AI의 전환점
NVIDIA 인증 시스템은 기업들 사이에서 증가하고 있는 AI에 대한 요구를 충족시키기 위해 설계됐습니다. 아메리칸 익스프레스(American Express)는 실시간 사기 감지를 위해 최신 AI 모델을 사용하고 있으며 포드(Ford)는 자율주행차를 테스트하는데 필요한 데이터를 생성하기 위해 생성적 적대 신경망(GAN)을 활용하고 있습니다. 또 도미노피자(Dominos)는 매년 제공하는 30억 개의 피자의 주문시기를 예측하기위해 AI를 적용하고 있는데요.
AI는 신생 테크 기업들에 의해 사용되기 시작해 현재는 소매업, 물류, 은행, 헬스케어 분야 등으로 적용범위가 확대되고 있습니다. 시장조사기관 가트너(Gartner)는 오늘날 기업의 37%가 생산 과정에 AI를 도입했으며, 2024년까지 이러한 기업들이 75%까지 증가할 것으로 전망했습니다.
기하급수적으로 증가하는 데이터
기업들은 급증하는 데이터에서 전략적 통찰력을 확보하기 위해 노력하고 있습니다. 갈수록 늘어나는 데이터에서 유의미한 통찰을 확보하기 위해 AI 모델이 5년 만에 3만 배 확대 사용되면서 데이터 센터와 네트워크 엣지(edge) 환경 전반에서 네트워크 트래픽이 기하급수적으로 증가하고 있는데요. GPU의 유연성과 가속화된 컴퓨팅에 대한 필요성이 커지면서 인프라를 효율적으로 확장하는 동시에 안정적인 인프라 환경이 더욱 필요하게 되는 겁니다.
대규모 AI 워크로드 처리
AI를 뒷받침하는 높은 컴퓨팅 성능, 프로그래밍 가능 여부(programmability), 그리고 안전한 워크로드 처리를 제공하는 NVIDIA 인증 시스템은 NVIDIA Ampere 아키텍처 기반 GPU 성능과 NVIDIA Mellanox의 안전한 고속 네트워크 기능을 결합합니다.
NVIDIA 인증 시스템 과정에는 여러 컴퓨팅 노드가 필요한 작업부터 단일 GPU 성능을 요구하는 작업 등 다양한 환경에서 워크로드를 테스트합니다. 또 NVIDIA 인증 시스템을 통과하면 NGC 카탈로그에서 지원하는 AI 애플리케이션을 최적화해 실행할 수 있습니다.
NVIDIA NGC는 헬스케어(Clara), 로보틱스(Isaac)와 같은 분야에 AI를 가속화하는 소프트웨어 개발 키트를 제공하는데요. 뿐만 아니라 추천 시스템(Merlin), 지능형 동영상 분석(Metropolis)과 같은 새로운 사용사례를 위한 프레임워크도 보유하고 있습니다. NVIDIA 인증 시스템은 다음과 같이 까다로운 테스트를 포함하고 있습니다.
- 딥러닝 훈련 및 추론
- 머신 러닝 알고리즘
- 지능형 동영상 분석
- 네트워크 및 스토리지 오프로드
테스트는 실제 사용사례에 초점을 두는데요. 이를 위한 AI 프레임워크와 컨테이너는 모두 NGC 카탈로그에서 사용할 수 있습니다. 결과적으로 NVIDIA 인증 시스템을 통해 기업들은 세계에서 가장 강력한 AI 하드웨어 및 소프트웨어를 확인할 수 있게 된 건데요. 세계 최대 클라우드 서비스 제공업체와 세계 10대 슈퍼컴퓨터 중 8대는 이미 NVIDIA 기술을 채택했습니다. 또한 NVIDIA 기반 시스템은 MLPerf와 같은 AI 벤치마크를 주도하고 있죠.
NVIDIA 인증 시스템에는 최대 8개의 A100 GPU와 고속 InfiniBand 또는 이더넷 네트워크 어댑터를 탑재한 강력한 데이터 센터 서버는 물론 네트워크 엣지에서 AI를 실행하도록 특별 설계된 주요 AI 시스템이 포함돼 있습니다.
서버 업체들은 ConnectX-6 InfiniBand 혹은 이더넷 어댑터와 BlueField-2 DPU와 같은 엔비디아 멜라녹스 케이블, 스위치, 네트워크 카드를 활용해 시스템을 인증할 수 있습니다. 해당 어댑터는 낮은 지연시간과 높은 처리 성능 외에도, 하드웨어의 자체 보안 기능부터 애플리케이션 연결에 이르는 여러 계층의 보안을 지원합니다.
서버 제품은 NVIDIA Mellanox 8700 HDR 200G InfiniBand 스위치 혹은 NVIDIA Mellanox SN3700 이더넷 스위치를 사용해 인증됐으며, 오픈소스 코드 지원을 포함해 전체 소프트웨어 스택에서 엔터프라이즈 지원을 받을 수 있습니다.
전 세계적으로 시스템 제조업체사 11곳이 약 70개 시스템에 NVIDIA 인증 프로그램을 신청했으며, 현재까지 업체 6곳의 14개 서버가 NVIDIA 인증을 받았습니다.