GPU 가속화 AI와 데이터 사이언스 프로젝트를 보다 빠르게 실행하고 싶은 기업들을 위한 반가운 소식입니다.
지난 5월 9일 열린 레드햇 서밋(Red Hat Summit)에서, 엔비디아와 레드햇은 엔비디아 GPU 가속 컴퓨팅 플랫폼과 최근 발표된 레드햇 오픈시프트 4(Red Hat OpenShift 4)를 조합시켜 AI와 데이터 사이언스를 위한 온프레미스 쿠버네티스(Kubernetes: 클러스터 관리 소프트웨어)의 배열 속도를 크게 향상시켰습니다.
그 결과 IT 관리자들이 하루 종일 시간을 들여야만 했던 쿠버네티스 관리 작업을 이제 1시간 이내에 완료할 수 있게 되었죠.
더욱 향상된 GPU 가속화로 번거로움을 덜다
이 협력은 기업들이 방대한 양의 데이터를 실행 가능한 인텔리전스로 전환하기 위해 AI와 데이터 사이언스에 의존하고 있는 시점에서 이뤄집니다.
중요한 AI와 데이터 분석 작업을 위해서는 GPU 컴퓨팅을 통해 기업의 IT 소프트웨어 전체 스택을 가속해야 하는데요. 이는 엔비디아 드라이버부터 컨테이너 런타임, 애플리케이션 프레임워크에 이르기까지 모든 소프트웨어 계층을 최적화 시켜야만 가능하죠.
엔비디아의 CUDA 병렬 컴퓨팅 아키텍처와 CUDA-X 가속 라이브러리는 AI부터 고성능 컴퓨팅과 가상 데스크톱 인프라(Virtual Desktop Infrastructure, VDI)에 이르기까지 광범위한 도메인에 걸쳐 애플리케이션을 가속화하여 120만 명이 넘는 개발자 커뮤니티에서 채택됐습니다.
엔비디아의 일반적 아키텍처는 노트북에서부터 데이터센터, 클라우드에 이르기까지 상상할 수 있는 모든 컴퓨팅 기기에서 실행되기 때문에, GPU 가속 애플리케이션에 대한 투자는 현명한 선택이라고 볼 수 있죠.
그러나 AI와 데이터 사이언스 작업량을 가속화하는 것은 겨우 첫 번째 단계에 불과합니다. IT 조직들에게 최적화된 소프트웨어 스택을 대규모 GPU 가속화 데이터센터에 올바르게 구축하는 것은 매우 힘들고 시간이 많이 드는 작업입니다. 바로 이 부분에서 레드햇과의 공동 작업이 필요하죠.
레드햇 오픈시프트는 업계 내에서 선도적인 기업용 쿠버네티스 플랫폼입니다. 오픈시프트 4(OpenShift 4)의 발전으로 클러스터에 쿠버네티스를 배치하는 것이 그 어느 때보다 쉬워졌죠. 특히 레드햇이 쿠버네티스 오퍼레이터(Kubernetes Operators)에 투자함으로써 규칙적인 데이터센터 관리는 물론, 애플리케이션의 생활주기 관리 작업까지 자동화되어 관리의 복잡성이 크게 줄어들었습니다.
엔비디아는 IT 관리자가 이전에 셸 스크립트로 작업했던 많은 일들을 GPU 오퍼레이터로 자동화하기 위한 노력을 기울여왔습니다. 가령 장치 드라이버를 설치하고, 데이터센터에 있는 모든 노드에 적절한 GPU 컨테이너 런타임이 있는지 확인하고, GPU 모니터링을 하는 것 등이죠.
레드햇과의 공동 작업으로 클러스터가 시작되면 단순히 GPU 오퍼레이터를 실행하여 클러스터의 작업자 노드에 필요한 종속성을 추가하기만 하면 되죠. 정말 쉽답니다. 이는 마치 새로운 클라우드 자료를 스핀업 하듯이 조직이 오픈시프트 4를 사용해 GPU 기반 데이터센터 클러스터를 쉽게 작동시키고 운영할 수 있도록 합니다.
GPU 클러스터 시연과 초기 액세스 프로그램
이번 레드햇 서밋 부스에서는 오픈시프트와 GPU 오퍼레이터를 통해 베어메탈 GPU 클러스터를 손쉽게 시작하는 것을 소개한 바 있습니다. 레드햇의 최고기술책임자인 크리스 라이트(Chris Wright)의 기조연설과 엔비디아의 컴퓨팅 소프트웨어 부사장 크리스 램(Chris Lamb)이 함께 하여 두 기업의 공동 작업 시연과 차후 협력에 대한 자세한 논의가 다뤄졌습니다.
레드햇과 엔비디아는 고객 맞춤형 초기 액세스 프로그램에 두 회사의 공동 고객들을 초대하고 있습니다. 더 많은 정보가 궁금하거나 이 프로그램에 참여를 원하시면 https://www.openshift.com/accelerated-ai에서 등록하세요.