마이크로소프트 서비스에서 만나는 NVIDIA 생성형 AI와 Omniverse 기술

NVIDIA는 마이크로소프트(Microsoft)와 협력을 강화합니다. 마이크로소프트 애저(Azure), 애저 AI 서비스, 마이크로소프트 패브릭(Fabric), 마이크로소프트 365 전반에 걸쳐 최신 NVIDIA 생성형 AI와 Omniverse 기술을 활용하는 강력하고 새로운 통합인데요.

마이크로소프트의 회장 겸 CEO인 사티아 나델라(Satya Nadella)는 “마이크로소프트는 NVIDIA와 함께 AI의 가능성을 실현해 모든 사람과 조직에 생산성 향상과 새로운 혜택을 제공할 수 있도록 지원하고 있습니다. 이번 발표 내용에는 마이크로소프트 애저에 GB200 Grace Blackwell 프로세서를 도입하는 것부터 DGX Cloud와 마이크로소프트 패브릭 간의 새로운 통합까지 포함됩니다. 이로써 고객들은 실리콘에서 소프트웨어까지 코파일럿(Copilot) 스택의 모든 계층에서 가장 포괄적인 플랫폼과 툴을 통해 자체적으로 혁신적인 AI 기능을 구축할 수 있습니다”고 말했습니다.

NVIDIA의 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “AI는 우리의 일상을 변화시키고 새로운 기회의 세계를 보여주고 있습니다. 마이크로소프트와의 협력으로 NVIDIA는 고객에게 AI의 가능성을 열어주는 미래를 구축해 전 세계에 혁신적인 솔루션을 제공할 수 있도록 돕고 있습니다”고 말했습니다.

AI 인프라의 발전

마이크로소프트는 자연어 처리, 컴퓨터 비전, 음성 인식 등을 위해 최첨단 조 단위 매개변수 기반 모델을 제공하는 최초의 기업 중 하나입니다. NVIDIA Grace Blackwell GB200과 고급 NVIDIA Quantum-X800 InfiniBand 네트워킹의 성능을 애저에 도입할 예정이죠.

또한 마이크로소프트는 NVIDIA H100 NVL 플랫폼에 기반한 애저 NC H100 v5 VM(virtual machine)의 정식 출시를 발표했습니다. NC 시리즈 VM은 미드레인지 훈련과 추론을 위해 설계됐는데요. 이는 고객들에게 1개에서 2개의 NVIDIA H100 94GB PCIe Tensor Core GPU로 구성된 두 등급의 VM을 제공하며, NVIDIA Multi-Instance GPU (MIG) 기술을 지원합니다. MIG 기술은 각 GPU를 최대 7개 인스턴스로 분할할 수 있어 다양한 AI 워크로드를 위한 유연성과 확장성을 제공합니다.

의료와 생명 과학의 발전

마이크로소프트는 클라우드, AI, 슈퍼컴퓨팅 기술의 통합을 통해 의료와 생명 과학 분야를 혁신하기 위해 NVIDIA와의 협력을 확대하고 있습니다. 의료 서비스 제공업체, 제약과 생명 공학 회사, 의료기기 개발사는 마이크로소프트 애저의 강력한 성능을 NVIDIA DGX Cloud와 NVIDIA Clara 마이크로서비스 제품군과 함께 활용함으로써 임상 연구와 의료 서비스 제공 전반의 효율성 개선을 개선해 빠른 혁신을 기대할 수 있습니다.

사노피(Sanofi), MIT와 하버드 대학교가 공동 설립한 브로드 연구소(Broad Institute of MIT and Harvard), 플라이휠(Flywheel), 소피아 제네틱스(SOPHiA GENETICS) 등의 업계 리더, 위스콘신대학교(University of Wisconsin) 의과대학 및 공중보건대학과 같은 학술 의료 센터, 매스 제너럴 브리검(Mass General Brigham) 같은 의료 시스템은 이미 클라우드 컴퓨팅과 AI를 활용해 의료 분야의 변혁을 주도하고 환자에게 제공되는 치료의 질을 개선하고 있습니다.

산업적 디지털화

NVIDIA Omniverse Cloud API는 올해 말 마이크로소프트 애저에서 먼저 제공되며, 개발자들이 기존 소프트웨어 애플리케이션에서 향상된 데이터 상호운용성, 협업, 물리 기반 시각화를 이용할 수 있도록 지원할 예정입니다. 이번 NVIDIA GTC에서 마이크로소프트는 애저에서 Omniverse Cloud API를 사용해 가능한 성과의 프리뷰를 제공합니다. 공장 운영자는 마이크로소프트 파워 BI(Power BI)의 대화형 3D 뷰어를 통해 시설의 3D 디지털 트윈에 올라가는 실시간 공장 데이터를 확인, 생산 속도를 높이는 새로운 인사이트를 얻을 수 있죠.

NVIDIA Inference Server와 마이크로소프트 코파일럿

NVIDIA GPU와 NVIDIA Triton Inference Server는 마이크로소프트 365용 마이크로소프트 코파일럿에서 AI 추론 예측을 지원합니다. 마이크로소프트 365용 코파일럿은 거대 언어 모델(LLM)의 성능과 기업 고유의 자체 데이터를 결합해, 상황에 맞는 실시간 인텔리전스(intelligence)를 제공함으로써 사용자의 창의성, 생산성, 역량 향상에 기여하죠. 곧 윈도우 11 PC에서 전용 물리적 키보드 키로도 이용할 수 있습니다.

AI 훈련부터 배포까지

NVIDIA NIM 추론 마이크로서비스는 애저 AI에 도입돼 AI 배포 가속화에 박차를 가합니다. NVIDIA NIM은 NVIDIA AI Enterprise 소프트웨어 플랫폼의 일부로, 경험 가능한 NVIDIA 구축 모델을 포함해 24개 이상의 인기 파운데이션 모델에 최적화된 추론을 위한 클라우드 네이티브 마이크로서비스를 사용자에게 제공합니다. 이 마이크로서비스는 배포를 위해 Triton Inference Server, TensorRT, TensorRT-LLM 등 NVIDIA AI Enterprise 추론 소프트웨어로 구동되고 어디서나 실행 가능하며, 사전 구축된 컨테이너를 제공합니다. 이를 통해 개발자는 성능에 최적화된 프로덕션 AI 애플리케이션의 출시 기간을 단축할 수 있습니다. NVIDIA AI Enterprise는 애저 마켓플레이스(Marketplace)에서도 이용할 수 있습니다.