엔비디아 젠슨 황 CEO는 대만 타이베이에서 열린 COMPUTEX 2023 키노트에서 기업이 광고에서 제조, 통신에 이르기까지 다양한 산업들을 변화시키는 역사적인 생성형 AI 열풍에 편승할 수 있는 플랫폼을 발표했습니다!
코로나19 이후 오랜 만에 라이브 무대에 선 젠슨 황 CEO는 “저희가 돌아왔습니다”라고 외치며, 새로운 비즈니스 모델을 가능하게 하고 현재 비즈니스 모델의 효율성을 높이는 가속 컴퓨팅 서비스, 소프트웨어, 시스템에 대해 약 3,500명의 청중 앞에서 2시간가량 설명했습니다.
젠슨 황은 키노트에서 “가속 컴퓨팅과 AI는 가속 컴퓨팅의 재창조(reinvention)를 의미합니다”고 강조했다. 특히 자신이 연설하던 무대의 거대한 8K 벽면에 키노트의 주제곡을 생성하는 텍스트 프롬프트를 띄워 그 위력을 보여주었습니다.
젠슨 황 CEO는 “우리 모두는 이제 전 세계 거의 모든 컴퓨팅 및 클라우드 기업이 채택한 가속 컴퓨팅과 AI를 통해 새로운 컴퓨팅 시대의 전환점에 서 있습니다”라며, 4만 개 대기업과 1만 5천 개 스타트업이 엔비디아 기술을 사용하고 있으며 작년에만 2,500만 건의 CUDA 소프트웨어 다운로드가 이루어졌다고 밝혔습니다.
키노트 주요 발표
- 그레이스 호퍼(Grace Hopper), 생성형 AI를 위한 대용량 메모리 슈퍼컴퓨터 지원
- 모듈식 레퍼런스 아키텍처를 통해 100개 이상의 가속화된 서버 구성 가능
- WPP, 엔비디아 옴니버스(Omniverse)에서 디지털 광고 콘텐츠 엔진 구축
- 소프트뱅크, 엔비디아와 일본에 5G 및 생성형 AI 데이터 센터 구축
- 이더넷 기반 AI 클라우드를 가속화하는 네트워킹 기술
- 생성형 AI로 캐릭터에 생명을 불어넣는 엔비디아 게임용 에이스(ACE for Games)
- 전 세계 전자제품 제조업체가 NVIDIA AI 도입 중
엔터프라이즈 AI를 위한 새로운 엔진
젠슨 황 CEO는 또한 궁극의 AI 성능을 필요로 하는 기업을 위해 대용량 메모리 AI 슈퍼컴퓨터인 DGX GH200을 공개했습니다. 이 슈퍼컴퓨터는 엔비디아 NVLink를 사용해 최대 256개의 엔비디아 GH200 그레이스 호퍼 슈퍼칩(Grace Hopper Superchip)을 데이터 센터 크기의 단일 GPU로 결합하는데요,
현재 본격적인 생산에 돌입했다고 밝힌 GH200 슈퍼칩은 에너지 효율이 뛰어난 엔비디아 그레이스 CPU와 고성능 엔비디아 H100 텐서 코어(Tensor Core) GPU를 하나의 슈퍼칩에 결합한 제품입니다.
거기다 DGX GH200은 단일 엔비디아 DGX A100 320GB 시스템 대비 거의 500배 더 높은 엑사플롭의 성능과 144테라바이트의 공유 메모리를 제공합니다. 이를 통해 개발자는 생성형 AI 챗봇을 위한 대규모 언어 모델, 추천 시스템을 위한 복잡한 알고리즘, 사기 탐지와 데이터 분석에 사용되는 그래프 신경망을 구축할 수 있습니다.
구글 클라우드(Google Cloud), 메타(Meta), 마이크로소프트(Microsoft) 등이 향후 하이퍼스케일 생성형 AI 인프라의 청사진으로 활용될 수 있는 DGX GH200에 가장 먼저 액세스할 것으로 예상하고 있답니다.
젠슨 황 CEO는 “DGX GH200 AI 슈퍼컴퓨터는 엔비디아의 최고급 가속 컴퓨팅과 네트워킹 기술을 통합하여 AI의 경계를 확장시킵니다”고 밝히기도 했습니다.
엔비디아는 또한 자체 대규모 AI 슈퍼컴퓨터인 엔비디아 헬리오스(NVIDIA Helios)를 구축하고 올해 가동할 예정입니다. 이 슈퍼컴퓨터는 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹과 연결된 4개의 DGX GH200 시스템을 사용하여 대규모 AI 모델 훈련을 위한 데이터 처리량을 강화시키게 됩니다.
이번 행사에서 발표된 수백 가지 시스템 중 정점을 이루는 것은 DGX GH200입니다. 이 시스템들은 함께 수백만 명의 사용자에게 생성형 AI와 가속 컴퓨팅을 제공할 것입니다.
젠슨 황 CEO는 또한 엔비디아의 최신 호퍼, 그레이스, 에이다 러브레이스(Ada Lovelace), 블루필드(BlueField) 아키텍처를 기반으로 하는 400개 이상의 시스템 구성이 출시될 예정이라고 발표했습니다. 이는 AI, 데이터 사이언스 및 고성능 컴퓨팅 분야에서 가장 복잡한 과제를 해결하는 것을 목표로 합니다.
모든 규모의 가속
엔비디아는 또한 모든 규모의 데이터센터 요구사항을 충족하기 위해 가속화된 서버를 만들기 위한 모듈식 참조 아키텍처인 엔비디아 MGX를 발표했습니다. 이를 통해 시스템 제조업체는 광범위한 AI, HPC, 엔비디아 옴니버스 애플리케이션에 적합한 100개 이상의 서로 다른 서버 구성을 비용 효율적으로 빠르게 구축할 수 있게 됩니다.
MGX를 통해 제조업체는 공통 아키텍처와 모듈식 구성 요소를 사용하여 CPU와 가속 서버를 구축할 수 있는데요, 다양한 공냉식 및 수냉식 섀시에서 엔비디아의 GPU, CPU, 데이터 처리 장치(DPU), 네트워크 어댑터 전 라인과 x86 및 Arm 프로세서를 지원합니다.
8월에 공개되는 MGX 설계를 적용한 제품을 처음으로 시장에 출시하는 회사는 QCT와 슈퍼마이크로(Supermicro)입니다. 컴퓨텍스에서 발표된 슈퍼마이크로의 ARS-221GL-NR 시스템은 그레이스 CPU를 사용하며, 마찬가지로 이번 행사에서 발표된 QCT의 S74G-2U 시스템은 그레이스 호퍼를 사용합니다.
애즈락랙(ASRock Rack), 에이수스(ASUS), 기가바이트(GIGABYTE), 페가트론(Pegatron)도 MGX를 사용하여 차세대 가속 컴퓨터를 구축할 계획입니다.
5G/6G를 지원하는 그레이스 호퍼
젠슨 황 CEO는 이어 엔비디아가 미래의 5G 및 6G 무선 및 비디오 통신을 형성하는 데 도움을 주고 있다고 말했습니다. 시연에서는 그레이스 호퍼에서 실행되는 AI가 어떻게 오늘날의 2D 화상 통화를 더욱 생생한 3D 경험으로 전환하여 놀라운 현장감을 제공하는지 보여주었습니다.
아울러 새로운 종류의 서비스를 위한 토대를 마련하기 위해 엔비디아가 거대 통신사 소프트뱅크와 협력하여 일본에 분산형 데이터센터 네트워크를 구축한다고 발표했는데요, 이는 공통 클라우드 플랫폼에서 5G 서비스와 생성형 AI 애플리케이션을 제공할 것으로 기대됩니다.
데이터센터는 모듈식 MGX 시스템의 그레이스 호퍼, 엔비디아 블루필드-3 DPU와 엔비디아 스펙트럼(Spectrum) 이더넷 스위치를 사용하여 5G 프로토콜에 필요한 매우 정확한 타이밍을 제공합니다. 이 플랫폼은 에너지 소비를 줄이면서 스펙트럼 효율성을 높여 비용을 절감시켜 줍니다.
이 시스템은 소프트뱅크가 자율주행, AI 팩토리, 증강 및 가상 현실, 컴퓨터 비전 및 디지털 트윈 분야에서 5G 애플리케이션을 활용하는 데 도움이 될 것입니다. 그리고 향후에는 3D 화상 회의 및 홀로그램 통신과 같은 다양한 활용 사례도 기대할 수 있죠.
클라우드 네트워크 강화
젠슨 황 CEO는 이더넷 기반 AI 클라우드의 성능과 효율성 개선에 특화된 네트워킹 플랫폼인 엔비디아 스펙트럼-X(Spectrum-X)를 공개했습니다. 이 플랫폼은 스펙트럼-4 이더넷 스위치를 블루필드-3 DPU 및 소프트웨어와 결합하여 AI 성능과 전력 효율성을 기존 이더넷 패브릭 대비 1.7배 향상시키게 됩니다.
엔비디아 스펙트럼-X, 스펙트럼-4 스위치, 블루필드-3 DPU는 현재 델 테크놀로지스(Dell Technologies), 레노버(Lenovo), 슈퍼마이크로 등의 시스템 제조업체에서 구입할 수 있습니다.
게임 캐릭터에 생명력 부여
생성형 AI는 게임 플레이 방식에도 영향을 미치게 될 것입니다.
젠슨 황 CEO는 개발자가 음성, 대화, 애니메이션용 맞춤형 AI 모델을 구축하고 배포하는 데 사용할 수 있는 파운드리 서비스인 엔비디아 게임용 아바타 클라우드 엔진(Avatar Cloud Engine, ACE)을 발표했습니다. 이 서비스는 NPC(non-playable character)에 대화 능력을 부여하는데요, 이로써 NPC들도 실제 사람과 같은 인격을 가지고 발전하며 질문에 응답할 수 있습니다.
엔비디아 게임용 ACE에는 플레이어의 음성을 감지하고 기록하는 엔비디아 리바(Riva)와 같은 AI 기초 모델이 포함되어 있습니다. 이 텍스트를 기반으로 엔비디아 네모(NeMo)는 엔비디아 옴니버스 오디오투페이스(Omniverse Audio2Face)로 애니메이션화된 맞춤형 응답을 생성할 수 있습니다.
윈도우에서 생성형 AI 가속화
또한 젠슨 황 CEO는 엔비디아와 마이크로소프트가 생성형 AI 시대에 윈도우(Windows) PC의 혁신을 위해 어떻게 협력하고 있는지 설명했습니다.
새롭고 향상된 도구, 프레임워크, 드라이버를 통해 PC 개발자는 AI를 보다 쉽게 개발하고 배포할 수 있다. 예를 들어, GPU 가속 AI 모델과 새로운 그래픽 드라이버를 최적화하고 배포하기 위한 마이크로소프트 올리브(Olive) 툴체인은 엔비디아 GPU가 장착된 윈도우 PC에서 DirectML 성능을 향상시킵니다.
이번 협업은 400개 이상의 AI 가속 윈도우 앱과 게임의 성능을 향상시키는 텐서 코어를 포함한 RTX GPU를 탑재한 1억 대의 PC 설치 기반을 향상 및 확장할 것으로 기대되고 있답니다.
세계 최대 산업의 디지털화
또한 생성형 AI는 7,000억 달러 규모의 디지털 광고 산업에서 새로운 기회를 창출하고 있습니다. 예를 들어, 세계 최대의 마케팅 서비스 조직인 WPP는 엔비디아와 협력하여 옴니버스 클라우드(Omniverse Cloud)에서 최초의 생성형 AI 기반 콘텐츠 엔진을 구축하고 있습니다.
젠슨 황 CEO는 데모를 통해 크리에이티브 팀이 어도비 서브스턴스 3D(Adobe Substance 3D)와 같은 3D 디자인 툴을 연결하여 엔비디아 옴니버스에서 고객 제품의 디지털 트윈을 구축하는 방법을 선보였다. 그런 다음 책임감 있게 소싱된 데이터로 훈련되고 엔비디아 피카소(Picasso)로 구축된 생성형 AI 툴의 콘텐츠를 통해 가상 세트를 신속하게 생성할 수 있습니다. WPP의 고객들은 이러한 전체 장면을 사용하여 글로벌 시장과 사용자가 모든 웹 디바이스에서 경험할 수 있는 다양한 광고, 비디오, 3D 경험을 생성할 수 있습니다.
젠슨 황 CEO는 이에 대해 “요즘의 광고는 검색되지만 앞으로는 사용자가 정보를 사용하면 더 많은 정보가 생성될 것입니다. 컴퓨팅 모델이 변했기 때문이죠”라고 말했습니다.
AI 미래를 만드는 공장
약 1,000만 개의 공장이 가동되는 46조 달러 규모의 제조 부문은 산업 디지털화 가능성이 풍부한 분야입니다.
젠슨 황 CEO는 “세계에서 가장 큰 산업은 물리적인 것을 만든다. 이를 먼저 디지털 방식으로 구축하면 수십억 달러를 절약할 수 있다”고 설명했습니다.
기조연설에서는 폭스콘 인더스트리얼 인터넷(Foxconn Industrial Internet), 이노디스크(Innodisk), 페가트론, 퀀타(Quanta), 위스트론(Wistron)을 비롯한 전자제품 제조업체가 엔비디아 기술로 디지털 워크플로우를 구축하여 완전한 디지털 스마트 공장의 비전을 실현하는 방법이 소개되었습니다.
이 기업들은 공장의 디지털 트윈을 구축할 수 있도록 옴니버스와 생성형 AI API를 사용하여 설계 및 제조 툴을 연계하고 있습니다. 또한 로봇 시뮬레이션과 테스트를 위해 엔비디아 아이작 심을 사용하고, 자동화된 광학 검사를 위해 비전 AI 프레임워크인 엔비디아 메트로폴리스를 사용합니다.
최신 구성요소인 공장용 엔비디아 메트로폴리스(Metropolis for Factories)는 맞춤형 품질 관리 시스템을 생성하여 제조업체에 경쟁 우위를 제공할 수 있습니다. 이를 통해 기업들은 최첨단 AI 애플리케이션을 개발할 수 있습니다.
AI로 조립 라인 속도 높인다
노트북과 스마트폰을 포함해 전 세계적으로 300여 개의 제품을 만드는 페가트론은 옴니버스, 아이작 심, 메트로폴리스를 활용해 가상 공장을 만들고 있습니다. 이를 통해 시뮬레이션된 환경에서 프로세스를 시험해 볼 수 있어 시간과 비용을 절약할 수 있게 됩니다.
또한 페가트론은 엔비디아 딥스트림(DeepStream) 소프트웨어 개발 키트를 사용해 처리량을 10배 높인 지능형 비디오 애플리케이션을 개발했습니다.
세계 최대 기술 제조업체인 폭스콘의 서비스 자회사 폭스콘 인더스트리얼 인터넷은 엔비디아 메트로폴리스 파트너와 협력하여 회로 기판 품질보증 검사 지점의 상당 부분을 자동화하고 있습니다.
젠슨 황 CEO는 동영상을 통해 대만의 대형 제조기업 퀀타의 자회사인 테크맨 로봇(Techman Robot)이 어떻게 엔비디아 아이작 심을 활용하여 검사를 제조라인 검사를 최적화했는지 선보였습니다. 기본 원리는 시뮬레이션 로봇을 사용해 로봇의 성능을 높이는 방법을 로봇에게 훈련시키는 것인데요, 또한 차세대 자율이동로봇(AMR) 차량을 지원하는 새로운 플랫폼도 발표했습니다. 아이작 AMR은 AMR의 시뮬레이션, 배포 및 관리를 지원합니다.
젠슨 황은 에이디링크(ADLINK), 에티나(Aetina), 딜로이트(Deloitte), 퀀티파이(Quantiphi), 지멘스(Siemens)를 포함한 대규모 파트너 생태계가 이러한 모든 제조 솔루션을 시장에 출시하는 데 도움을 주고 있다고 말했습니다. 이는 엔비디아가 어떻게 기업들이 가속 컴퓨팅을 통해 생성형 AI의 이점을 체험할 수 있도록 돕는지 보여주는 수많은 예 중에 하나입니다.
“오랜만에 뵙는 자리라서 할 얘기가 많았습니다” 라며 2시간에 걸친 발표가 끝낸 젠슨 황 CEO는 열렬한 박수를 받으며 키노트 무대를 마무리했답니다. 아래 키노트 다시 보기 영상을 통해 그날의 현장을 다시 한번 감상해보세요!