“생성형 AI는 산업을 재편하고 혁신과 성장을 위한 새로운 기회를 열어가고 있습니다.” NVIDIA 창립자 겸 CEO 젠슨 황(Jensen Huang)은 이번 주 대만 타이베이에서 열리는 컴퓨텍스(COMPUTEX) 기술 콘퍼런스 키노트에서 위와 같이 설명했습니다.
자신의 트레이드마크인 검은색 가죽 재킷을 입은 젠슨 황은 청중들에게 “오늘날 우리는 컴퓨팅의 중대한 변화의 정점에 서 있습니다. AI와 가속 컴퓨팅의 교차점이 미래를 재정의할 것”이라고 말했습니다.
젠슨 황은 세계 최대 기술 콘퍼런스 중 하나인 컴퓨텍스 개최를 앞두고 타이베이의 녹음이 우거진 중심부에 위치한 유리 돔형의 국립 타이베이 대학교 스포츠센터에서 키노트를 진행했습니다. 이날 현장에는 6,500여 명의 업계 종사자, 언론, 기업가, 게이머, 크리에이터, AI 애호가들이 모였죠.
다양한 NVIDIA RTX 기반 기능을 갖춘 AI PC와 소비자 디바이스부터 NVIDIA의 풀스택 컴퓨팅 플랫폼으로 AI 팩토리를 구축, 배포하는 기업까지, NVIDIA 가속 플랫폼이 본격적인 생산에 들어갔다는 내용이 골자를 이뤘습니다.
젠슨 황은 “컴퓨팅의 미래는 가속화되고 있습니다. AI와 가속 컴퓨팅 분야의 혁신을 통해 우리는 가능성의 한계를 뛰어넘고 차세대 기술 발전의 물결을 주도하고 있죠”라고 말했습니다.
1년 주기의 NVIDIA 리듬
젠슨 황은 1년 주기로 출시될 새로운 반도체에 대한 로드맵을 공개하며 기대감을 높였습니다. 처음으로 공개된 Rubin 플랫폼은 곧 출시될 Blackwell 플랫폼의 뒤를 이을 플랫폼입니다. Rubin은 새로운 GPU, 새로운 Arm 기반 CPU인 Vera, NVLink 6, CX9 SuperNIC, X1600 converged InfiniBand/Ethernet switch를 탑재한 고급 네트워킹이 특징입니다.
젠슨 황은 “NVIDIA의 리듬은 1년 주기입니다. 우리의 기본 철학은 매우 간단합니다. 전체 데이터센터 규모를 구축하고, 1년 주기로 구성 부품을 판매하며, 모든 것을 기술의 한계까지 밀어붙이는 것”이라고 설명했죠.
NVIDIA의 크리에이티브 팀은 컴퓨텍스 키노트를 위해 NVIDIA NIM과 NVIDIA의 가속 컴퓨팅을 기반으로 구축된 NVIDIA Inception 스타트업 프로그램 회원사의 AI 툴을 사용했습니다. 현장에서는 다양한 시연을 선보이며 혁신적인 도구와 NVIDIA 기술의 변혁적인 영향력을 강조했습니다.
가속 컴퓨팅은 지속 가능한 컴퓨팅
젠슨 황은 연설을 시작하면서 NVIDIA는 데이터를 인텔리전스로 전환하는 데 드는 비용을 절감하고 있다고 말했습니다.
그는 “가속 컴퓨팅은 지속 가능한 컴퓨팅”이라고 강조하며, GPU와 CPU의 조합이 어떻게 전력 소비를 3배만 증가시키면서 최대 100배의 속도 향상을 제공하는 동시에 CPU만 사용할 때보다 와트당 25배 더 높은 성능을 달성할 수 있는지에 대해 설명했습니다.
젠슨 황은 “더 많이 구매할수록 더 많이 절약할 수 있다”며 이 접근 방식의 상당한 비용과 에너지 절감 효과를 강조했습니다.
새로운 산업 혁명을 주도할 AI 팩토리 구축을 위해 NVIDIA와 협력하는 기업들
글로벌 IT 허브인 대만 기업들을 포함한 선도적인 컴퓨터 제조업체들이 NVIDIA GPU와 네트워킹 솔루션을 채택했습니다. 대표적인 기업으로는 클라우드, 온프레미스, 엣지 AI 시스템 등을 구축하고 있는 애즈락 랙(ASRock Rack), 에이수스(ASUS), 기가바이트(GIGABYTE), 인그라시스(Ingrasys), 인벤텍(Inventec), 페가트론(Pegatron), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron), 위윈(Wiwynn) 등이 있죠.
이제 NVIDIA MGX 모듈식 레퍼런스 디자인 플랫폼은 거대 언어 모델(large language model, LLM) 추론, 검색 증강 생성(retrieval-augmented generation, RAG), 데이터 처리에서 최적의 성능을 발휘하도록 설계된 GB200 NVL2 플랫폼을 포함한 Blackwell을 지원합니다.
AMD와 인텔(Intel)은 처음으로 자체 CPU 호스트 프로세서 모듈 설계를 제공할 계획으로 MGX 아키텍처를 지원하고 있습니다. 모든 서버 시스템 빌더는 이러한 레퍼런스 디자인을 사용해 개발 시간을 절약하는 동시에 설계와 성능의 일관성을 보장할 수 있죠.
Spectrum-X를 통한 차세대 네트워킹
네트워킹 부문에서는 AI용 고성능 이더넷 네트워킹에 대한 수요 증가에 대응하기 위한 Spectrum-X 제품의 연간 출시 계획을 공개했습니다.
AI용으로 구축된 최초의 이더넷 패브릭인 NVIDIA Spectrum-X는 기존 이더넷 패브릭보다 네트워크 성능을 1.6배 이상 향상시킵니다. AI 워크로드의 처리, 분석, 실행을 가속화해 AI 솔루션의 개발과 배포를 가속화할 수 있습니다.
Spectrum-X를 도입해 AI 인프라에 극한의 네트워킹 성능을 제공하는 최초의 AI 클라우드 서비스 제공업체로는 코어위브(CoreWeave), GMO 인터넷 그룹(GMO Internet Group), 람다(Lambda), 스케일웨이(Scaleway), STPX 글로벌(STPX Global), 요타(Yotta) 등이 있습니다.
수백만 명의 개발자의 생성형 AI 개발을 지원하는 NVIDIA NIM
이제 전 세계 2,800만 명의 개발자가 NVIDIA NIM을 통해 생성형 AI 애플리케이션을 쉽게 구축할 수 있습니다. 모델을 최적화된 컨테이너로 제공하는 추론 마이크로서비스인 NIM은 클라우드, 데이터센터 또는 워크스테이션에 배포할 수 있죠.
또한 기업들은 NIM을 통해 인프라 투자를 극대화할 수 있습니다. 예를 들어, 메타 라마 3-8B(Meta Llama 3-8B)를 NIM에서 실행하면 가속화된 인프라에서 NIM을 사용하지 않을 때보다 최대 3배 더 많은 생성형 AI 토큰을 생성할 수 있습니다.
케이던스(Cadence), 클라우데라(Cloudera), 코히시티(Cohesity), 데이터스택스(DataStax), 넷앱(NetApp), 스케일 AI(Scale AI), 시높시스(Synopsys) 등 200 여개의 기술 파트너가 NIM을 자신들의 플랫폼에 통합하고 있습니다. 이를 통해 이들은 코파일럿, 코드 어시스턴트, 디지털 휴먼 아바타 등 도메인 특화 애플리케이션을 위한 생성형 AI 배포를 가속화하죠. 허깅페이스(Hugging Face)는 현재 메타 라마 3부터 NIM을 제공하고 있습니다.
젠슨 황은 “오늘 허깅페이스에 완전히 최적화된 라마 3를 게시했으며, 이제 사용해 볼 수 있습니다. 심지어 어디든 가져갈 수 있죠. 모든 클라우드에서 실행하고, 이 컨테이너를 다운로드해 자체 데이터센터에 설치한 다음 호스팅해 고객이 사용할 수 있도록 할 수 있습니다”고 말했습니다.
GeForce RTX AI PC를 통해 AI 어시스턴트에 생명을 불어넣는 NVIDIA
RTX 기술로 구동되는 NVIDIA RTX AI PC는 200개 이상의 RTX AI 노트북과 500개 이상의 AI 기반 앱 및 게임으로 소비자 경험을 혁신할 예정입니다.
RTX AI 툴킷과 새롭게 제공되는 NVIDIA ACE 디지털 휴먼 플랫폼용 PC 기반 NIM 추론 마이크로서비스는 AI 접근성에 대한 NVIDIA의 노력을 보여주죠.
RTX 기반 AI 어시스턴트 기술 데모인 Project G-Assist도 발표돼 PC 게임과 앱에 대한 상황 인식 지원 기술을 선보였습니다.
또한 마이크로소프트(Microsoft)와 NVIDIA는 개발자들이 RTX 가속 SLM에 대한 간편한 API 액세스를 통해 윈도우 네이티브나 웹 앱에 새로운 생성형 AI 기능을 도입할 수 있도록 협력하고 있습니다. RTX 가속 SLM은 윈도우 코파일럿 런타임(Windows Copilot Runtime)의 일부로 디바이스에서 실행되는 RAG 기능을 지원하죠.
업계 리더들이 선택한 NVIDIA 로보틱스
NVIDIA는 효율성을 높이고 비용을 절감하는 가상 모델인 자율 운영과 디지털 트윈을 도입하는 산업 분야에서 50조 달러 규모의 산업 디지털 전환을 주도하고 있습니다. NVIDIA는 개발자 프로그램을 통해 NIM에 대한 액세스를 제공해 AI 혁신을 촉진합니다.
대만 제조업체들은 NVIDIA의 기술을 사용해 공장을 혁신하고 있다. 젠슨 황은 폭스콘(Foxconn)이 NVIDIA Omniverse, Isaac, Metropolis를 사용해 비전 AI와 로봇 개발 툴을 결합한 디지털 트윈을 만들어 로봇 설비를 개선한 사례를 소개했습니다.
젠슨 황은 “AI의 다음 물결은 물리적 AI입니다. 물리 법칙을 이해하는 AI, 사람과 함께 일할 수 있는 AI”라고 말하며, 미래 개발에서 로봇과 AI의 중요성을 강조했습니다.
NVIDIA Isaac 플랫폼은 개발자가 Jetson Orin, Thor와 같은 AI 모델과 슈퍼컴퓨터로 구동되는 AMR, 산업용 로봇, 휴머노이드 등 AI 로봇을 제작할 수 있는 강력한 툴킷을 제공합니다.
젠슨 황은 “로보틱스가 여기에 있고, 물리적 AI가 여기에 있습니다. 이것은 공상 과학 소설이 아니며 대만 전역에서 사용되고 있죠. 매우 흥미롭습니다”고 덧붙였습니다.
글로벌 전자업체들은 NVIDIA의 자율 로보틱스를 공장에 통합해 Omniverse에서 시뮬레이션을 활용하고, 물리적 세계를 위한 새로운 AI를 테스트, 검증하고 있습니다. 여기에는 전 세계적으로 사전 프로그래밍된 5백만 대 이상의 로봇이 포함되죠.
젠슨 황은 “모든 공장이 로봇화될 것입니다. 공장은 로봇을 조율하고, 로봇은 로봇화된 제품을 생산하게 될 것”이라고 설명했습니다.
젠슨 황은 BYD 일렉트로닉스(BYD Electronics), 지멘스(Siemens), 테라다인 로보틱스(Teradyne Robotics), 인트린직(Intrinsic)과 같은 글로벌 선도기업들이 NVIDIA의 고급 라이브러리와 AI 모델을 활용해 공장과 창고 효율성을 높이는 데 있어 NVIDIA Isaac이 중요한 역할을 한다고 강조했습니다.
에이디링크(ADLINK), 어드밴텍(Advantech), 오닉스(ONYX) 등의 파트너와 함께 IGX 플랫폼의 NVIDIA AI Enterprise는 의료 기술과 기타 산업에 필수적인 엄격한 규제 표준을 충족하는 엣지 AI 솔루션을 제공합니다.
젠슨 황은 키노트를 시작할 때와 마찬가지로 대만과 많은 대만 파트너사들에게 감사를 표하며 키노트를 마무리했습니다.