Dell Technologies World 무대에 오른 젠슨 황 NVIDIA CEO “수요가 포물선처럼, 완전한 포물선처럼 치솟고 있다”

젠슨 황 NVIDIA CEO가 Dell Technologies World에서 Dell AI Factory with NVIDIA 업데이트를 공개했습니다. Vera Rubin NVL72로 토큰당 비용 10배 절감, Vera CPU로 데이터 쿼리 3배 가속, 5,000개 기업이 도입했습니다.
by NVIDIA Korea

월요일 무대에 오른 젠슨 황(Jensen Huang) NVIDIA CEO는 마이클 델(Michael Dell) Dell CEO와 함께 Dell AI Factory with NVIDIA의 최신 업데이트를 공개했습니다. 데스크사이드 워크스테이션부터 데이터센터 랙까지, 자율 에이전트를 위한 풀스택 플랫폼을 한자리에 모은 발표였죠.

NVIDIA Vera Rubin NVL72를 활용한 에이전틱 AI 추론은 토큰당 비용이 기존 대비 10분의 1 수준으로 떨어졌고, 에이전트 샌드박스는 기존 CPU 대비 NVIDIA Vera 위에서 50% 더 빠르게 돌아갑니다. 또한 Vera CPU에서는 엔터프라이즈 데이터 쿼리 속도가 최대 3배까지 빨라지죠. 여기에 Lilly와 Samsung, Honeywell을 포함한 5,000개 기업이 이미 Dell AI Factories with NVIDIA에서 AI 워크로드를 돌리며, 구상을 실제 프로덕션 규모로 구현해 내고 있습니다.

이것이 월요일 아침 Dell Technologies World 무대에서 마이클 델이 그려낸 큰 그림인데요, 그는 이번 변화의 무게를 이렇게 풀어냈습니다. 전 세계 AI 인프라 투자는 2030년까지 3~4조 달러에 이를 수 있고, 같은 기간 토큰 소비량은 무려 3,400% 늘어날 것으로 전망된다는 것이죠.

“이미 거대한 AI 투자 붐이 시작됐고, 생산성 붐도 막을 올리고 있습니다. 저희 회사를 포함한 일부 기업에서는 더욱 그렇죠.” 델은 이렇게 운을 뗐습니다. “변화의 속도가 포물선을 그리듯 치솟고 있고, 둔화될 조짐은 보이지 않습니다.”

이어 델 회장 겸 CEO는 NVIDIA 창립자이자 CEO인 젠슨 황을 키노트 무대로 불러올렸습니다. 무대 뒤에는 데스크사이드 Dell Pro Max with GB10 워크스테이션부터 NVIDIA Vera Rubin NVL72를 탑재한 Dell PowerRack까지, NVIDIA 포트폴리오 전체가 펼쳐져 있었죠.

“이제 ‘쓸모 있는 AI’의 시대가 본격적으로 열렸고, 그래서 수요가 포물선처럼, 완전한 포물선처럼 치솟고 있는 겁니다.” 황은 이렇게 강조했습니다. “예전에 몇 달 걸리던 일이 이제 몇 주로 줄었고, 몇 주 걸리던 일이 며칠로, 며칠 걸리던 일이 몇 시간으로 압축됐죠. 생산성에서는 큰 변화지만, 컴퓨팅 요구량으로 보면 그야말로 거대한 도약입니다.”

핵심 메시지는 명확합니다. 엔터프라이즈 AI가 더 이상 파일럿 단계에 머무르지 않고, 에이전틱 AI와 추론을 대규모로 배포하는 단계로 넘어왔다는 것이죠. 그 다음 시대를 받쳐 줄 플랫폼이 바로 Dell AI Factory with NVIDIA이며, 프런티어 모델과 자율 에이전트를 엔터프라이즈 경계 안에서 안전하게 운영할 수 있도록 설계됐습니다.

에이전틱 시대를 위한 새로운 AI 팩토리

이번 업데이트의 출발점은 가속 컴퓨팅 소식입니다. NVIDIA Vera Rubin NVL72 기반의 Dell PowerEdge XE9812는 대규모 에이전틱 AI 추론에서 NVIDIA Blackwell 대비 토큰당 비용을 최대 10배 낮춥니다.

여기에 PowerEdge XE9880L과 XE9885L, XE9882L 서버도 합류하는데요, NVIDIA HGX Rubin NVL8 기반의 Dell 첫 시스템으로 랙당 최대 144개 GPU를 지원하고, 컴퓨트 노드는 전량 직접 액체 냉각 방식으로 동작하며, HGX B200 대비 최대 5.5배 성능을 냅니다.

네트워킹 측에서는 NVIDIA Quantum-X800 InfiniBandNVIDIA Spectrum-6 Ethernet을 적용한 새로운 Dell PowerSwitch 포트폴리오가 등장합니다. 액체 냉각과 광 모듈 일체형(co-packaged optics) 기술이 함께 적용된 점이 특징이죠.

Dell은 컴퓨트와 네트워킹, 스토리지를 하나의 시스템으로 통합 설계한 Dell PowerRack도 새로 선보입니다. 열 설계와 전력 관리, 소프트웨어 최적화가 처음부터 함께 맞물려 동작하도록 만들어져, 부품 단위 통합에 드는 오버헤드 없이 엔터프라이즈 규모의 AI·HPC 워크로드를 그대로 가속할 수 있는데요, 이것이 곧 Dell PowerRack의 강점입니다.

CPU 영역에서는 Dell PowerEdge M9822와 R9822 서버가 NVIDIA Vera CPU를 엔터프라이즈 AI 팩토리로 끌어들입니다. 에이전틱 AI를 위해 처음부터 다시 설계된 Vera는 데이터 파이프라인과 분석, 샌드박스 도구, 코드 워크로드처럼 매 단계가 앞 단계의 결과를 기다리는 작업에 특화돼 있죠.

메모리 대역폭은 1.2TB/s에 이르고 부하 상황에서도 예측 가능한 성능을 내기 때문에, Vera는 x86 프로세서 대비 에이전틱 워크로드를 50% 빠르게 처리합니다. 덕분에 PowerEdge 시스템은 더 빠른 에이전트 응답과 더 짧은 피드백 루프로 AI 팩토리의 처리량을 끌어올릴 수 있습니다.

“Vera CPU는 세상에 존재하는 모든 CPU 가운데 단일 스레드 성능이 가장 높습니다.” 황은 이렇게 짚었는데요, “메모리 대역폭도 세 배에 달하기 때문에 Starburst나 DuckDB 같은 데이터베이스가 놀라울 정도로 빨리 돌아갑니다. 에이전트가 데이터베이스를 끊임없이 두드리니, CPU는 무조건 빨라야 하니까요.”

Dell AI Data Platform with NVIDIA의 새 데이터 엔진인 Starburst는 NVIDIA Vera CPU 위에서 대규모 SQL 분석 쿼리 처리량을 3배 끌어올립니다.

엔터프라이즈 데이터는 AI 팩토리의 연료입니다. Dell이 발표한 AI Data Platform with NVIDIA 업데이트는 NVIDIA CUDA-X 라이브러리 기반의 가속 데이터 엔진을 핵심 축으로 삼는데요, 정형 데이터에는 cuDF, 비정형 데이터에는 cuVS가 함께 동원되죠.

이번 키노트에는 Dell AI Factory with NVIDIA를 도입한 여러 고객 사례도 등장했습니다.

Lilly의 최고정보·디지털 책임자이자 부사장인 디오고 라우(Diogo Rau)는 키노트 초반에 무대에 올라, Dell과 NVIDIA로 대규모 AI 인프라를 구축해 생명과학 분야에서 거두고 있는 AI 기반 혁신과 진전을 소개했습니다.

그는 첨단 과학을 대규모로 풀어내는 데 있어 기술이 결정적인 역할을 한다고 강조했죠. “지금 우리가 알고 있는 질병을 끝낼 수 있는 시점에 다가서고 있다고 봅니다.” 라우는 이렇게 말했습니다. “20년 전이라면 상상조차 할 수 없던 일이지만, 오늘은 충분히 그릴 수 있는 그림이지요.”

이어 등장한 Samsung 영상에서는 Dell AI Factory with NVIDIA 위에서 돌아가는 R&D용 칩 설계와 제조 사례가 부각됐습니다.

Honeywell의 최고기술책임자(CTO) 수레시 벤카타라얄루(Suresh Venkatarayalu)도 마이클 델과 무대에 올라, 퍼블릭 클라우드에서 온프레미스 AI로 옮겨 가는 여정을 풀어냈는데요, Dell AI Factory와 Dell AI Data Platform with NVIDIA를 산업 AI와 디지털 트윈, 그리고 데이터센터부터 엣지까지 이어지는 자동화 워크로드에 활용하고 있다고 설명했습니다.

“저희에게 Dell, NVIDIA와의 협력은 단순한 인프라 도입이 아닙니다.” 벤카타라얄루는 이렇게 말했습니다. 그는 이를 곧 풀스택 AI라고 설명했는데요, 확장 가능하고 안전하며 고객이 믿고 쓸 수 있는 형태로 묶여 있다는 의미입니다.

금융 서비스 영역에서는 알고리즘 트레이딩 회사인 Hudson River Trading이 Dell 인프라를 한층 확대하는 사례도 소개됐습니다. AI 기반 리서치를 가속하기 위해 NVIDIA 가속 컴퓨팅과 NVIDIA Spectrum-X Ethernet을 탑재한 Dell PowerEdge XE9685L 서버를 도입했고, 이를 바탕으로 회사의 데이터와 모델, 확장 계획에 발맞춰 인프라를 키워 가고 있죠.

에이전트와 모델, 안전하게 온프레미스로

Dell이 자체적으로 진행한 AI 도입 설문조사 결과도 키노트 무대에서 공유됐는데요, 이미 AI 워크로드의 67%가 클라우드 밖, 곧 온프레미스와 단말, 엣지, 코로케이션에서 돌아가고 있으며, 응답자 중 88%는 최소 한 개 이상의 AI 워크로드를 온프레미스에서 운영 중인 것으로 나타났습니다.

온프레미스 AI 관련 발표는 Dell이 무대에서 던진 질문에 대한 직접적인 답이기도 했죠. “세계 최고의 AI 모델을, 필요한 곳에, 보안과 거버넌스를 처음부터 갖춘 상태로 어떻게 배포할 것인가?”

그 답의 근간은 NVIDIA Confidential Computing입니다. Fortanix와 Google, Red Hat을 비롯한 파트너들과 함께 제공되는 이 기술은 모델 IP나 데이터를 노출시키지 않으면서도 프런티어 모델을 엔터프라이즈 내부에 안전하게 배포할 수 있는 기반이 됩니다.

이를 통해 기업은 사용 중인 AI 모델과 민감한 데이터를 보호하면서도, 온프레미스 AI 인프라가 주는 토큰 효율과 성능, 비용 이점을 동시에 확보할 수 있죠.

Confidential Computing이 지키는 프런티어 독점 모델

Gemini 3.0이 탑재된 Google Distributed Cloud(GDC)는 NVIDIA Blackwell로 가속되고 NVIDIA Confidential Computing으로 보호되는 Dell PowerEdge XE9780 서버 위에서 프리뷰 형태로 제공됩니다. 덕분에 기업은 고도화된 AI를 위한 전용 컨피덴셜 컴퓨팅 환경을 손에 넣게 되죠.

SpaceXAI 또한 자사 최신 모델을 Dell AI Factory에 온프레미스로 들여오는데요, NVIDIA Confidential Computing이 모델 가중치와 엔터프라이즈 데이터를 처음부터 끝까지 함께 지켜 줍니다.

Dell AI Factory에서 네이티브로 돌아가는 오픈 프런티어 모델

프런티어급 오픈 인텔리전스인 NVIDIA Nemotron 모델은 Dell AI Factory 인프라 위에서 동작합니다. 자체 도메인과 데이터에 맞춰 오픈 웨이트 모델을 튜닝해 쓰고 싶은 기업에 적합한 선택지죠.

Reflection이 공개한 오픈 소스 프런티어 AI 모델 또한 온프레미스 환경으로 들어옵니다. 규제 산업과 정부, 주권 기관 사용을 염두에 두고 설계된 모델이라는 점이 특징입니다.

이 외에도 NVIDIA NVFP4 최적화를 거친 MiniMax-M2.7과 DeepSeek Pro, DeepSeek-V4, GLM 5.1, Kimi K2.6 등 추가 오픈 모델을 Hugging Face의 Dell Enterprise Hub에서 만나볼 수 있습니다. 기존에 올라와 있던 Gemma 4와 NVIDIA Nemotron Super 3, Mistral Small 4, Arcee Trinity-Large-Thinking과 함께 라인업이 한층 풍성해진 셈이죠.

이 새로운 에이전틱 시대에는 데이터와 시스템, 워크플로가 이미 자리 잡고 있는 하이브리드·온프레미스 환경 전반에서 에이전트가 안전하게 동작해야 합니다.

OpenAI Codex는 Dell AI Data Platform과 연결돼, 에이전트가 진짜로 쓸모 있어지는 데 필요한 내부 맥락, 곧 코드베이스와 문서, 비즈니스 시스템, 운영 지식, 팀 워크플로 가까이로 Codex를 데려갑니다. 나아가 Dell과 OpenAI는 Codex와 Dell AI Factory를 잇는 방식도 함께 모색할 예정입니다.

소프트웨어 파트너 생태계

Dell은 에이전틱 AI와 코드 어시스턴트, 컴퓨터 비전 등 일반적인 엔터프라이즈 AI 활용 사례 전반에 걸친 새로운 소프트웨어 파트너십도 다수 발표했는데요.

여기에는 3월에 공개됐던 Palantir의 소버린 AI OS 레퍼런스 아키텍처도 포함됩니다. NVIDIA와 함께 만든 이 아키텍처는 이제 Dell 인프라 위에서 동작하며, Palantir Ontology와 AIP를 온프레미스에 배포하면서 NVIDIA Sovereign AI OS Reference Architecture와 함께 묶을 수 있죠.

또한 ServiceNow 고객은 Dell AI Factory를 활용해 인프라와 엔터프라이즈 워크플로 자동화를 한자리에 모을 수 있는데요, 이를 통해 비즈니스 성과에 초점을 둔 AI를 발굴해 거버넌스를 적용하며 실제 운영 단계로 풀어낼 수 있습니다.

이 외에도 Dell은 Fogsphere와 Ipsotek, Mistral AI, Poolside, Uneeq를 비롯한 다양한 AI 분야 리더 및 소프트웨어 혁신 기업과의 새로운 솔루션, 그리고 CrowdStrike·Fortanix와의 보안 파트너십을 함께 발표했습니다.

데스크사이드부터 데이터센터까지, 모든 곳의 에이전트

그중에서도 가장 일상에 와 닿는 소식은 데스크사이드 영역의 발표입니다. NVIDIA NemoClaw 스택과 NVIDIA OpenShell 런타임, 그리고 NVIDIA Nemotron 오픈 모델을 결합한 Dell Deskside Agentic AI는 NVIDIA Grace Blackwell 아키텍처 기반의 Dell Pro Max with GB10·GB300 위에서 동작하며, NVIDIA RTX PRO Blackwell 워크스테이션 플랫폼 기반의 Dell Pro Precision 시스템에서도 동일하게 동작합니다.

커스터마이징 계층은 NVIDIA Nemotron과 NVIDIA Agent Toolkit, NVIDIA NeMoClaw로 구성되는데요, 황이 무대에서 로컬 모델과 엔터프라이즈 데이터를 잇는 결합 계층이라고 소개한 에이전트 오케스트레이션 하니스가 바로 NeMoClaw입니다. 이를 바탕으로 기업은 자율 에이전트를 직접 구축하고, 모델을 자사 환경에 맞게 커스터마이징하며, 에이전트 워크플로를 오케스트레이션하고, 에이전트를 사내 데이터·도구와 안전하게 연결할 수 있죠.

보안 계층은 NVIDIA OpenShell이 책임집니다. 자율 에이전트의 개발과 배포를 위한 오픈 소스 런타임으로서, 보안과 프라이버시 제어를 인프라 계층에 녹여 회사의 정책을 강제할 수 있도록 해 주는 데다 주요 엔터프라이즈 소프트웨어 플랫폼과도 통합돼 있습니다.

NVIDIA OpenShell은 이제 Dell AI Factory with NVIDIA 전반에 걸쳐 지원되며, 워크스테이션부터 서버까지 어디서든 AI 에이전트를 구축·배포·관리할 수 있는 안전한 런타임이 개발자들에게 주어지는 셈이죠.

Dell은 NVIDIA AI-Q Blueprint 지원도 강조했는데요, 이를 통해 기업은 심층 리서치를 위한 멀티 에이전트 워크플로를 손쉽게 구성할 수 있고, 개발에서 파일럿, 프로덕션으로 이어지는 여정의 속도도 빨라집니다.

둘째 날

Dell Technologies World 둘째 날에는 Dell의 최고운영책임자(COO)인 제프 클라크(Jeff Clarke)와 인프라 솔루션 그룹 사장 아서 루이스(Arthur Lewis)가 NVIDIA Vera CPU와 Vera Rubin, Confidential Computing, Nemotron에 대해 한층 깊이 들어가는데요, Dell Deskside Agentic AI의 라이브 데모도 함께 진행됩니다.

황과 델이 월요일 자리에서 던진 키워드, 곧 안전하고 장기간 실행되는 에이전트와 풀스택 팩토리, 그리고 안전한 온프레미스 배포는 6월 1일부터 4일까지 COMPUTEX에서 열리는 GTC Taipei로 이어지는 NVIDIA의 다음 발표를 자연스럽게 예고하고 있습니다.