NVIDIA와 글로벌 파트너, 피지컬 AI로 스마트 시티와 인프라 안전 설계하다

RTX PRO 6000 Blackwell GPU로 가속화된 최신 Blueprint와 비전 언어 모델, 합성 데이터 생성 기술은 생산성과 작업 환경을 개선합니다
by NVIDIA Korea

피지컬 AI는 전 세계의 스마트 시티, 시설, 산업 공정의 기반이 되고 있습니다.

NVIDIA와 협력하고 있는 대표적인 기업들로는 액센츄어(Accenture), 아바톤(Avathon), 벨덴(Belden), 딥하우(DeepHow), 마일스톤 시스템즈(Milestone Systems), 텔릿 신테리온(Telit Cinterion) 등이 있는데요. 이들과 함께 피지컬 AI 기반 인지, 추론 기술을 통해 전 세계적인 운영 효율성을 향상시키고 있습니다.

피지컬 AI를 시뮬레이션하고 훈련하며 배포하는 연속적인 루프는 정교한 산업 자동화 역량을 제공해 도시와 인프라를 더 안전하고, 스마트하며, 효율적으로 만들죠.

예를 들어, 피지컬 AI 애플리케이션은 중장비 작업과 같이 작업자에게 잠재적으로 위험한 작업을 자동화할 수 있습니다. 또한, 교통 서비스와 공공 안전을 개선하고, 공장에서 결함 제품을 탐지하는 등 다양한 분야에서 활용될 수 있죠.

이러한 필요성은 그 어느 때보다도 커졌으며, 수치가 이를 보여줍니다.

인지하고, 추론하고, 행동할 수 있는 인프라는 영상 센서와 최신 비전 AI 기술에 의존합니다. NVIDIA Metropolis 플랫폼을 활용하면, 엣지부터 클라우드까지 영상 분석 AI 에이전트와 서비스의 개발, 배포, 확장을 단순화할 수 있죠. 그리고 개발자들은 시설에 시각 인지 기능을 더 빠르게 통합할 수 있습니다. 이를 통해 생산성을 높이고, 다양한 환경 전반의 안전을 개선할 수 있죠.

올해 SIGGRAPH에서는 피지컬 AI를 선도하는 5개 기업과 NVIDIA Metroplis의 5가지 주요 업데이트가 발표됐습니다.

피지컬 AI를 선도하는 5개 기업

글로벌 전문 서비스 기업인 액센츄어는 종합 연결 솔루션 제공업체인 벨든과 협력해 공장 내 대형 로봇 주변에 설치할 수 있는 스마트 가상 펜스를 개발했습니다. 작업자의 사고를 방지함으로써 근로 환경의 안전을 강화하고 있죠.

이미지 제공: 액센츄어, 벨든

스마트 가상 펜스는 OpenUSD 기반 디지털 트윈과 물리 기반 시뮬레이션을 활용해 복잡한 산업 환경을 모델링하는 피지컬 AI 안전 시스템입니다. 컴퓨터 비전 기반 매핑과 3D 공간 지능을 활용해, 현대의 작업 현장에서 발생하는 동적인 인간-로봇 상호작용의 다양한 변동성에 적응할 수 있죠.

액센츄어는 NVIDIA Omniverse 플랫폼과 Metropolis를 활용해 스마트 펜스를 구축하고 시뮬레이션합니다. Omniverse를 통해 로봇 팔과 작업자가 움직이는 공간의 디지털 트윈을 생성하고, Metropolis를 통해 AI 모델을 훈련하며, 영상 입력 기능과 NVIDIA DeepStream 소프트웨어 개발 키트(SDK)의 실시간 추론 기능을 활용해 엣지 환경에 배포했습니다.

산업 자동화 플랫폼 제공업체인 아바톤은 NVIDIA Metropolis의 일부인 영상 검색과 요약(video search and summarization, VSS)용 NVIDIA Blueprint를 활용했는데요. 이를 통해 제조와 에너지 시설에 운영 효율성과 작업자 안전을 개선하는 실시간 인사이트를 제공하고 있습니다.

인도의 연료, 모빌리티 분야의 선도 기업인 릴라이언스 브리티시 페트롤리엄 모빌리티 리미티드(Reliance British Petroleum Mobility Limited)는 주유소 건설 과정에서 아바톤의 비디오 인텔리전스 제품을 활용했습니다. 이를 통해 안전 규정 준수 기준을 높이고, 안전 위반 사고를 줄이며, 수천 시간의 작업 시간을 절감해 생산성을 향상시켰죠.

딥하우는 제조업과 기타 산업 분야 직원들을 위해 ‘스마트 노하우 컴패니언(Smart Know-How Companion)’을 개발했습니다. 이는 Metropolis VSS Blueprint를 활용해 주요 워크플로우를 다국어 지원의 짧은 동영상과 디지털 지침으로 변환함으로써, 온보딩, 안전, 현장 운영 효율성을 개선합니다.

숙련된 근로자의 퇴직과 직무 역량 강화 필요성에 직면한 음료 회사인 앤하이저부시 인베브(Anheuser-Busch InBev)는 딥하우 플랫폼을 활용해 표준 운영 절차를 이해하기 쉬운 시각 자료로 변환했습니다. 이로써 온보딩 시간을 80% 단축하고, 교육 일관성을 높였으며, 직원들의 장기적 지식 유지율을 개선했죠.

마일스톤 시스템즈는 복잡한 산업과 도시 환경에서 IP 비디오 센서 데이터를 관리하는 세계 최대 규모의 플랫폼 중 하나를 제공하는 기업입니다. 이들은 프로젝트 하프니아(Project Hafnia) 플랫폼을 통해 세계 최대의 실제 컴퓨터 비전 데이터 라이브러리를 구축하고 있는데요. 이 플랫폼의 주요 기능 중 하나는 피지컬 AI 개발자들에게 맞춤형 비전 언어 모델(vision language model, VLM)에 대한 접근 권한을 제공하는 것입니다.

마일스톤 시스템즈는 NVIDIA NeMo Curator를 활용해 지능형 교통 시스템용으로 미세 조정된 VLM을 구축했습니다. 이를 VSS Blueprint 내에서 사용해 도시 도로를 더 효과적으로 관리하는 AI 에이전트를 개발하고 있죠. 또한, 피지컬 AI를 위해 새로운 오픈소스 맞춤형 NVIDIA Cosmos Reason VLM을 활용할 계획입니다.

사물인터넷(IoT) 기업인 텔릿 신테리온NVIDIA TAO 툴킷 6을 AI 기반 비전 검사 플랫폼에 통합했습니다. 이 플랫폼은 FoundationPose와 같은 비전 파운데이션 모델과 기타 NVIDIA 모델을 활용해 멀티모달 AI를 지원하고, 고성능 추론을 제공하죠. TAO는 텔릿 플랫폼에 로우코드 AI 기능을 제공해 제조업체가 결함 감지와 품질 관리를 위한 정확한 맞춤형 AI 모델을 신속하게 개발하고 배포할 수 있도록 합니다.

피지컬 AI를 위한 NVIDIA Metropolis 5가지 업데이트

NVIDIA Metropolis의 주요 업데이트는 개발자들이 피지컬 AI 애플리케이션을 더 빠르고 쉽게 구축할 수 있도록 지원합니다.

Cosmos Reason VLM

최신 버전의 Cosmos Reason은 피지컬 AI를 위한 NVIDIA의 고급 개방형 맞춤화 가능 70억 파라미터 VLM입니다. Metropolis 사용 사례에 필요한 상황 기반 영상 이해와 시간적 이벤트 추론을 지원하죠. 소형화된 설계로 엣지부터 클라우드까지 손쉽게 배포할 수 있으며, 교통 모니터링, 공공 안전, 비전 검사, 지능형 의사결정 자동화에 이상적입니다.

VSS Blueprint 2.4

VSS Blueprint 2.4는 Cosmos Reason을 활용해 기존 비전 AI 애플리케이션을 빠르게 확장하고 스마트 인프라에 강력한 신규 기능을 제공할 수 있도록 지원합니다. 확장된 API 세트는 사용자가 특정 VSS 구성 요소와 기능을 직접 선택해 생성형 AI로 컴퓨터 비전 파이프라인을 보강할 수 있도록 더 큰 유연성을 제공하죠.

새로운 비전 파운데이션 모델

NVIDIA TAO 툴킷에는 새로운 비전 파운데이션 모델 제품군, 고급 미세 조정 기법, 자기 지도 학습, 지식 증류 기능이 포함돼 있습니다. 이러한 기능은 피지컬 AI 솔루션의 엣지와 클라우드 환경 전반에 걸친 배포를 최적화하는데 도움을 주죠. NVIDIA Deepstream SDK에는 TAO 6 모델의 원활한 배포를 가능하게 하는 새로운 추론 빌더가 추가됩니다.

애드벡스 AI(Advex AI), 인스트루멘털 AI(Instrumental AI), 스핑전스(Spingence)를 비롯한 전 세계 기업들이 이러한 새로운 모델과 NVIDIA TAO를 활용해, 산업 운영을 최적화하고 효율성을 높이는 지능형 솔루션을 개발하고 있습니다.

NVIDIA Isaac Sim 확장 기능

NVIDIA Isaac Sim 참조 애플리케이션의 신규 확장 기능은 제한된 라벨링 데이터와 희귀 엣지 케이스 시나리오와 같은 비전 AI 개발의 일반적인 문제를 해결하는 데 도움을 줍니다. 이 도구들은 인간과 로봇 간 상호작용을 시뮬레이션하고, 풍부한 객체 탐지 데이터세트를 생성하죠. 또한, VLM 훈련을 위해 사건 기반 장면과 이미지 캡션 쌍을 생성해 실제 환경에서의 개발 속도를 높이고 AI 성능을 개선합니다.

확장된 하드웨어 지원

이 모든 Metropolis 구성 요소는 이제 NVIDIA RTX PRO 6000 Blackwell GPU, NVIDIA DGX Spark 데스크톱 슈퍼컴퓨터, 피지컬 AI와 휴머노이드 로보틱스를 위한 NVIDIA Jetson Thor 플랫폼에서 실행될 수 있습니다. 이를 통해 사용자는 엣지부터 클라우드까지 개발과 배포가 가능합니다.

Cosmos Reason 1NVIDIA TAO 6.0은 현재 다운로드할 수 있습니다. VSS Blueprint 2.4, Cosmos Reason VLM 미세 조정 업데이트와 NVIDIA Deepstream 8.0의 출시에 대한 알림은 등록을 통해 받아볼 수 있습니다.

SIGGRAPH에서 진행된 NVIDIA Research 스페셜 발표를 확인하고 그래픽, 시뮬레이션 혁신이 불러오는 산업 디지털화에 대해 알아보세요.

소프트웨어 제품 정보에 대한 공지사항을 확인할 수 있습니다.