NVIDIA가 산업 자동화 혁신을 실현하는 방법

NVIDIA 소프트웨어를 결합하여 복잡한 산업 환경에서 로봇과 AI 에이전트를 훈련시키고 평가할 수 있는 AI 훈련장을 만들 수 있습니다
by NVIDIA Korea

실시간 AI는 제조, 공장 물류, 로보틱스 분야에서 중대한 작업을 처리하는 데 큰 도움을 주죠.

시뮬레이션을 우선으로 실시하는 접근방식은 부피가 큰 제품, 고가의 장비, 협동 로봇 코봇 환경, 복잡한 물류 시설을 다루는 산업에서 자동화 기술의 발전을 한 단계 끌어올립니다.

NVIDIA 창립자 겸 CEO 젠슨 황(Jensen Huang)은 GTC 키노트에서 개발자가 디지털 트윈을 사용해 대규모 실시간 AI를 산업 인프라에 적용하기 전에 이 전체를 먼저 시뮬레이션 한 후에 개발, 검증하고 개선한다면 상당한 시간과 비용을 절감할 수 있다는 것을 시연을 통해 보여줬습니다.

NVIDIA Omniverse, Metropolis, IsaaccuOpt 플랫폼이 서로 상호작용하는 AI 훈련장(gym)에서, 개발자들은 인간과 로봇이 예측 불가능한 복잡한 상황을 탐색할 수 있도록 AI 에이전트를 훈련시킬 수 있습니다.

데모 영상은 OpenUSD 앱 개발과 연결을 위해 NVIDIA Omniverse 플랫폼으로 만들어진 10만 평방 피트 규모의 창고 디지털 트윈을 보여주는데요. 이는 수십의 디지털 작업자와 다수의 자율주행로봇(AMR, autonomous mobile robot), 비전 AI 에이전트와 센서를 위한 시뮬레이션 환경으로 활용되고 있습니다.

NVIDIA Isaac Perceptor 멀티-센서 스택을 실행하는 각각의 자율주행로봇은 모두 디지털 트윈에서 시뮬레이션한 6개의 센서로 시각 정보를 처리합니다.

동시에 비전 AI용 NVIDIA Metropolis 플랫폼은 전체 창고에서 작업자 활동에 대한 단일 중앙집중식 지도를 생성해 천장에 장착된 100개의 시뮬레이션 카메라 스트림과 멀티 카메라 추적을 융합하죠. 이 중앙집중식 점유 지도(occupancy map)는 복잡한 라우팅 문제를 해결하기 위해 NVIDIA cuOpt 엔진이 계산한 자율주행로봇의 최적 경로를 알려줍니다.

AI 기반 최고의 최적화 마이크로서비스인 cuOpt는 GPU 가속 진화 알고리즘을 사용해 여러 제약 조건이 있는 복잡한 라우팅 문제를 해결합니다.

이 모든 과정은 실시간으로 이루어지며, Isaac Mission Control은 cuOpt의 지도 데이터와 경로 그래프로 모든 자율주행로봇을 조정해 명령을 전송하고 실행합니다.

산업 디지털화를 위한 AI 훈련장

AI 에이전트는 공장에서 다수의 로봇을 관리하거나 공급망 유통 센터에서 인간과 로봇의 협업을 위해 간소화된 구성을 파악하는 등 대규모 산업 환경을 지원합니다. 이러한 복잡한 에이전트를 구축하려면 개발자는 AI 평가, 시뮬레이션과 훈련을 위해 물리적으로 정확하게 구현된 AI 훈련장과 같은 디지털 트윈 환경이 필요한데요.

AI 에이전트와 자율주행로봇은 소프트웨어 인 더 루프(SIL, software-in-the-loop) AI 테스트를 통해 예측하기 힘든 실제 환경에 적응할 수 있습니다.

위의 데모를 보면, 자율주행로봇이 계획한 경로 중간에 사고가 발생해 경로가 차단되고 로봇은 화물 운반대를 픽업하지 못하는데요. 그 때 NVIDIA Metropolis는 점유 그리드(occupancy grid)를 업데이트해 모든 사람, 로봇, 물체가 한 눈에 보이도록 매핑합니다. 그 다음, 자율주행로봇은 cuOpt가 계획한 최적 경로에 따라 대응해 가동 중단 시간을 최소화하죠.

메트로폴리스 비전 파운데이션 모델NVIDIA VIA(Visual Insight Agent) 프레임워크를 구동함으로써, AI 에이전트는 “공장의 3번 통로에서 어떤 상황이 발생했습니까?”와 같은 운영 팀의 질문에 “오후 3시 30분에 선반에서 상자가 떨어져 통로를 막았습니다”와 같이 바로 통찰력 있는 답변을 제공할 수 있습니다.

개발자는 비전 인사이트 에이전트 프레임워크를 통해 엣지와 클라우드 비전에 배포된 언어 모델을 사용, 대량의 실시간 혹은 보관된 영상과 이미지를 처리할 수 있는 AI 에이전트를 구축할 수 있습니다. 이 차세대 비전 AI 에이전트는 자연어를 사용하는 영상에서 요약, 검색, 그리고 실행가능한 인사이트를 추출함으로써 거의 모든 산업에 도움이 될 수 있을 것으로 기대됩니다.

이러한 모든 AI 기능은 지속적인 시뮬레이션 기반 훈련을 통해 향상되며, 모듈식 NVIDIA NIM 추론 마이크로서비스로 배포됩니다.

글로벌 AI 콘퍼런스 NVIDIA GTC에서 생성형 AI산업 디지털화에 관한 최신 발전 사항을 자세히 알아보세요.