오픈 소스 라이브러리 ‘CV-CUDA’를 소개합니다

NVIDIA는 엔드 투 엔드 컴퓨터 비전과 이미지 처리 파이프라인을 가속화하는 오픈 소스 라이브러리인 CV-CUDA를 도입했습니다. 이는 방대한 규모의 이미지를 더욱 빠르고 효율적으로 처리할 수 있습니다.

인터넷 트래픽의 대부분은 영상에서 나옵니다. 영상은 앞으로 점점 인공지능(AI)의 특수 효과와 컴퓨터 그래픽으로 강화될 것입니다.

이런 복잡한 요소 외에도, 빠르게 성장하고 있는 소셜 미디어와 영상 공유 서비스는 AI 기반 이미징 처리과 컴퓨터 비전 파이프라인에서 클라우드 컴퓨팅 비용의 증가와 병목 현상을 겪고 있는 상황입니다.

하지만 바이트댄스(ByteDance)와 합작으로 만든 CV-CUDA는 리라이트닝(relighting), 리포징(reposing), 배경 흐리기, 초해상도 등 AI 특수효과를 가속화합니다.

지금도 NVIDIA GPU는 AI 컴퓨터 비전 파이프라인의 추론 부분을 가속하고 있지만, 전통적인 컴퓨터 비전 도구를 사용하는 사전, 사후 처리는 시간과 컴퓨팅 성능을 저해합니다.

그러나 개발자에게 50개 이상의 고성능 컴퓨터 비전 알고리즘을 제공하는 CV-CUDA는 AI 파이프라인의 병목 현상을 제거하기 위해 맞춤형 커널(kernel)과 제로 카피 인터페이스를 쉽게 구현할 수 있는 개발 프레임워크입니다.

따라서 CV-CUDA는 처리량을 증가시키고 클라우드 컴퓨팅 비용을 절감할 수 있죠. 또한 단일 GPU 대비 스트림을 10배 이상 처리할 수 있습니다.

이 모든 요소들은 개발자들이 영상 콘텐츠 제작, 3D 세계, 이미지 기반 추천 시스템, 이미지 인식과 화상 회의를 처리하는 작업을 훨씬 더 빠르게 도와줍니다.

영상 콘텐츠 생성 플랫폼은 매일 수백만 개의 영상 스트림을 처리, 개선, 조정해야 하며 모바일 기반 사용자가 모든 전화기에서 앱을 편하게 실행할 수 있도록 해야 합니다.

3D 세계 또는 메타버스 애플리케이션을 구축하는 이들에게 CV-CUDA는 3D 세계와 그 구성 요소를 구축하거나 확장하는 데 도움이 될 것으로 기대됩니다.
이미지 이해와 인식 기능에서, CV-CUDA는 하이퍼스케일로 실행되는 파이프라인의 속도를 크게 높이기 때문에 모바일 사용자가 정교하고 반응성이 뛰어난 이미지 인식 애플리케이션을 즐길 수 있게 해줍니다.
그 외에도 화상 회의에서 CV-CUDA는 정교한 증강 현실 기반 기능을 지원할 수 있습니다. 이런 여러 기능 중에는 수많은 사전, 사후 처리 단계가 필요한 복잡한 AI 파이프라인이 포함될 수 있습니다.

CV-CUDA는 손으로 최적화된 CUDA 커널을 통해 사전 및 사후 처리 파이프라인을 가속화하며 C/C++, 파이썬(Python), 파이토치(PyTorch)와 같은 일반적인 딥 러닝 프레임워크에 기본적으로 통합됩니다.

CV-CUDA는 3D 워크플로우를 위한 가상 세계 시뮬레이션 및 협업 플랫폼인 NVIDIA Omniverse에서 AI 워크플로우를 가속화할 수 있는 핵심 기술 중 하나입니다.

개발자들은 12월에 코드에 얼리 액세스가 가능하며, 베타 릴리스는 내년 3월로 예정되어 있습니다.

더 자세한 내용은 얼리 액세스 관련 홈페이지 여기를 참조하세요.