산업 전반에 걸쳐 AI는 기계 기반 계산을 통해 혁신을 가속화하고 있습니다. 금융 업계에서는 은행들이 AI를 사용하여 금융 사기를 더 빨리 탐지하고 계좌를 안전하게 보호하고, 통신사는 네트워크를 개선하여 우수한 서비스를 제공하고, 과학자들은 희귀 질환에 대한 새로운 치료법을 개발하고, 유틸리티 회사는 더 깨끗하고 안정적인 에너지 그리드를 구축하고, 자동차 회사는 자율 주행 자동차를 운전자가 더욱 안전하고 쉽게 이용할 수 있도록 만들고 있습니다.
최고의 AI 활용 사례들의 근간은 바로 데이터에 있습니다. 효과적이고 정밀한 AI 모델을 구축하려면 광범위한 데이터 세트에 대한 학습이 필요합니다. AI의 힘을 활용하고자 하는 기업은 다양한 소스에서 데이터를 추출하고 일관된 형식으로 변환하여 효율적으로 저장하는 데이터 파이프라인을 구축해야 합니다.
데이터 사이언티스트는 여러 테스트를 통해 데이터 세트를 개선하여 실제 애플리케이션에서 최적의 성능을 발휘하도록 AI 모델을 파인튜닝합니다. 음성 어시스턴트부터 개인화된 추천 시스템에 이르기까지 이러한 애플리케이션들은 실시간 AI 성능을 위해 대량의 데이터를 빠르게 처리해야 합니다.
AI 모델이 더욱 복잡해지고 텍스트, 오디오, 이미지, 비디오 등 다양한 데이터 유형을 처리하기 시작하면서 신속한 데이터 처리의 필요성이 더욱 중요해지고 있습니다. 레거시 CPU 기반 컴퓨팅에 계속 의존하는 조직은 데이터 병목 현상, 데이터센터 비용 증가, 컴퓨팅 성능 부족으로 인해 혁신과 성능 저하로 어려움을 겪고 있습니다.
많은 기업이 AI를 비즈니스에 통합하기 위해 가속 컴퓨팅으로 전환하고 있습니다. 이 방법은 GPU, 특수 하드웨어, 소프트웨어, 병렬 컴퓨팅 기술을 활용하여 컴퓨팅 성능을 최대 150배까지 향상시키고 에너지 효율을 최대 42배까지 높입니다.
다양한 분야의 선도적인 기업들이 가속화된 데이터 처리를 사용하여 혁신적인 AI 이니셔티브를 주도하고 있습니다.
금융 기관이 금융 사기를 어떻게 실시간으로 탐지하는가
금융 기관은 신속한 분석이 필요한 방대한 양의 거래 데이터로 인해 사기 패턴을 탐지하는 데 상당한 어려움을 겪고 있습니다. 또한 실제 사기 사례에 대한 레이블이 지정된 데이터가 부족하기 때문에 AI 모델을 학습시키는 데 어려움이 있습니다. 기존의 데이터 사이언스 파이프라인은 사기 탐지와 관련된 대량의 데이터를 처리하는 데 필요한 가속화가 부족합니다. 이로 인해 처리 시간이 느려져 실시간 데이터 분석 및 사기 탐지 기능이 저하됩니다.
이러한 문제를 극복하기 위해 연간 80억 건 이상의 금융 거래를 처리하고 있는 American Express는 가속화된 컴퓨팅을 사용하여 LSTM(Long Short-Term Memory) 모델을 훈련하고 배포하고 있습니다. 이러한 모델은 순차적 분석과 이상 징후 탐지에 탁월하며 새로운 데이터에 적응하고 학습할 수 있어 사기 방지에 이상적입니다.
American Express는 GPU의 병렬 컴퓨팅 기술을 활용하여 LSTM 모델의 학습 속도를 크게 높였습니다. 또한 GPU는 실시간 모델이 방대한 양의 거래 데이터를 처리하여 실시간으로 사기를 탐지하는 고성능의 연산을 수행할 수 있도록 지원합니다.
이 시스템은 2밀리초 이내의 지연 시간으로 작동하여 고객과 판매자를 더욱 효과적으로 보호하며, CPU 기반 구성에 비해 50배 향상된 성능을 제공합니다. American Express는 가속화된 LSTM 딥 뉴럴 네트워크를 기존 방식과 결합하여 특정 구간에서 사기 탐지 정확도를 최대 6%까지 향상시켰습니다.
또한 금융 회사는 가속 컴퓨팅을 사용해 데이터 처리 비용을 절감할 수 있습니다. PayPal은 데이터가 많은 Spark3 워크로드를 NVIDIA GPU에서 실행하여 빅데이터 처리와 AI 애플리케이션에 대한 클라우드 비용을 최대 70%까지 절감할 수 있는 가능성을 확인했습니다.
금융 기관은 데이터를 보다 효율적으로 처리함으로써 실시간으로 사기를 탐지하여 거래 흐름을 방해하지 않고 더 빠른 의사 결정을 내리고 재정적 손실 위험을 최소화할 수 있습니다.
복잡한 라우팅 작업을 간소화하는 통신사
통신 사업자는 네트워크 장치, 고객과의 상호 작용, 청구 시스템, 네트워크 성능과 유지 관리 등 다양한 소스에서 엄청난 양의 데이터를 생성합니다.
매일 수백 페타바이트의 데이터를 처리하는 전국적인 네트워크를 관리하려면 서비스 제공을 보장하기 위해 기술자의 복잡한 라우팅 작업이 필요합니다. 기술자 파견을 최적화하기 위해 고급 라우팅 엔진은 날씨, 기술자 기술, 고객 요청, 차량 분포 등의 요소를 고려하여 수조 건의 연산을 수행합니다. 이러한 작업의 성공 여부는 세심한 데이터 준비와 충분한 컴퓨팅 성능에 달려 있습니다.
미국 최대 규모의 현장 파견팀을 운영하며 고객 서비스를 제공하는 AT&T는 휴리스틱, 메타휴리스틱 및 최적화를 통해 복잡한 차량 경로 문제를 계산하는 NVIDIA cuOpt를 통해 데이터가 많은 라우팅 작업을 개선하고 있습니다.
초기 시험에서 cuOpt는 10초 만에 라우팅 솔루션을 제공하여 클라우드 비용을 90% 절감하고 기술자가 매일 더 많은 서비스 호출을 완료할 수 있도록 했습니다. 데이터 사이언스와 분석 파이프라인을 가속화할 수 있는 소프트웨어 라이브러리 제품군인 NVIDIA RAPIDS는 기업이 지속적인 경로 최적화를 위해 로컬 검색 휴리스틱과 Tabu 검색과 같은 메타 휴리스틱을 통합할 수 있도록 하여 cuOpt를 더욱 가속화하고 있습니다.
AT&T는 Spark 기반 AI와 데이터 파이프라인의 성능을 향상하기 위해 Apache Spark용 NVIDIA RAPIDS 가속기를 채택하고 있습니다. 이를 통해 이 회사는 AI 모델 훈련부터 네트워크 품질 유지, 고객 이탈 감소, 그리고 사기 탐지 개선에 이르기까지 모든 면에서 운영 효율성을 높일 수 있었습니다. AT&T는 RAPIDS Accelerator를 통해 타깃 워크로드에 대한 클라우드 컴퓨팅 지출을 줄이는 동시에 더 빠른 성능을 구현하고 탄소 발자국을 줄이고 있습니다.
통신사가 운영 효율성을 개선하는 동시에 최고의 서비스 품질을 제공하고자 할 때 데이터 파이프라인과 처리 속도를 가속화하는 것은 매우 중요합니다.
신약 개발 타임라인을 단축하고 있는 생물의학 연구자들
연구자들이 인간 게놈의 약 25,000개 유전자를 연구하여 질병과의 관계를 이해하기 위해 기술을 활용하면서 헬스케어 데이터와 동료 심사 연구 논문이 폭발적으로 증가했습니다. 생의학 연구자들은 이러한 논문을 통해 새로운 치료법을 찾기 위한 연구 분야를 좁혀가고 있습니다. 하지만 이렇게 방대하고 방대한 관련 연구에 대한 문헌 검토를 수행하는 것은 불가능한 일이 되었습니다.
선도적인 제약 회사인 AstraZeneca는 문헌 검토부터 스크린 적중률 평가, 표적 식별 등 신약 개발 프로세스 전반에 걸쳐 과학자들을 지원하기 위해 생물학적 인사이트 지식 그래프(BIKG)를 개발했습니다. 이 그래프는 공개 및 내부 데이터베이스를 과학 문헌의 정보와 통합하여 천만 개에서 10억 개에 이르는 복잡한 생물학적 관계를 모델링합니다.
BIKG는 유전자 순위를 매기는 데 효과적으로 사용되어 과학자들이 새로운 질병 치료를 위한 잠재력이 높은 표적을 가설하는 데 도움을 주고 있습니다. AstraZeneca팀은 NVIDIA GTC에서 폐암 치료제의 내성과 관련된 유전자를 성공적으로 식별한 프로젝트를 발표했습니다.
잠재적 유전자를 좁히기 위해 데이터 과학자와 생물학 연구자들이 협력하여 치료법 개발에서 표적으로 삼기에 이상적인 기준과 유전자 특징을 정의했습니다. 이들은 머신 러닝 알고리즘을 훈련시켜 문헌에서 치료 가능한 것으로 언급된 특정 특징을 가진 유전자를 BIKG 데이터베이스에서 검색했습니다. 연구팀은 더 빠른 계산을 위해 NVIDIA RAPIDS를 활용하여 초기 유전자 풀을 3,000개에서 단 40개의 표적 유전자로 줄였으며, 이전에는 몇 달이 걸렸던 작업을 이제 단 몇 초 만에 완료할 수 있게 되었습니다.
가속 컴퓨팅과 AI로 신약 개발을 보완함으로써 제약 회사와 연구자들은 의료 분야에 축적된 방대한 데이터를 활용하여 더 빠르고 안전하게 신약을 개발함으로써 궁극적으로 생명을 구하는 데 영향을 미칠 수 있습니다.
청정 에너지의 미래를 구축하는 유틸리티 기업
에너지 부문에서 탄소 중립 에너지원으로 전환하려는 움직임이 활발하게 일어나고 있습니다. 지난 10년 동안 태양 에너지와 같은 재생 가능 자원을 활용하는 비용이 급격히 하락하면서 청정 에너지의 미래를 향한 실질적인 진전을 이룰 수 있는 기회가 그 어느 때보다 커졌습니다.
하지만 풍력 발전소, 태양광 발전소, 가정용 배터리의 청정 에너지를 통합하려는 방향으로의 전환은 전력망 관리에 새로운 복잡성을 가져왔습니다. 에너지 인프라가 다양해지고 양방향 전력 흐름을 수용해야 하는 상황에서 그리드 관리는 더욱 데이터 집약적이 되었습니다. 이제 새로운 스마트 그리드는 자동차 충전을 위한 고전압 영역을 처리해야 합니다. 또한 분산 저장된 에너지원의 가용성을 관리하고 네트워크 전반의 사용량 변화에 적응해야 합니다.
유명 그리드 엣지 소프트웨어 회사인 Utilidata는 NVIDIA와 협력하여 맞춤형 NVIDIA Jetson Orin edge AI 모듈을 사용하여 그리드 엣지를 위한 분산형 AI 플랫폼인 Karman을 개발했습니다. 전기 계량기에 내장된 이 맞춤형 칩과 플랫폼은 각 계량기를 초당 수천 개의 데이터 포인트를 처리할 수 있는 데이터 수집 및 제어 지점으로 전환합니다.
Karman은 네트워크 엣지에서 계량기의 실시간 고해상도 데이터를 처리합니다. 이를 통해 유틸리티 회사는 그리드 상태에 대한 상세한 인사이트를 얻고, 사용량을 예측하며, 몇 분 또는 몇 시간이 아닌 몇 초 만에 분산된 에너지 자원을 원활하게 통합할 수 있습니다. 또한 네트워크 사업자는 엣지 디바이스의 추론 모델을 통해 회선 장애를 예측하고 신속하게 식별하여 잠재적인 정전을 예측하고 예방적 유지보수를 수행하여 그리드 안정성을 높일 수 있습니다.
AI와 가속화된 데이터 분석의 통합을 통해 Karman은 유틸리티 제공업체가 기존 인프라를 효율적인 스마트 그리드로 전환할 수 있도록 지원합니다. 이를 통해 광범위한 물리적 인프라 업그레이드 없이도 변동하는 수요 패턴을 충족하는 맞춤형 국지적 전력 분배가 가능해져 보다 비용 효율적으로 전력망을 현대화할 수 있습니다.
자동차 제조업체, 더 안전하고 접근성이 뛰어난 자율 주행 자동차 구현
자동차 회사들이 완전한 자율주행 기능을 구현하기 위해 노력함에 따라 자동차는 물체를 감지하고 실시간으로 내비게이션을 수행할 수 있어야 합니다. 이를 위해서는 카메라, 라이더, 레이더, GPS의 실시간 데이터를 도로 안전을 위한 내비게이션 결정을 내리는 AI 모델에 공급하는 등 고속 데이터 처리 작업이 필요합니다.
자율 주행을 위한 추론 워크플로우는 매우 복잡하며, 여러 AI 모델과 함께 필요한 전처리와 후처리 단계가 포함됩니다. 기존에는 이러한 단계를 클라이언트 측에서 CPU를 사용하여 처리했습니다. 그러나 이는 처리 속도에 심각한 병목 현상을 초래할 수 있으며, 이는 빠른 처리가 안전과 직결되는 애플리케이션에서는 용납할 수 없는 단점이 됩니다.
자율 주행 워크플로우의 효율성을 향상시키기 위해 전기 자동차 제조업체인 NIO는 추론 파이프라인에 NVIDIA Triton 추론 서버를 통합했습니다. NVIDIA Triton은 오픈 소스, 멀티 프레임워크, 추론 지원 소프트웨어입니다. 데이터 처리 작업을 중앙 집중화함으로써 NIO는 일부 핵심 영역에서 지연 시간을 6배까지 단축하고 전체 데이터 처리량을 최대 5배까지 증가시켰습니다.
NIO의 GPU 중심 접근 방식 덕분에 차량 자체에서 아무것도 변경할 필요 없이 새로운 AI 모델을 쉽게 업데이트하고 배포할 수 있었습니다. 또한 네트워크를 통해 데이터를 주고받을 필요 없이 동일한 이미지 세트에 여러 AI 모델을 동시에 사용할 수 있어 데이터 전송 비용을 절감하고 성능을 개선할 수 있었습니다.
자율 주행 자동차 소프트웨어 개발자는 가속화된 데이터 처리를 사용하여 고성능 표준에 도달함으로써 교통사고를 방지하고 운송 비용을 절감하며 사용자의 이동성을 개선할 수 있습니다.
소매업체의 수요 예측 향상
빠르게 변화하는 리테일 환경에서 데이터를 신속하게 처리하고 분석하는 능력은 재고 수준을 조정하고 고객과의 상호작용을 개인화하며 가격 전략을 즉각적으로 최적화하는 데 매우 중요합니다. 소매업체의 규모가 크고 취급하는 제품이 많을수록 데이터 운영은 더 복잡하고 컴퓨팅 집약적입니다.
세계 최대 소매업체인 Walmart는 4,500개 매장에서 5억 개의 품목 조합에 대한 예측 정확도를 크게 향상시키기 위해 가속화된 컴퓨팅을 도입했습니다.
Walmart의 데이터 사이언스팀이 이 거대한 예측 과제를 해결하기 위해 더욱 강력한 머신 러닝 알고리즘을 구축하면서 기존 컴퓨팅 환경은 작업이 완료되지 않거나 부정확한 결과를 생성하는 등 불안정해지기 시작했습니다. 이 회사는 데이터 사이언티스트들이 작업을 완료하기 위해 알고리즘에서 기능을 제거해야 한다는 사실을 알게 되었습니다.
수요 예측의 정확성을 향상시키기 위해 Walmart는 NVIDIA GPU와 RAPID를 사용하기 시작했습니다. 이제 이 회사는 350개의 데이터 기능이 포함된 예측 모델을 사용하여 모든 제품 카테고리의 매출을 예측합니다. 이러한 기능에는 판매 데이터, 프로모션 이벤트, 수요에 영향을 미치는 기상 조건, 그리고 슈퍼볼과 같은 주요 이벤트와 같은 외부 요인들이 포함됩니다.
Walmart는 고급 모델을 통해 예측 정확도를 94%에서 97%로 개선하는 동시에 약 1억 달러에 달하는 신선 식품 폐기물을 없애고 품절 및 가격 인하 시나리오를 줄일 수 있었습니다. 또한 GPU는 CPU 환경에서는 몇 주가 걸렸을 작업을 단 4시간 만에 완료하여 모델을 100배 더 빠르게 실행했습니다.
데이터 집약적인 작업을 GPU와 가속화된 컴퓨팅으로 전환함으로써 소매업체는 비용과 탄소 발자국을 모두 낮추는 동시에 쇼핑객들에게 최적의 선택과 더 낮은 가격을 제공할 수 있습니다.
공공 부문의 재난 대비 능력 향상
드론과 위성은 공공 및 민간 기관에서 날씨 패턴을 예측하고 동물의 이동을 추적하며 환경 변화를 관찰하는 데 사용하는 방대한 양의 항공 이미지 데이터를 캡처합니다. 이 데이터는 농업, 재난 관리, 기후 변화 대응과 같은 분야에서 보다 정보에 입각한 의사결정을 내릴 수 있게 해주는 연구 및 계획에 매우 유용합니다. 그러나 특정 위치 메타데이터가 없는 경우 이러한 이미지의 가치는 제한될 수 있습니다.
엔비디아와 협력하는 한 연방 기관은 수색 및 구조, 자연재해 대응, 환경 모니터링과 같은 임무에 필수적인 지리 공간 메타데이터가 누락된 이미지의 위치를 자동으로 정확히 찾아낼 수 있는 방법이 필요했습니다. 그러나 메타데이터가 없는 항공 이미지를 사용하여 넓은 지역 내에서 작은 영역을 식별하는 것은 건초 더미에서 바늘을 찾는 것과 같이 매우 어려운 일입니다. 지리적 위치를 지원하도록 설계된 알고리즘은 이미지 조명의 변화와 다양한 시간, 날짜, 각도에서 촬영된 이미지로 인한 차이를 해결해야 합니다.
지오태그가 없는 항공 이미지를 식별하기 위해 NVIDIA, 부즈 앨런, 정부 기관은 컴퓨터 비전 알고리즘을 사용하여 이미지 픽셀 데이터에서 정보를 추출하여 이미지 유사성 검색 문제를 확장하는 솔루션을 개발하기 위해 협력했습니다.
이 문제를 해결하려고 시도할 때 NVIDIA 솔루션 설계자는 먼저 Python 기반 애플리케이션을 사용했습니다. 처음에는 CPU에서 실행되었기 때문에 처리에 24시간 이상이 걸렸습니다. GPU는 CPU에서 몇 가지 작업만 수행하는 데 비해 수천 개의 데이터 연산을 병렬로 수행하여 이를 단 몇 분으로 단축했습니다. 애플리케이션 코드를 오픈 소스 GPU 가속 라이브러리인 CuPy로 전환함으로써 이 애플리케이션은 67마이크로초 만에 결과를 반환하는 180만 배의 놀라운 속도 향상을 경험했습니다.
단 몇 분 만에 대규모 토지의 이미지와 데이터를 처리할 수 있는 솔루션을 통해 조직은 긴급 상황에 보다 신속하고 효과적으로 대응하고 선제적으로 계획하는 데 필요한 중요한 정보에 액세스하여 잠재적으로 생명을 구하고 환경을 보호할 수 있습니다.
AI 이니셔티브 가속화와 비즈니스 성과 제공
데이터 처리에 가속화된 컴퓨팅을 사용하는 기업은 AI 이니셔티브를 발전시키고 경쟁사보다 더 높은 수준의 혁신과 성과를 달성할 수 있는 입지를 다지고 있습니다.
가속 컴퓨팅은 대규모 데이터 세트를 더 효율적으로 처리하고, 더 빠르게 모델을 학습하고 최적의 알고리즘을 선택할 수 있으며, 라이브 AI 솔루션에서 더 정확한 결과를 도출할 수 있도록 지원합니다.
이를 사용하는 기업은 기존 CPU 기반 시스템에 비해 뛰어난 가성비를 달성하고 고객, 직원, 파트너에게 뛰어난 결과와 경험을 제공할 수 있는 역량을 강화 시킬 수 있습니다.
가속 컴퓨팅이 조직이 AI 목표를 달성하고 혁신을 추진하는 데 어떻게 도움이 되는지 알아보세요.