금융시장 리스크 관리 벤치마크에서 신기록을 세운 NVIDIA DGX

처리량, 성능, 확장성으로 STAC-A2 벤치마크 위험 모델에서 신기록을 세운 NVIDIA DGX A100은 눈부신 효율성을 제공합니다
by NVIDIA Korea

시장 변동성이 높아지면서 금융 리스크 관리자들은 더욱 빠르고 정확한 시장 분석을 찾고 있습니다. 이제 가장 빠른 병렬 컴퓨팅 시스템에서 구동되는 고급 리스크 알고리즘이 그 해결안을 제시합니다.

레드햇(Red Hat) 소프트웨어를 실행하는 NVIDIA DGX A100 시스템이 리스크 플랫폼을 위한 최첨단 기술을 강화하면, 금융 서비스 기업이 성능과 운영 측면에서 혜택을 받게 될 것입니다. NVIDIA DGX A100이 사용한 에너지와 공간은 최근 벤치마크 테스트에서 경쟁 서버가 사용한 것에 비해 극히 일부에 불과했죠.

각각 640GB GPU 메모리를 갖춘 최신 NVIDIA DGX 시스템은 에너지, 공간 효율면에서 신기록을 얻은 것은 물론, 금융 업계에서 널리 주목받는 금융 리스크 모델에 대한 STAC-A2 벤치마크의 8개 부문에서 기록을 달성했습니다.

미국 뉴욕의 월스트리트와 글로벌 금융 업계의 일부 대기업들은 STAC-A2를 컴퓨팅 플랫폼 성능을 측정하는 핵심 리스크 모델 벤치마크로 사용하는데요.

이것은 검증된 컨테이너를 기반으로 한 솔루션에 대해 최초로 공개된 STAC-A2 결과이기도 하죠. 오픈소스 컨테이너 조정 플랫폼인 쿠버네티스(Kubernetes)는 사실상 컨테이너형 워크로드에 대한 관리 표준이 됐습니다. 이는 복잡한 다단계 워크플로우 구축에 필수적인데요. 레드햇의 오픈시프트(OpenShift) 소프트웨어는 업계 최고의 엔터프라이즈용 쿠버네티스 플랫폼입니다.

STAC-A2 결과에 따르면, 최신 배포 모델과 레드햇을 통합해 가장 까다로운 엔터프라이즈 성능 요구사항을 충족하는 쿠버네티스 환경을 제공하는 데 있어서 DGX A100 시스템은 뛰어난 유연성을 보였습니다.

처리량을 15배 향상시킨 NVIDIA DGX A100

640GB GPU 메모리를 갖춘 최신 NVIDIA DGX A100 시스템은 STAC-A2 벤치마크에서 측정한 바처럼 최근에 테스트한 단일 표준 CPU 서버인 듀얼 소켓 CPU 기반 시스템(2)를 기반으로 한 솔루션보다 처리량(초당 가격 책정 옵션 수)(1)이 14.8배 증가했습니다. 또한 10개의 CPU 전용 클라우드 노드(3)와 8배 빠른 듀얼 소켓 CPU 기반 서버를 기반으로 이전에 테스트한 시스템보다 훨씬 뛰어납니다(4).

NVIDIA의 기록적인 테스트 결과는 STAC(Securities Technology Analysis Center)로부터 검증을 받았습니다. 세계 유수의 은행, 헤지 펀드, 금융 서비스 기술 기업 450개 이상으로 이루어진 STAC 벤치마크 위원회는 벤치마크 구성에 기여하고 있는데요. 여기에서 STAC 보고서를 확인할 수 있습니다.

운영비 절감을 위한 효율성 향상

금융 기관 전체에 걸쳐 대형은행, 헤지펀드, 리스크 관리자들은 데이터 처리량 향상은 물론 운영효율성 향상을 통해 이익을 얻을 것으로 기대됩니다.

데이터 센터의 시스템에 대한 에너지, 공간 비용 절감은 운영비에 큰 영향을 미치는데요. IT 기관이 새로운 시스템을 지원하기 위한 예산 지출을 편성할 때 이런 부분이 특히 중요합니다.

640GB의 GPU 메모리(5)를 갖춘 최신 DGX A100 시스템으로 절감되는 운영비는 다음과 같습니다.

  • 에너지 효율6배 향상(6)
  • 2018년에 테스트한 CPU 기반 클러스터 시스템 대비 공간 효율성 2배 향상, 최근에 테스트한 CPU 기반 시스템 대비 공간 효율성 4배 향상(7).

STAC-A2에 대한 이해

STAC-A2 시장 리스크 벤치마크는 시간이 지남에 따라 금리와 기타 보안 가격 요인의 변동을 시뮬레이션 하여 옵션 가격에 미치는 영향을 평가합니다. 중요한 단계 중 하나는 <그림 1>에 표시된 기본 보안 가격 경로에 대한 시뮬레이션인데요. STAC 벤치마크에는 보안별로 분류된 이러한 보안 가격 경로 (수십만개는 아니더라도) 수 천개를 개선하는 컴퓨팅 작업이 포함됩니다.

이러한 시뮬레이션 결과는 금융 업계에서 “그릭스(The Greeks)”로 알려진 리스크 점수를 구성하는 민감도 계산에 사용됩니다.

STAC-A2는 롱스태프-슈워츠 몬테카를로(Longstaff-Schwartz Monte Carlo)라는 재무 분석 기법을 적용하여 다중 애셋에 대한 옵션 가격 민감도를 시뮬레이션합니다

롱스태프-슈워츠 방법(만기일로부터 거슬러 올라가는 역방향 반복 알고리즘)으로 몬테카를로 시뮬레이션(그림 1과 같은 확률 분포를 무작위로 샘플링)을 사용하면 옵션 가격 단계를 하나씩 해결할 수 있는데요.

이 기술을 통해 금융 서비스 기업들은 현재 보유분의 미래 리스크와 잠재적 거래 리스크를 계산할 수 있습니다.

STAC-A2를 갈아치운 NVIDIA DGX

640GB GPU 메모리를 갖춘 DGX A100(8)은 단지 조금만 향상된 것이 아닙니다. NVIDIA에 기반하지 않은 가속 시스템이 보여준 이전 최고 수치와 비교하면, 처리량(9)이 3배 늘고, 그릭스 벤치마크(10) 속도가 2.6배 빨라져 엄청난 성능 변화를 이뤘습니다.

NVIDIA는 대규모 문제를 해결하는 시간에서도 신기록을 세웠는데요. 이는 NVIDIA에 기반하지 않은 가장 빠른 시스템(8개 노드 CPU 기반 클러스터)에 비해 그릭스 벤치마크에서 2.3배 빠른 속도입니다(11).

DGX 시스템은 항상 규모에 맞는 성능을 보여왔기 때문에 시뮬레이션할 수 있는 최대 애셋과 경로 수에 대해 신기록을 세웠다고 해도 크게 놀랍지 않은데요. 최신 DGX 시스템은 작업량이 애셋 수에 따라 2차 함수로 증가하더라도 테스트에서 NVIDIA 가 아닌 시스템에서 최고의 결과를 보여준 애셋보다 2배 이상의 작업량을 처리할 수 있으며, 최근에 테스트한 CPU 기반 서버보다 20배 더 많은 경로를 처리할 수 있습니다(14).

NVIDIA DGX는 세계에서 가장 까다로운 컴퓨팅 문제를 규모에 맞게 효율적으로 해결하도록 설계됐습니다. 최근 STAC-A2 결과는 DGX가 이런 비전을 실현할 수 있다는 것을 뚜렷하게 보여줬습니다.

NVIDIA DGX 시스템에 대해 더욱 자세히 살펴보세요.

1 STAC-A2.β2.HPORTFOLIO.SPEED
2 SUT ID 210315
3 SUT ID INTC210331
SUT ID INTC181012
5 SUT ID NVDA210914
6 STAC-A2.β2.HPORTFOLIO.ENERGY_EFF vs. the Ice Lake based server SUT ID INTC210315
7 STAC-A2.β2.HPORTFOLIO.SPACE_EFF vs. SkyLake cluster SUT ID INTC181012, Ice Lake SUT ID INTC210315
SUT ID NVDA210914
STAC-A2.β2.HPORTFOLIO.SPEED vs. the 10 node cloud cluster SUT ID INTC210331
10 STAC-A2.β2.GREEKS.WARM vs. an 8x NEC Vector Engine SUT ID NEC210422
11 STAC-A2.β2.GREEKS.10-100k-1260.TIME.WARM vs.Skylake cluster SUT ID INTC181012
12 STAC-A2.β2.GREEKS.MAX_PATHS and STAC-A2.β2.GREEKS.MAX_ASSETS
13 STAC-A2.β2.GREEKS.MAX_ASSETS vs. the 8 way Skylake cluster SUT ID INTC181012
14 STAC-A2.β2.GREEKS.MAX_PATHS vs. the Ice Lake based server SUT ID INTC210315