HPC 애플리케이션 30배 가속하는 테슬라 P100 공개

by NVIDIA Korea

HPC 애플리케이션 30배 가속하는 테슬라 P100 공개

독일 프랑크푸르트에서 열리는 ISC 2016에서 들려온 새로운 소식! 인공지능, HPC(고성능컴퓨팅)등 고도의 연산 처리를 요구하는 최신 데이터센터를 위한 PCIe 서버용 ‘테슬라(Tesla®) P100’ GPU 가속기가 공개되었답니다^^

테슬라 P100은 엔비디아에서 올해 새롭게 발표한 파스칼(Pascal™) GPU 아키텍처를 통해 CPU 기반 시스템 대비 큰 폭의 성능 개선 및 효율성 향상을 제공하는데요, 특히 32개 이상의 CPU 기반 노드에 준하는 처리량을 제공하는 ‘슈퍼 노드’를 구현해 자본 및 운영 비용을 70% 이상 절감하는 것이 특징이랍니다.

테슬라 P100은 표준 PCIe 폼팩터에서 사용할 수 있으며, 최신 GPU 가속 서버와도 호환 가능합니다. 또한 연산 집약적인 AI 및 HPC 데이터센터 애플리케이션에 최적화된 성능을 자랑한답니다. 가령 단일 테슬라 P100 기반 서버는 분자동역학 시뮬레이션 프로그램 ‘앰버(AMBER)’의 구동 에 있어 50개의 CPU 전용 서버 노드보다 뛰어난 성능을 제공하며, 오스트리아 비엔나 대학의 소재과학 애플리케이션 ‘VASP’ 실행 에 있어서도 32개의 CPU 전용 노드보다 빠르답니다.

엔비디아 테슬라 가속 컴퓨팅 플랫폼의 최신 라인업인 테슬라 P100은 유럽에서 가장 빠른 슈퍼 컴퓨터인 스위스 국립 수퍼컴퓨팅센터의 ‘피즈 데인트(Piz Daint)’ 시스템의 업그레이드 버전에 연내 탑재될 예정이랍니다.

테슬라 P100의 주요 기능

• 복합 HPC 작업을 위한 탁월한 애플리케이션 성능 — 최대 4.7 테라플롭스의 배정밀도, 9.3 테라플롭스의 단정밀도 성능을 제공합니다. 단일 파스칼 기반 테슬라 P100 노드의 성능은 32개 이상의 CPU 전용 서버와 동등한 수준이랍니다.

• CoWoS 기술 및 HBM2 메모리의 전례 없는 효율성 — 테슬라 P100은 컴퓨팅 효율성을 극대화하기 위해 단일 패키지에 프로세서와 데이터를 통합하였습니다. 혁신적인 메모리 디자인 방식인 CoWoS(chip on wafer on substrate) 기반의 HBM2 메모리 탑재를 통해 엔비디아 맥스웰(Maxwell™) 아키텍처 대비 3배에 달하는 720GB/sec의 메모리 대역폭을 제공한답니다.

• 병렬 프로그래밍 단순화를 위한 페이지 마이그레이션 엔진(Page Migration Engine) — 향상된 성능 제공 및 데이터 이동 관리를 위한 시스템 유지 보수 간소화, 그리고 가상 메모리 페이징 지원을 통해 GPU의 물리적 크기 이상으로 애플리케이션을 확장할 수 있답니다. 통합 메모리 기술은 개발자로 하여금 전체 노드를 위한 단일 메모리 공간을 볼 수 있도록 해 생산성을 극대화 할 수 있어요.

• 독보적인 애플리케이션 지원 — 테슬라 플랫폼은 주요 HPC 애플리케이션 대부분을 포함한 410개의 GPU 가속 애플리케이션을 지원하는 업계 최고의 호환성을 자랑합니다.

“테슬라 P100 가속기는 우리 시대의 가장 중요한 연산 문제를 해결하기 위한 새로운 차원의 성능과 효율성을 제공해줍니다. 특히 피즈 데인트(Piz Daint)에 탑재된 4,500개 GPU 가속 노드를 테슬라 P100로 업그레이드할 경우, 시스템 성능을 두 배 이상 향상시키며 우주론, 소재 과학, 지진학, 기후학 등 다양한 연구 분야에 새로운 돌파구를 제공할 수 있을 것입니다”

공과대학 ETH 취리히의 전산물리학 교수이자 스위스 국립 슈퍼컴퓨팅 센터 디렉터인 토마스 슐테스(Thomas Schulthess) 박사는 위와 같이 테슬라 P100의 성능에 대해 놀라움을 감추지 않았죠.

그리고  PCIe용 테슬라 P100 세부 사양도 한번 알아볼까요?

 

• 엔비디아 GPU 부스트(GPU BOOST™) 기술에 의한 4.7 테라플롭스 배정밀도 성능, 9.3 테라플롭스 단정밀도 성능 및 18.7 테라플롭스 반정밀도 성능
• PCIe Gen 3 상호 연결 지원 (32GB/sec 양방향 대역폭)
• 페이지 마이그레이션 엔진 및 통합 메모리를 통한 프로그래밍 향상
• 신뢰성 향상을 위한 ECC 보호
• 데이터센터의 처리량 및 신뢰성 극대화를 위한 서버 최적화
• 두 가지 구성에서 사용 가능:
– 720GB/sec의 메모리 대역폭을 제공하는 16GB CoWoS HBM2 적층 메모리
– 540GB/sec의 메모리 대역폭을 제공하는 12GB CoWoS HBM2 적층 메모리

PCIe 기반 시스템을 위한 엔비디아 테슬라 P100 GPU 가속기는 2016년 4분기부터 이용 가능합니다. 크레이(Cray), 델(Dell), HPE(Hewlett Packard Enterprise), IBM, SGI 등 엔비디아 리셀러 파트너 및 서버 제조업체를 통해 구입할 수 있으니 많은 기대 부탁드려요^^