AMD, ‘SC19’서 클라우드 위한 최상의 슈퍼컴퓨터·HPC 성능 공개
상태바
AMD, ‘SC19’서 클라우드 위한 최상의 슈퍼컴퓨터·HPC 성능 공개
  • 강석오 기자
  • 승인 2019.11.20 19:30
  • 댓글 0
이 기사를 공유합니다

2세대 AMD 에픽 프로세서, 샌디에이고 슈퍼컴퓨터 센터·스위스 ETH·AWS 등에 공급
아토스·GENCI 시스템에 도입되며 최신 슈퍼컴퓨터 500대 리스트 진입

[데이터넷] AMD가 슈퍼컴퓨팅 최대 연례 행사인 슈퍼컴퓨팅 2019(SC19)에서 전 세계 최상위 연구 시스템과 다수의 새로운 플랫폼에 AMD 에픽(EPYC) 프로세서 및 라데온 인스팅트(Radeon Instinct) 가속 카드 지원을 발표하며 고성능 컴퓨팅(HPC) 분야의 리더십을 강화하고 나섰다. 더불어 AMD는 새롭게 공개한 ROCm 3.0을 통해 새로운 컴파일러 및 HPC 애플리케이션도 지원하고 나섰다.

AMD 수석 부사장 겸 최고기술책임자(CTO) 마크 페이퍼마스터(Mark Papermaster)는 “AMD는 2021년 출시되는 세계 최고 성능의 프론티어 슈퍼컴퓨터에 탑재될 프로세서 공급자로 SC19에 참여하게 됐다”며 “이번 행사에 참가자들은 엑사스케일급 시스템의 기반이 될 AMD 기술을 경험할 수 있고, 현장에서 고성능 AMD 에픽 CPU와 라데온 인스팅트 GPU가 함께 최고의 속도에서 구동되는 것부터 AMD 오픈 소프트웨어 생태계까지 모두 공개된다”고 전했다.

2세대 AMD 에픽 프로세서
2세대 AMD 에픽 프로세서

새로운 아마존 EC2 인스턴스에 2세대 AMD 에픽 탑재
아마존웹서비스(AWS)는 곧 출시 예정인 두 개의 아마존 엘라스틱 컴퓨트 클라우드(EC2) 인스턴스를 공개하며 AMD 에픽 프로세서 도입을 확대한다고 발표했다. 새로운 인스턴스인 C5a와 C5ad는 2세대 AMD 에픽 프로세서를 탑재해 최대 3.3Ghz 속도로 구동된다.

이 두 인스턴스는 최대 96 vCPU와 함께 여덟 개의 가상화된 크기로 제공돼 고객이 일괄 처리, 분산 애널리틱스, 웹 애플리케이션을 비롯한 다양한 컴퓨팅 워크로드에 대한 비용과 성능 모두 최적화할 수 있도록 추가적인 선택권을 제공한다. 또한 베어메탈로 구성돼 고객이 기본 서버의 프로세서 및 메모리 리소스에 직접 액세스 가능한 애플리케이션을 실행할 수 있도록 지원한다.

C5a 및 C5ad 베어메탈 인스턴스는 100Gbps의 네트워크 대역폭을 활용할 수 있고 인스턴스용 저지연 네트워크 어댑터인 엘라스틱 패브릭 어댑터와 호환돼 고객이 고성능 컴퓨팅 및 기타 대용량 워크로드를 확장할 수 있도록 지원한다. 이러한 새로운 인스턴스는 여러 AWS 리전에 출시될 예정이다.

AMD 에픽 슈퍼컴퓨터 지원 확장으로 세계 최고 슈퍼컴퓨터 톱500 진입
HPC 기관들은 더욱 강력하고 효율적인 슈퍼컴퓨팅 시스템을 위해 지속적으로 2세대 AMD 에픽 프로세서와 라데온 인스팅트 가속 카드를 채택하고 있다.

2세대 에픽 프로세서는 경쟁 솔루션 대비 2배 높은 제조 애플리케이션 성능과 최대 60% 빠른 생명 과학 시뮬레이션 성능을 제공한다. 라데온 인스팅트 GPU 가속 카드는 HPC 워크로드에서 이론적으로 최대 6.6 TFLOPS 더블 프리시전(Double Precision) 성능을 제공한다. 더불어 두 제품은 PCIe 4.0을 지원해 이기종 시스템 전반에서 더 빠른 컴퓨팅을 위한 고대역폭을 제공한다.

디지털 트랜스포메이션 전문기업 아토스(ATOS)는 2세대 에픽 프로세서 기반 두 대의 불세쿼나(BullSequana) XH2000 슈퍼컴퓨터를 일기 예보와 대기학, 해양학, 기후 과학에 대한 연구를 진행하는 메테오-프랑스(Météo-France)에 공급한다.

아토스와 프랑스 국가 고성능 컴퓨팅 기관인 GENCI는 CEA 팀이 운영하고 있는 TGCC 컴퓨팅 센터에 위치한 줄리오-퀴리(Joliot-Curie) 슈퍼컴퓨터에 아토스의 불세쿼나 XH2000 솔루션과 2세대 에픽을 탑재했다.

줄리오-퀴리 슈퍼컴퓨터는 세계 최고 슈퍼컴퓨터 톱500의 54번째 에디션에 추가됐으며, 64코어 280W의 AMD 에픽 7H12가 탑재된 슈퍼컴퓨터 중 최초로 글로벌 랭킹에 올랐다.

HPE의 크레이는 2세대 AMD 에픽 프로세서를 탑재하고 샤스타(Shasta) 슈퍼컴퓨터 아키텍처를 기반으로 한 2대의 새로운 슈퍼컴퓨터 아처2(ARCHER2)와 벌칸(Vulcan)을 공개했다. 델테크놀로지스는 샌디에이고 슈퍼컴퓨터 센터의 익스팬스(Expanse) 슈퍼컴퓨터에 2세대 에픽 프로세서가 탑재된 델 EMC 파워엣지 서버를 공급한다.

취리히 공대는 오일러(Euler) VI 시스템에 AMD 에픽 7742 프로세서를 탑재했고, NEC는 독일 기상청에 NEC SX-오로라 TSUBASA 벡터 엔진과 함께 2세대 에픽 프로세서가 탑재된 시스템을 공급한다.

AMD 에픽으로 클라우드로 슈퍼컴퓨팅 확장
HPC 산업은 새로운 워크로드, 더 높은 성능에 대한 요구, 그리고 더욱 손쉬운 장기적 또는 단기적 사용을 지원하도록 변화하고 있다. 이러한 변화는 클라우드를 통해 실행되고 있으며, 이는 사용자가 사내 장비로 구현할 수 있었던 것과 비교해 더 낮은 비용으로 동일한 성능을 제공한다.

마이크로소프트 애저(Azure)는 1세대 AMD 에픽 프로세서 기반 시스템에서 실행되는 애저 HB 클라우드 인스턴스를 활용해 새로운 수준의 컴퓨터 유체 역학(CFD) 성능을 발표했다. 애저는 고성능 컴퓨팅을 위한 애저 HBv2 가상머신을 소개하며 클라우드에서 HPC의 경계를 더욱 확장시켜나가고 있다. AMD 에픽 7742 프로세서를 기반으로 한 이 가상 머신은 클라우드를 통해 쉽고 간편하게 2000Gbps HDR 인피니밴드와 단일 워크로드에 최대 8만 개의 코어를 지원한다.

ROCm 3.0 공개 … 하드웨어 생태계 확장
프리-엑사스케일(pre-exascale) 소프트웨어 생태계에 대한 커뮤니티의 지원은 계속되고 있으며, 이러한 생태계는 AMD가 제공하는 GPU 컴퓨팅을 위한 기본 오픈 소스 구성 요소인 ROCm 을 기반으로 구축됐다. ROCm 개발 사이클은 매달 개발자에게 지속적으로 컴파일러, 라이브러리, 프로파일러, 디버거, 시스템 관리 도구에 대한 개선사항과 업데이트를 제공한다.

ROCm 3.0은 HIP-클랭(HIP-clang) 혁신을 지원하는 한편 텐서플로우(TensorFlow), 파이토치(PyTorch) 등 강화학습, 자율주행, 이미지 및 비디오 감지 등의 응용 분야를 위한 선도적인 머신러닝 프레임워크로 ROCm을 통합했다. 또한 OpenMP 프로그래밍, LAMMPS 및 NAMD와 같은 HPC 프로그래밍 모델 및 애플리케이션에 대한 확장된 가속화 지원과 함께 쿠버네티스(Kubernetes), 싱귤래리티(Singularity), SLURM, TAU 등 시스템 및 워크로드 구축 툴에 대한 새로운 지원도 보강됐다.

HPC 시스템이 지원하는 워크로드에 대한 요구 사항이 점점 까다로워지며 CPU와 가속 카드로 구동되는 이기종 컴퓨팅의 필요성이 중요해졌다. AMD 파트너들은 기존의 CPU 전용 컴퓨팅뿐만 아니라 이와 같은 새로운 요구를 충족시키는 플랫폼을 만들고 있다.

기가바이트는 2세대 AMD 에픽 프로세서를 지원하는 4개의 G 시리즈 GPU 서버(G292-Z22, G292-Z42, G482-Z50, G482-Z51)를 발표했다. G482-Z51은 최대 8개의 PCle 4.0 GPU 카드를 지원할 수 있어 다양한 컴퓨팅 워크로드를 위한 훌륭한 ‘AMD+AMD’ 옵션을 제공한다.

세계 기록을 경신한 HPE 프로라이언트 DL325 Gen10과 385 Gen10 서버는 최대 64개의 프로세서 코어, 9% 향상된 성능을 지원하는 3200 MT/s 메모리, PCle 4.0을 지원하며 2배 향상된 I/O 대역폭, 전 세대 대비 2.4배 향상된 저장 공간 등을 통해 가상화, HPC, 빅데이터 등 핵심 워크로드에서 성능과 효율성이 대폭 개선된 새로운 Gen10 플러스 모델이 추가됐다.

최대 8개의 GPU를 지원하는 새로운 펭귄 알투스(Penguin Altus) XE4218GT를 통해 펭귄 고객은 2세대 에픽 및 라데온 인스팅트 MI50의 PCle 4.0 지원을 사용하는 ‘AMD+AMD’ 솔루션을 통해 머신러닝, 빅데이터 분석과 유사한 워크로드를 실행할 수 있다.

서버 전문 기업 타이안(Tyan) 또한 HPC에 초점을 맞춘 트랜스포트 HX 계열의 신제품, 그리고 2세대 AMD 에픽 프로세서를 기반으로 데이터베이스에 초점을 맞춘 트랜스포트 SX 계열의 제품을 발표했다.

2세대 AMD 에픽 프로세서와 라데온 인스팅트 GPU 가속 카드의 PCle 4.0 지원을 도입하며 AMD는 파트너들과의 긴밀한 협력을 통해 PCle 4.0 생태계 활성화를 주도해왔다. 2세대 AMD 에픽 프로세서는 고속 이더넷 및 인피니밴드 인터커넥트, NIC 및 스위치, 컴퓨팅 가속 카드(GPU 및 FPGA), 스토리지(NVME SSD) 장치와 같은 PCle 4.0 지원 장치를 지원한다.

한편 2세대 AMD 에픽 프로세서에 PCle 4.0 제품을 제공하는 파트너는 200기가 이더넷을 위한 브로드컴 토르 NIC, 최대 400GB/s 속도의 인피니밴드 성능을 제공하는 멜라녹스 커넥트X-6 NIC, 삼성 Gen4 PM1733 NVME SSD, 자일링스 알비오 U50/U280 FPGA 등이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.