[칼럼] 에너지 효율성 높아진 ‘슈퍼컴퓨터’, 전문 분야 넘어 민간 활용 확대
상태바
[칼럼] 에너지 효율성 높아진 ‘슈퍼컴퓨터’, 전문 분야 넘어 민간 활용 확대
  • 데이터넷
  • 승인 2022.11.15 09:30
  • 댓글 0
이 기사를 공유합니다

AMD, 에픽 프로세서·인스팅트 GPU 가속기 에너지 효율성 혁신해 지속가능성 지원 강화
피터 챔버스(Peter Chambers)AMD 아시아 태평양 지역 매니징 디렉터
▲ 피터 챔버스 ​AMD 아태지역 매니징 디렉터

[데이터넷] 과거 슈퍼컴퓨터의 활용 범위는 의료, 과학, 환경 및 인프라 건설 등 다량의 데이터 분석과 연산을 필요로 하는 연구 활동에 한정돼 있었다. 그러나 코로나19 팬데믹 이후 기업들 사이에서 인공지능(AI), 머신러닝(ML), 고성능 컴퓨팅(HPC) 등 슈퍼컴퓨터 및 컴퓨팅 클러스터 기반의 클라우드 솔루션 도입이 활성화되며 슈퍼컴퓨터는 기업 경영의 영역으로 활용도를 넓혔다.

클라우드 컴퓨팅 도입으로 기업들은 보다 많은 고객들과 효과적으로 소통하고, 더욱 유연한 방식으로 작업할 수 있게 됐으며, 이외에도 슈퍼컴퓨팅 기술은 연구개발 및 제품 개발 속도를 획기적으로 높여 사용자들이 새로운 혁신과 가능성의 지평을 넓히는 데 기여하고 있다.

일부 기업은 여전히 HPC 도입이 회사 운영 전반에 미칠 영향은 미미할 것이라는 회의적인 시각을 갖고 있다. 하지만 스토리지, 컴퓨팅, 네트워킹을 단일 시스템으로 결합해 데이터센터 운영을 효율화하는 하이퍼 컨버지드 인프라(HCI) 기술, 가상 머신(VM)을 사용해 가상 데스크톱을 제공하고 관리하는 가상 데스크톱 인프라(VDI) 기술과 함께 HPC는 이미 기업의 미래를 변화시키고 있다.

HPC는 전문 분야를 넘어 민간의 영역으로 활용 범위를 확장하는 대표적인 기술이 될 것으로 예상된다. 일례로 HPC 분야에서 특정 CPU와 GPU의 사용도가 높아지면 해당 제품은 추후 대기업과 중소기업의 경영 관리를 위한 HPC 솔루션에서도 활용될 가능성이 높다. 혁신 기술은 기업이 타사 대비 한발 앞서 나갈 수 있는 원동력과 추진력을 제공하며, 오직 기술의 가치를 먼저 알아보고 선점하는 기업만이 이점을 누릴 수 있다.

에너지 낭비 최소화 지원
시장조사업체 IDC 자료에 따르면 현재 아시아 태평양 지역은 지역 데이터센터(클러스터/허브)의 등장으로 코어에서 엣지 환경으로의 전환을 경험하고 있다. 이에 따르면, 인도네시아 기관의 약 3분의 1은 코로케이션(colocation) 공급자 선정 시 지속 가능성을 주요 고려 사항 중 하나로 보고 있으며, 재생 에너지원에 대한 투자 및 녹색 이니셔티브를 선정 기준으로 포함한다.

‘슈퍼컴퓨터’와 ‘에너지 효율’은 서로 직접적인 영향을 주지 않는다고 생각될 수 있다. 기존 슈퍼컴퓨터 구동에는 1메가와트(MW) 이상의 전기가 사용되며 전기 사용료만 수십억에 달한다. 그렇기에 차세대 슈퍼컴퓨터의 향상된 와트당 성능은 기후 변화 대응에 일조함은 물론 에너지 효율적인 차세대 제품 및 솔루션 개발에도 중요한 역할을 맡고 있다.

일례로 미국 에너지부 산하 오크리지 국립연구소(ORNL)의 HPE 프론티어(Frontier) 슈퍼컴퓨터는 3세대 AMD 에픽(EPYC) CPU와 AMD 인스팅트(Instinct) 액셀러레이터를 기반으로 1.5 엑사플롭스(exaflops) 이상의 최대 연산 능력을 제공한다. 이를 통해 전 세계 슈퍼컴퓨터 순위를 월간으로 제공하는 톱 500(Top500) 최신 리스트에서 1위를 차지했으며, 슈퍼컴퓨터 에너지 효율을 측정하는 그린 500(Green500) 최신 리스트에서도 1위를 달성했다.

이전 그린 500 1위 슈퍼컴퓨터인 일본의 MN-3가 와트당 39.38기가플롭스(gigaflops)를 제공한 반면 프론티어 슈퍼컴퓨터는 와트당 62.68기가플롭스를 기록했다. 이처럼 AMD 에픽 프로세서 및 AMD 인스팅트 액셀러레이터와 같은 최신 서버 솔루션은 세계 최고 수준의 슈퍼컴퓨터에 뛰어난 전력 효율성을 지원하고 있다.

또 핀란드 카자니(Kajaani)의 과학IT센터(CSC)가 보유한 프리 엑사스케일(pre-exascale) 머신 ‘루미(Lumi)’는 세계에서 가장 에너지 효율적인 슈퍼컴퓨터 중 하나로 와트당 51.6기가플롭스의 성능을 제공한다. 루미 슈퍼컴퓨터는 최적화된 AMD 에픽 CPU와 노드당 4개의 AMD 인스팅트 MI250X 액셀러레이터 기반의 프론티어와 유사한 시스템을 탑재했다. 톱 500 리스트에 따르면 루미는 151페타플롭스(petaflops)의 성능을 제공하며 이론적으로 초당 550페타플롭스 이상의 최고 성능을 지원한다.

프론티어 및 루미 슈퍼컴퓨터의 공통된 특징은 최적화된 3세대 에픽 CPU 및 MI250X GPU 기반의 메모리 일관성이다. 이를 통해 CPU와 GPU를 거쳐 데이터 복사본이 처리되는 과정에서 일관된 CPU-GPU 메모리를 지원함으로써 시스템 메모리에서 데이터를 읽고 쓰는 데 더 적은 전력이 사용되어 슈퍼컴퓨터가 보다 효율적으로 구동될 수 있도록 돕는다.

이와 같은 AMD 기술은 향후 몇 년 안에 서버 시장에 등장할 것으로 예상되는 혁신적인 솔루션의 대표적인 예시다. 또한 이는 CPU와 GPU가 두 개의 데이터 세트로 작업하는 데 에너지 낭비를 최소화할 뿐만 아니라 소프트웨어 개발자들로 하여금 통합된 CPU와 GPU 코드를 작성할 수 있도록 만들어준다.

한편 루미는 사용되는 열을 카자니의 지역 난방망에 활용할 수 있는 혁신적인 프리 쿨링 기술을 사용해 도시 전체의 연간 탄소 배출량을 1만2400톤 줄일 것으로 예상된다. 냉각 데이터 센터는 전체 에너지 소비량의 최대 40%까지 사용할 수 있으나 루미 슈퍼컴퓨터와 같이 냉각 시 자연 공기 흐름을 사용하고 뜨거운 공기의 재순환을 방지함으로써 궁극적으로 총 에너지 사용과 관련 배출을 감소시킬 수 있다.

환경 지속 가능성 추구
데이비드 린티컴(David Linthicum) 딜로이트 컨설팅 클라우드 전략 책임자는 “지속성이 의미하는 바는 단순히 컴퓨팅, 스토리지 및 애플리케이션의 최적화가 아니다”며 “클라우드 공급자를 포함한 많은 조직들은 전력 소비뿐만 아니라 ESG(환경, 사회, 지배구조) 기준을 통해 전반적인 지속 가능성 성과를 측정해 운영이 환경에 미치는 영향을 파악함으로써 새로운 장을 열고 있다. AMD와 같이 현재 여러 기관 및 기업이 자사는 물론 파트너 및 기타 이해관계자들도 ESG 목표에 부합하는지 공급망을 관리하고 있다”고 언급했다.

AMD 자체 조사에 따르면 1200대의 VM을 지원하기 위해서는 10대의 AMD 에픽 7713 듀얼 소켓 서버가 필요하며, 동급 경쟁사 제품은 15대의 듀얼 소켓 서버가 필요하다. 이를 통해 약 32%의 전력 사용량과 약 70톤의 온실가스 배출량을 절감할 수 있다. 또 소켓당 코어 수와 서버당 코어 수가 증가함에 따라 듀얼 또는 싱글 소켓 서버에 더 높은 연산 능력을 지원해 서버 수와 설치 공간을 줄일 수 있다.

HPC 혁신과 에너지 효율을 선도하는 AMD는 2025년까지 에픽 프로세서 및 인스팅트 GPU 액셀러레이터의 에너지 효율성을 2020년 대비 30배 증가시키기 위한 목표를 공개했다. 이는 2015-2020년 업계 평균 대비 2.5배 앞서 나간 수치이며, 해당 기간 동안 계산당 에너지 사용량을 97% 감소하는 것을 목표로 하고 있다.

비즈니스 및 IT 리더는 슈퍼컴퓨터 관련 최신 트렌드를 통해 기업의 향후 발전 방향을 확인할 수 있다. 현재의 슈퍼컴퓨터는 단순히 향상된 성능과 규모를 넘어 차세대 컴퓨팅 방식 및 AI 워크로드를 위한 기반을 마련하고 높은 전력 효율성을 통한 환경 지속 가능성을 구축하는 데 큰 역할을 맡고 있다.

비록 슈퍼컴퓨터가 비즈니스에 있어 가장 중요한 요소가 아닐 수 있으나 현재 시장을 선도하는 기업들에게 HPC 솔루션은 가장 많이 찾는 도구 중 하나로 자리 잡았다. AMD와 같은 반도체 기업의 최신 기술이 IT 인프라 발전과 에너지 효율성 향상을 위한 필수 요소로 자리매김하며 향후에도 그 중요성이 더욱 강조될 것으로 예상된다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.