델·HPE·레노버 서버, 엔비디아 AI용 이더넷 기술 통합
상태바
델·HPE·레노버 서버, 엔비디아 AI용 이더넷 기술 통합
  • 강석오 기자
  • 승인 2023.11.22 13:13
  • 댓글 0
이 기사를 공유합니다

스펙트럼-X 이더넷으로 생성형 AI 워크로드 가속 지원
블루필드-3 슈퍼NIC, 가속 소프트웨어 결합해 AI 워크로드 효율성 극대화

[데이터넷] 엔비디아는 AI용 스펙트럼-X(Spectrum-X) 이더넷 네트워킹 기술이 델 테크놀로지스, HPE, 레노버의 서버 라인업에 통합, 생성형 AI 워크로드를 가속화할 수 있도록 지원한다고 밝혔다.

생성형 AI를 위해 설계된 스펙트럼-X는 기존 이더넷 제품 대비 1.6배 빠른 AI 통신 네트워킹 성능을 구현하며 새로운 차원의 이더넷 네트워킹을 제공한다. 시스템 제조 3사가 내년 1분기 선보일 예정인 시스템에는 스펙트럼-X는 물론 엔비디아의 텐서 코어 GPU, AI 엔터프라이즈 소프트웨어, AI 워크벤치 소프트웨어를 결합해 생성형 AI로 비즈니스를 혁신할 수 있는 빌딩 블록을 제공한다.

젠슨 황(Jensen Huang )엔비디아 CEO는 “기업이 워크로드를 처리하기 위해 데이터센터를 업그레이드하면서 생성형 AI와 가속 컴퓨팅이 세대 간 전환을 주도하고 있다. 가속 네트워킹은 엔비디아의 선도적인 서버 제조업체 파트너사들이 생성형 AI 시대로 신속하게 전환할 수 있도록 새로운 시스템 파동을 일으키는 촉매제가 될 것”이라고 말했다.

마이클 델(Michael Dell) 델 테크놀로지스 CEO는 “가속 컴퓨팅과 네트워킹은 LLM과 생성형 AI 애플리케이션의 요구 사항을 충족시키는 시스템 구축에 핵심적인 역할을 한다. 엔비디아 협력을 통해 데이터에서 인텔리전스를 빠르고 안전하게 추출하는 데 필요한 인프라와 소프트웨어를 제공하고 있다”고 말했다.

안토니오 네리(Antonio Neri) HPE CEO인 는 “고객이 생성형 AI의 잠재력을 최대한 실현할 수 있도록 엔비디아와 협력해 애플리케이션 지원에 필요한 성능, 효율성, 확장성을 갖춘 시스템을 구축하고 있다”고 말했다.

양 위안칭(Yuanqing Yang) 레노버 CEO는 “엔비디아와 긴밀히 협력해 최신 AI 애플리케이션을 구동하는 데 필요한 네트워킹, 컴퓨팅, 소프트웨어를 갖춘 효율적이고 가속화된 시스템을 구축하고 있다”고 말했다.

AI 가속화 위해 네트워킹 특화 설계

스펙트럼-X는 엔비디아 블루필드-3 슈퍼NIC, 가속 소프트웨어를 결합했다. 엔비디아 블루필드-3 슈퍼NIC는 스펙트럼-4 이더넷 스위치의 탁월한 성능, 하이퍼스케일 AI 워크로드를 강화하는 네트워크 가속기다. 이를 통해 스펙트럼-X는 AI 워크로드의 효율성을 극대화하고, 세계 최고 수준의 인프라 컴퓨팅 플랫폼인 블루필드-3 DPU를 보완한다.

스펙트럼-4는 AI용으로 초당 51Tb/s를 지원하는 이더넷 스위치다. 멀티 테넌트 AI 클라우드 워크로드의 네트워크 혼잡을 최소화하면서 대규모 또는 부하 상태에서 매우 효과적인 데이터 처리량을 지원한다. 아울러 지능적이고 미세 조정된 라우팅 기술을 통해 네트워크 인프라를 항상 최대한으로 활용한다.

네트워크 집약적인 대규모 병렬 컴퓨팅을 위해 설계된 블루필드-3 슈퍼NIC는 GPU 서버 간 최대 400Gb/s의 RoCE(RDMA over Converged Ethernet) 연결을 지원하고 클러스터 내부의 동서(East-west) 네트워크에서 AI 훈련과 추론 트래픽의 성능을 향상시킨다. 더불어 안전한 멀티 테넌트 데이터센터 환경을 구현해 테넌트 작업 간 결정론적이고 격리된 성능을 보장하고, 전력 효율성이 뛰어나 기업용 서버에 적합하다.

스펙트럼-X를 구동하는 가속 소프트웨어에는 플랫폼의 획기적인 성능을 이끌어내는 큐물러스 리눅스, 퓨어 소닉(SONiC), 네트Q 등과 같은 엔비디아 소프트웨어 개발 키트와 블루필드의 핵심인 엔비디아 도카(DOCA) 소프트웨어 프레임워크가 포함된다.

엔비디아 AI 엔터프라이즈는 안전하고 안정적인 프로덕션 AI를 위해 프레임워크, 사전 훈련된 모델, 개발 툴 등을 제공한다. 개발자는 엔비디아 AI 워크벤치를 통해 PC 또는 워크스테이션에서 사전 훈련된 생성형 AI 모델을 빠르게 생성, 테스트, 맞춤화하고, 이를 거의 모든 데이터센터 또는 클라우드로 확장할 수 있다.

한편 스펙트럼-X는 차세대 AI 시스템을 위한 레퍼런스 아키텍처인 엔비디아 이스라엘-1(Israel-1) 슈퍼컴퓨터를 지원한다. 이스라엘-1은 델과 협력한 것으로 엔비디아 HGX H100 8-GPU 플랫폼 기반의 델 파워엣지 XE9680 서버와 스펙트럼-4 스위치 기반의 블루필드-3 DPU와 슈퍼NIC을 사용한다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.