엔비디아, 엔터프라이즈용 생성형 AI 가속 지원 서버 솔루션 출시
상태바
엔비디아, 엔터프라이즈용 생성형 AI 가속 지원 서버 솔루션 출시
  • 강석오 기자
  • 승인 2023.08.23 20:36
  • 댓글 0
이 기사를 공유합니다

[데이터넷] 엔비디아는 VM웨어 프라이빗 AI 파운데이션을 지원하는 AI 레디 서버를 공급할 예정이라고 발표했다. 이 서버는 기업이 독자적인 비즈니스 데이터를 사용해 생성형 AI 애플리케이션을 맞춤화하고 배포할 수 있도록 지원한다.

엔비디아 AI 레디 서버에는 엔비디아 L40S GPU, 엔비디아 블루필드-3 DPU, 엔비디아 AI 엔터프라이즈 소프트웨어가 탑재된다. 이를 통해 기업들은 생성형 AI 기반 모델을 미세 조정하고 지능형 챗봇, 검색, 요약 도구 등과 같은 생성형 AI 애플리케이션을 구현할 수 있다.

엔비디아 L40S 기반 서버는 델 테크놀로지스, HPE, 레노버 등 글로벌 시스템 제조사를 통해 연말 출시를 앞두고 있다. 해당 서버는 엔터프라이즈용 생성형 AI 가속화에 활용될 예정이다.

엔비디아 CEO 젠슨 황(Jensen Huang)은 “새로운 컴퓨팅 시대가 시작됐다. 모든 산업 분야의 기업들이 생성형 AI를 도입하기 위해 경쟁하고 있다. 엔비디아는 세계 최고의 소프트웨어와 시스템 파트너 에코시스템을 통해 전 세계 기업들에게 생성형 AI를 제공하고 있다”고 말했다.

엔비디아 AI 레디 서버는 생성형 AI를 도입하려는 업계에 풀 스택 가속 인프라와 소프트웨어를 제공하도록 설계됐다. 여기에는 신약 개발, 유통 제품 설명, 지능형 가상 어시스턴트, 제조 시뮬레이션 등 광범위한 애플리케이션이 해당된다.

이 서버에는 엔비디아 AI 플랫폼 운영 체제인 엔비디아 AI 엔터프라이즈가 탑재된다. 이 소프트웨어는 LLM을 위한 엔비디아 네모(NeMo), 시뮬레이션을 위한 엔비디아 모듈러스(Modulus), 데이터 사이언스를 위한 엔비디아 래피즈(RAPIDS), 프로덕션 AI를 위한 엔비디아 트리톤 추론 서버 등 100개 이상의 프레임워크, 사전 훈련된 모델, 툴킷, 소프트웨어에 대한 프로덕션 지원과 보안을 제공한다.

L40S GPU는 수십억 개의 매개변수가 있는 복잡한 AI 워크로드를 처리하도록 설계됐으며, 4세대 텐서 코어와 FP8 트랜스포머 엔진이 포함된다. 이를 통해 1.45페타플롭스 이상의 텐서 처리 성능과 엔비디아 A100 텐서 코어 GPU에 비해 최대 1.7배의 훈련 성능을 제공한다.

지능형 챗봇, 어시스턴트, 검색, 요약 등과 같은 생성형 AI 애플리케이션의 경우, 엔비디아 L40S는 엔비디아 A100 GPU에 비해 최대 1.2배 더 뛰어난 생성형 AI 추론 성능을 제공한다.

엔비디아 블루필드 DPU를 통합하면 가상화, 네트워킹, 스토리지, 보안과 기타 클라우드 기반 AI 서비스의 엄청난 컴퓨팅 부하를 가속화, 오프로드 또는 격리해 속도를 더욱 높일 수 있다. 엔비디아 커넥트X-7 스마트NIC은 고급 하드웨어 오프로드와 초저지연을 제공해 데이터 집약적인 생성형 AI 워크로드를 위한 동급 최고 수준의 확장성을 제공한다.

L40S GPU와 블루필드 DPU가 탑재된 엔비디아 AI 레디 서버는 연말 출시 예정으로, 향후 몇 달 내 클라우드 서비스 제공사를 통해 인스턴스를 이용할 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.