엔비디아, 파스칼 기반 딥 러닝 플랫폼 ‘테슬라 P4·P40’ 발표
상태바
엔비디아, 파스칼 기반 딥 러닝 플랫폼 ‘테슬라 P4·P40’ 발표
  • 정용달 기자
  • 승인 2016.09.13 13:50
  • 댓글 0
이 기사를 공유합니다

기존 CPU 서버 대비 향상된 인공지능 추론 성능·에너지 효율 제공

엔비디아(CEO 젠슨황)가 중국 베이징에서 열린 GPU 기술 컨퍼런스 ‘GTC China 2016’에서 파스칼(Pascal) GPU 아키텍처 기반의 딥 러닝 플랫폼인 테슬라(Tesla) P4, P40 가속기와 함께 인공지능 추론 작업을 가속화하는 새로운 소프트웨어 텐서RT(TensorRT)와 딥스트림(DeepStream) SDK를 13일 공개했다.

테슬라 P4와 P40은 엔비디아의 최신 GPU 아키텍처인 파스칼을 기반으로 음성, 이미지 또는 텍스트를 인식하기 위해 훈련된 심층 신경망을 구동한다. 특히 8비트(INT8) 기반의 특수 추론 명령을 사용해 CPU 대비 45배(1), 지난 1년 내 출시된 GPU 솔루션 대비 4배(2) 더 빠른 속도로 추론 작업을 실행하는 등 인공지능 추론에 특화된 성능을 제공한다.

테슬라 P4는 작은 사이즈의 폼팩터와 50W(와트)의 저전력 디자인으로 최고 수준의 에너지 효율을 필요로 하는 데이터 센터에 적합하다. CPU 기반의 추론 작업과 비교했을 때 40배(3) 더 뛰어난 수준의 에너지 효율을 제공한다고 볼 수 있다. 가령 하나의 테슬라 P4은 영상 추론 작업에서 13대의 CPU 단일 서버를 대체(4)할 수 있기 때문에 서버 구입 및 전력 비용을 모두 포괄하는 총소유비용(TCO)에 있어 8배 이상의 절감 효과를 기대할 수 있다.

엔비디아 이안 벅(Ian Buck) 엑설레이티드 컴퓨팅 부문 부사장은 “엔비디아는 기 선보인 테슬라 P100을 비롯해 이번 P4, P40 출시를 바탕으로 데이터 센터용 엔드-투-엔드 딥 러닝 플랫폼을 제공하는 유일한 기업으로 발돋움 했다”며, “이를 통해 딥 러닝 트레이닝 시간은 몇 일에서 몇 시간 단위로 단축되며, 즉각적인 인사이트를 추출하는 것도 가능해진다. 다시 말해 소비자가 실시간으로 인공지능 기반 서비스를 활용할 수 있는 시대가 앞당겨진 것”이라고 전했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.