GPU 가상화 ‘최고’ 아닌 ‘최선’ 찾아야
상태바
GPU 가상화 ‘최고’ 아닌 ‘최선’ 찾아야
  • 데이터넷
  • 승인 2019.10.18 10:06
  • 댓글 0
이 기사를 공유합니다

▲ 김광정 유클릭 디지털 트랜스포메이션 사업본부장

[데이터넷] 최근 업종과 기업 규모를 가리지 않고 인공지능(AI)에 대한 투자가 늘고 관련 프로젝트 역시 활발하게 추진되고 있다. 이런 분위기 속에서 AI 인프라 및 플랫폼 구축과 운영 패러다임이 바뀌고 있다.

과거 AI는 몇몇 부서나 전문가의 관심사이자 업무였다. 그러나 지금은 연구 개발, 서비스, 마케팅, 영업, 고객 지원 등 거의 모든 부서가 AI와 직간접적으로 관련돼 있다.

따라서 몇몇 전문가들이 AI 관련 인프라를 독점하는 것이 아니라 전사 측면에서 여러 사용자가 효율적으로 자원을 공유하는 것이 중요해 기업의 AI 관련 실무자들 사이에 VM웨어 기반의 GPU 가상화 기술에 대한 관심이 부쩍 커지고 있다.

VM웨어 기반 GPU 가상화 관심 늘어
VM웨어 환경에서 GPU 가상화로 자원을 통합해 공유하려는 이유는 크게 세 가지다. 첫 번째는 하드웨어 자원 최적화를 통해 자원 낭비와 투자를 최소화하기 위함이다. 두 번째는 효율적인 자원 공유로 딥러닝, 머신러닝 워크로드 생산성을 높이기 위해서다. 세 번째는 이미 활용 중인 VM웨어 가상화 환경에서 AI 및 데이터 과학 워크로드를 지원하는 것이다.

GPU 가상화는 물리적인 장비 증설의 비효율과 비용 부담 해결을 위해 등장한 서버 가상화와 아이디어가 같다. 기술 발전을 거듭하고 있는 GPU 가상화는 물리적인 자원을 가상머신(VM)이 공유해 프로세서 활용률을 극대화하는 것이 목표로, VM웨어 기반 GPU 가상화는 크게 세 가지 방법으로 구현할 수 있다.

보통 GPU 가상화를 검토할 때 VM웨어 다이렉트패스(DirectPath) IO, 엔비디아 그리드(GRID), 비트퓨전 플렉스다이렉트(FlexDirect) 중에서 선택을 고민한다. 그러나 GPU 가상화 기술과 솔루션은 ‘최고’를 고르는 것이 아니라 우리 조직에 맞는 ‘최선’을 찾는 것이 중요하다.

회사·조직 특성에 최적화된 방법 선택해야
VM웨어 다이렉트패스 IO는 보편적인 딥러닝, 머신러닝 모델 개발, 트레이닝 등에 활용할 수 있다. ESXi 하이퍼바이저를 거치지 않고 VM에 올린 게스트 운영체제가 PCI 타입의 GPU 카드에 직접 접근할 수 있다는 것이 장점으로, 중간에 거치는 것이 줄기 때문에 GPU 성능을 최대한 살리는 데 좋다.

엔비디아는 가상화 환경에서 그래픽, 엔지니어링 등의 워크로드 지원을 위해 그리드라는 GPU 가상화 기능을 지원한다. 최근에는 딥러닝, 머신러닝으로 활용 분야가 점점 확대되고 있다.

VM웨어가 인수한 비트퓨전의 GPU 가상화 솔루션인 플렉스다이렉트는 호스트 단위가 아닌 데이터센터 측면의 GPU 가상화와 자원 통합을 위해 활용된다.

이러한 방법에는 각각의 특징이 뚜렷하다. 이는 딥러닝, 머신러닝 모델링, 트레이닝, 추론 관련해 각 회사와 조직의 특성에 맞는 방법을 골라야 한다는 것을 뜻한다.

성능, 생산성 등 조직마다 수행하는 프로젝트 특징에 따라 우선순위가 다르기 때문에 하나의 VM에 전용 GPU 자원 연결, 하나의 VM에 여러 GPU 자원 할당, 여러 VM이 GPU 자원 풀 공유 중 우리 회사에 적합한 방법을 찾는 것이 최선일 것이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.