[스토리지 가상화①] 스토리지 가상화 기술 분석
상태바
[스토리지 가상화①] 스토리지 가상화 기술 분석
  • Network Computing
  • 승인 2004.07.26 00:00
  • 댓글 0
이 기사를 공유합니다

실질적인 이점 명확히 드러나 … 일부에선 여전히 회의적
하나의 LUN (Logical Unit Numbers)만 있다면, “스토리지 TCO 대폭 절감할 수
현명한 조직들은 합리적으로 설계된 인프라가 보다 단순하고 동시에 더 저렴한 스토리지 관리를 의미한다는 사실을 잘 알고 있다. 하지만 대부분의 기업에서는 스토리지를 다스리기가 결코 간단한 일이 아니다. 당신의 스토리지 인프라가 하나의 LUN을 관리하면 될 정도로 간단해질 수 있을까? 아마도 그렇지는 못하겠지만 추구해볼 만한 가치가 있는 목표이긴 하다.

늘어나는 데이터 양을 위해서는 스토리지 용량 확장이 필요하다. 이것은 곧 비용이 크게 늘어난다는 얘긴데, 그 주된 이유는 스토리지 관리 기술의 한계 때문이다. 스토리지를 더 추가하면 이것을 관리해야 할 사람도 더 필요하게 되며, 임금은 스토리지 TCO의 블랙홀이라는 사실은 대부분의 회사에 모두 적용되는 진리다.

가상 S/W만 있으면 된다(?)

기업들은 무수한 스토리지 공유, 즉 자체 LUN(Logical Unit Numbers)으로 식별되는 디스크 드라이브 및 어레이 파티션들을 하나의 가상 LUN으로 통합시킴으로써 이러한 문제의 해결을 시도해 볼 수 있다. 그 결과로 짜증도 줄고 필요한 인원도 줄고 비용도 낮아지게 된다.

따라서 ‘하나의 LUN’은 IBM의 시스템 매니지드 스토리지(Systems Managed Storage) 기술의 특허 보유자이자 EMC의 선임 아키텍트인 존 타이렐(John Tyrrell)과 같은 스토리지 전문가들에게는 추구해야 할 하나의 이상이 되었다. 타이렐은 지난해 자신이 다니던 회사와 스토리지 네트워킹 인더스트리 어쏘시에이션(Storage Networking Industry Association)을 통해 이 개념을 알려 왔다.

그의 주장은 “관리해야 할 하나의 LUN만 있다면 스토리지 관리 경비는 엄청나게 줄어든다”는 것이다.

우리도 여기에 동의하는 바다. 사실 우리는 2002년 5월호에서 스토리지 가상화 기술에 대해 다룬 바 있으며, 이 자리를 빌어 같은 주제를 다시 한번 다뤄볼 작정이다.

이번 취재에서는 업체들로부터 얻은 결과가 마음에 들었다. 불과 2년 전만 하더라도 에디터즈 초이스를 유보시켜야 했는데, 그 이유는 리뷰용으로 제출된 가상화 로드맵들 가운데 어떤 것도 인상적이지 못했기 때문이다. 그리고 우리는 이 기술에 대한 업체들의 과대선전에 시달려야 했다. 업체들은 과연 이들 제품이 현금으로 돌아올 수 있을지 의심이 되는 마케팅 판촉물에 많은 돈을 쏟아붇고 있었다.

예를 들어 업체들은 애플리케이션들이 필요로 하는 스토리지를 자동으로 준비해 줄 수 있는 안정적이고 잘 손질된 파이버 채널 SAN을 뚝딱 만들어내는 데는 가상화 소프트웨어만 있으면 된다는 듯 자신들의 제품이 관리가 잘되는 스토리지 안프라를 가져다 줄 수 있다고 주장했다. 이러한 주장에서 문제는 가상화가 하나의 ‘가동(enabling)’ 소프트웨어 계층에 불과하다는 것이다. 기업 스토리지 인프라를 관리하는 데는 가상화 기술 외에 다른 계층들도 필요하다.

나아가 이기종 스토리지 공유를 가상화하는 데 있어 가상화 소프트웨어 업체들의 용량 외에도 해결해야 할 심각한 문제가 있다는 사실을 깨달았다. 가상화는 LUN이 EMC 플랫폼에 의해 노출되도록 하고 이것을 히타치 데이터 시스템 어레이의 LUN과 통합시켜 가상 볼륨을 만들 수 있게 해줄지는 모르지만, 상식적으로 생각할 때 이런 위험을 결코 감수하고 싶지는 않을 것이다. 어레이 디자인과 온보드 사양은 매우 다양할 수 있다는 점을 감안할 때 결과적으로 생기는 가상 볼륨은 안정적이지가 못할 것이다. 나아가 많은 엔드 유저들은 소스 LUN 업체들간의 적대적 행위에 개의치 않고 이런 볼륨으로 중요한 데이터를 믿고 맡기지 않겠다고 얘기하기도 했다.

마지막으로, 다른 많은 사람들처럼 우리도 업계 애널리스트들을 따라 가상화를 호스트 기반소프트웨어, 대역 내, 대역 외 및 어레이 기반 등 네 가지 범주로 나누어 보았다. 사실 지금은 세 가지도 너무 많다는 생각인데, 실질적으로 모든 가상화는 데이터 경로에서 기능을 수행하기 때문에 대역 내에서 효과를 발휘한다. <그림: 모든 가상화는 대역 내>에서처럼, 가상화 소프트웨어 업체가 어떤 방안을 택하든 관계없이 모든 데이터가 가야 하는 곳에 도달하기 위해서는 가상화 계층을 통과해야 한다. 따라서 결론적으로 말하자면 모든 가상화 방안은 아키텍처의 다양성이 존재한다 하더라도 모두가 동일하다.

모든 가상화는 대역 내

예를 들어 호스트 기반 가상화 소프트웨어는 애플리케이션 읽기/쓰기 작동과 스토리지 타깃 장비 드라이버 사이에서 작동한다. 그 결과 이것은 읽기와 쓰기를 인터셉트하여 물리적 볼륨이 아니라 그 자체의 가상 볼륨으로 이들을 포인팅한다. 이렇게 하는 과정에서의 호스트 기반 가상화는 대역 내 가상화다.

호스트 중심에서 탈피

호스트 기반 가상화의 주요 단점은 모든 호스트 시스템용으로 소프트웨어를 라이선싱하는 데 드는 비용이다. 또한 한 호스트의 가상화 서비스를 다른 모든 호스트의 가상화 서비스에 맞게 최신 것으로 유지하는 일도 만만치 않다.

이런 전략을 오랫동안 지지해 온 베리타스는 호스트 중심적인 배치를 탈피하고 있다. 베리타스는 최근의 발표에서 가상화 기능성을 SAN 스위치에 집중시키기 위해 스위치 업체와 협력하고 있다고 밝힌 바 있다. 하지만 한편으로 마이크로소프트는 윈도 2003 서버 운영시스템에 볼륨 가상화를 직접적으로 추가시켰다. 따라서 당분간은 호스트 기반 가상화가 스토리지 단순화를 위한 한 가지 방안으로 계속 이용될 것 같다.

베리타스는 마이그레이션을 끝내면 美 네트워크컴퓨팅의 최근 기사에서 분석가들이 대역 내 가상화라고 구분한 것을 이미 하고 있는 일군의 업체들에 합류하게 될 것이다. 데이터코어 소프트웨어(DataCore Software), 팔콘스토어 소프트웨어(FalconStor Software), HP, 스토리지텍, 그리고 심지어 IBM까지도 이 그룹에 속해 있으며, 스위치 제조업체들로는 시스코 시스템즈와 브로케이드 커뮤니케이션이 스위치 기반 제품에서 앞장서고 있다.

스토어에이지(AtoreAge)가 돋보이는 또 다른 가상화 방안들은 분석가들이 ‘대역 외’라고 적절치 못하게 분류하고 있다. 이들은 서버에서 띄워지고 데이터가 LUN의 타깃 집합에 도달하기 위해 반드시 거쳐야 하는 곳인 대역 내 장비 드라이버를 만들고 업데이트하기 때문에, 이들의 가상화 기능은 그 본성상 대역 내가 맞다. 소위 말하는 대역 외 방안의 유일한 차이는 가상화 계층을 만들어내는 메커니즘이 데이터 경로 밖에 위치한다는 것뿐이다.

이런 제품들은 경기장에서 팀원(서버)들에게 활력을 불어넣는 사이드라인에 있는 코치(대역 외 가상화 서버)와 같은 역할을 한다. 하지만 어떤 쪽을 보든 도입된 가상화 계층은 여전히 데이터 경로 안에서 기능을 한다.

분석가들이 구분한 마지막 가상화 범주는 직접적으로 어레이 컨트롤러를 기반으로 하는 기술이다. 어레이가 LUN을 제공한다는 얘기의 진실은 어레이 내 디스크의 물리적인 저장 용량의 가상화다. 컨트롤러 기반 가상화 또한 확실히 대역 내 가상화의 한 형태다. 어레이에 들어가는 데이터는 이것을 적절한 디스크나 혹은 하나의 LUN으로서 컨트롤러에 의해 제시되는 디스크 조합로 보내는 가상화 계층을 만나게 된다. 이 기술은 일부 비 RAID’d JOBD 이외의 사실상 모든 어레이 제품들에서 쓰이고 있다.

팽팽한 대립

냉소적인 태도로 보자면, 분석가들이 어떠한 실제 기술상의 이유에서가 아니라 자신들의 회사를 보호하는 차원에서 제품 차별화를 꾀하기 위해 이렇듯 네 가지 가상화 기술로 구분하는 데 대해 반박할 수도 있을 것이다. 하지만 이것과 무관하게 이들은 회의와 무역 쇼에서 계속되는 대역 내 및 대역 외 기술의 상대적인 장단점을 두고 전쟁을 시작했다.

그 증거를 들어 보자. 데이터코어(대역 내)와 스토어에이지(대역 외)는 모두 지난 18개월 동안 강력한 판매전을 벌여 왔다. 이들의 제품은 정말 중요한 것, 즉 소비자 시장에서의 성공을 테스트함으로써만 검증될 수 있다는 주장이다. 각 업체의 솔루션을 구입하기 전에 배치하고 테스트해본 고객은 약속대로 기능을 제공한다고 보고했다. 이런 과정은 어떤 경우에든 인프라에 이 기술이 맞는지를 검증하기 위해 반드시 거쳐야 하는 과정이다. 복잡한 스토리지 배열은 보다 단순하게 렌더링되며, 따라서 가상화 서버가 대역 내냐 대역 외냐에 관계없이 보다 관리가 쉬워지게 된다.

언뜻 듣기에는 대역 외 전략이 대역 내 방안보다 더 나으리라고 기대할 수도 있다. 미시건 의료보험 회사의 한 IT 매니저는 과월호 기사를 읽고 난 후 “큐잉 이론만으로도 본질적으로는 하나의 PC인 대역 내 가상화 서버를 통해 800개 서버와 고성능 스토리지 어레이 플랫폼 상의 180TB 디스크 사이로 트래픽을 푸싱할 수 없다는 사실을 알 수 있다”며, “직관적으로 볼 때 분명 버스가 금방 차고, 막대한 대기시간이 야기되며, 데이터 경로에 병목 지점이 생기게 될 것”이라고 단언했다.

이러한 견해는 대역 외 사업자들이 데이터코어와 같은 대역 내 경쟁자들에 비해 자신들의 제품을 선전하기 위해 견지되었다. 하지만 이 경우에는 직관이 옳지 못하다는 사실이 입증되었다.

스토리지텍의 수석 기술자인 랜디 챌펀트는 대역 내 서비스가 얼마나 잘 수행되는지를 결정하는 세 가지 요소가 있는데, 그것은 바로 프로세서의 효율성, 병렬화, 즉 동시에 수행되는 프로세스 수, 그리고 데이터 패씽(pathing)이라고 한다.

기술 백서와 사례연구들을 대충만 훑어 보더라도 대역 내 가상화 업체들이 향상되는 프로세서 속도와, 어떤 경우에는 병렬 서버 아키텍처 및 인터럽트 절감 운영시스템을 활용하여 버스 포화와 병목 지점 현상을 피하고 있다는 사실을 알 수 있다. 언젠가는 심지어 소프텍쪽으로부터 심지어 데이터코어의 SAN심포니(SANsymphony) 제품의 라이선스 업체인 소프트텍으로부터 가상화 서비스를 IBM의 z/OS 메인프레임으로 이식한다는 얘기도 들었는데, IBM의 병렬 아키텍처는 이것이 던져 넣을 수 있을 만큼의 LUN을 집합 및 관리할 수 있게 해줄 것이다.

결론적으로 말해 가상화 시장을 대역 내 및 대역 외로 구분하는 것은 혼잡한 IT 쓰레기통으로 곧장 후퇴한다는 얘기나 마찬가지다.

가상화의 용량 할당 이점

과연 안정적인가

사용 가능한 어떠한 LUN에서든 안정적인 볼륨을 만들어낸다는 가상화 업체의 주장에 대해서도 여전히 의문이 남는다. 전 EMC CEO는 언젠가 “우리 두 회사 모두 씨게이트 하드드라이브 박스를 팔고 있다”는 말로 EMC의 어레이나 가장 가까운 경쟁업체의 어레이나 다를 바가 없다는 표현을 한 적이 있다.

이것은 가상화가 어떤 업체 로고가 새겨진 플랫폼이든 관계없이 사용될 수 있다는 견해에 무게를 실어준다. 하지만 이 CEO는 곧 어레이들간의 차별화 요소는 마이크로모드로 만들어져서 어레이 컨트롤러에 추가되는 부가가치 소프트웨어가 될 것이며, 이 어레이 컨트롤러는 스탠드얼론 컴퓨팅 플랫폼과 같은 기능을 더 하게 될 것이라고 덧붙였다. 이런 기능성은 이기종 스토리지 인프라에서 계속 독이 될 것이며, 우리 견해로는 현재 나와 있는 가상화 제품들의 주 기능인 믹스 앤 매치(mis-and-match) LUN 집합 기능에 큰 도전을 안겨줄 것이다.

“서로 다른 어레이 아키텍처로 인해 야기되는 크로스 플랫폼 장애라고 일컬어지는 것들의 상당수는 기술적이라기보다는 정치적인 것들에 가깝다”고 타이렐은 말했다. 대부분의 조직들이경쟁적인 대형 어레이 업체들의 LUN을 집합하고 있지 않다는 사실을 인정하긴 했지만, 그는 이기종 어레이들이 새겨진 LUN을 포함하고 있는 스토리지 풀이 가상 볼륨을 위한 초석으로 점점 더 많이 사용될 것이라도 덧붙였다.

어쨌거나, 우리는 회의적이다.

아직 한 가지 고민이 더 남아 있는데, 그것은 스토리지를 관리 가능하도록 만드는 데 필요한 것은 가상화뿐이라는 일부 업체들의 주장이다. 업체들은 이 점에서 과대 선전을 서서히 줄여가고 있는 대신 자신들의 가상화 제품을 스토리지 용량 관리 서비스의 한 가지 컴포넌트라고 설명하고 있다. 이런 입장을 보이는 소프트텍의 CTO인 닉 태빌리온 역시 IBM의 시스템 매니지드 스토리지 기술의 특허 보유자이기도 하다.

가상화의 용량 할당 이점

줄어드는 과대선전

소프텍을 비롯해 이런 주장을 하는 업체들은 여러 관리 기능들을 하나의 통합된 제품으로 묶어내는 작업을 하고 있으며, 이 통합 제품에서 가상화는 단지 하나의 부분에 불과하며 가장 중요한 요소가 아닐 수도 있다.

우리의 회의적 시각에도 불구하고, 가상화에 대한 정당화 근거는 확실하다. 적절한 어레이와 파이버 채널 패브릭(혹은 팔콘스토어의 최신 제품에 있는 IP 스토리지 네트워크)가 주어질 때, 가상화는 최소한의 중단으로 서로 다른 기업 애플리케이션으로 할당되는 스토리지 용량을 조정할 수 있다. 이것은 또한 보다 많은 활동 공간을 필요로 하는 애플리케이션 뒤의 용량을 확장시켜줄 수 있다.

눈에 덜 띄는 것 중 한 가지는 용량 활용의 효율성을 향상시키는 데 있어서의 가상화의 역할이다. 회사들은 필요한 것보다 더 많은 스토리지를 사며, 갖고 있는 것을 비효율적으로 이용한다. 부분적으로 이것은 업체들이 스토리지를 패키징하는 방식 때문이기도 하지만, 애플리케이션 소프트웨어의 스토리지 용량 권고안을 반영해주는 현상이기도 하다.

<그림: 가상화의 잠재적 용량 활용 이점>에서 보는 바와 같이 스토리지의 상당 부분은 소프트웨어 회사에서 일괄적으로 내놓는 권고안들에 따라 애플리케이션에 할당되지만 사용되지 않고 있다. 그리고 더 많은 용량은 어레이 업체들이 향후의 용량 필요조건을 충족시키기 위한 ‘활동공간’으로 판매하는 추가 용량에 소모되고 있다. 그 결과 실질적으로 필요한, 혹은 사용하는 스토리지는 보통 구매하게 되는 용량의 일부에 불과하게 된다.

한계와 가능성

일부 업체들은 가상화가 전체 용량을 추적하며, 사용되지 않지만 할당돼 있는 용량을 다른 애플리케이션의 서비스에서 사용할 수 있게 해준다고 주장하고 있다. 이러한 용량에는 물론 한계가 있다. 그 일례로 사용자들은 어떤 스토리지가 재할당의 후보자가 되는지, 그리고 스토리지에 특정 애플리케이션에서 사용하기 적합하게 해주는 성능과 신뢰성 등의 특성들이 있는지 여부를 알고 있어야 한다. 게다가 우리는 여전히 이기종 스토리지로 인해 야기되는 한계에 직면해 있다.

다시 말하자면, 용량 활용 관리 기능은 가장 중요하면서도 자주 언급되지 않는 가상화의 이점이다. 우리의 값비싼 어레이 플랫폼 대부분에서 너무 많은 스토리지를 낭비하는 포인트 인 타임(point-in-tie) 미러링의 부담을 덜고, 소중한 공간을 차지하는 오래되거나 소용 없는 데이터를 제거해주는 효과적인 정책 기반 데이터 관리와 짝을 이뤄 이러한 가상화 기능은 회사들이 스토리지 플랫폼에서 훨씬 더 많은 것을 얻을 수 있게 도와준다.

최종 분석 결과, 지난번 본지 리뷰때보다 오늘날의 가상화에 더 설득력 있는 주장이 많은 것 같다. 기술을 둘러싼 과대 선전들은 사라지고 있으며, 실질적인 이점이 보다 명확히 드러나고 있다. 하지만 여전히 일부 항목(크로스 플랫폼 LUN 집합 등)에는 의구심이 남아 있으며, 업체측 주장을 확인해보기 위해 구입 이전에 먼저 테스트를 해보기를 권한다. 소프트 경제는 대부분의 업체들이 드라이브 테스트를 지원하도록 만들고 있다. 이들이 테스트 계획을 함께 하는 동안에 ‘하나의 LUN’이란 말을 읊조리더라도 놀라지는 말라.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.