Market Focus 스토리지 가상화(Storage Virtualization)의 현재와 미래 PART6
상태바
Market Focus 스토리지 가상화(Storage Virtualization)의 현재와 미래 PART6
  • 승인 2005.05.23 00:00
  • 댓글 0
이 기사를 공유합니다

PART Ⅵ

파일 스토리지 가상화 통해 효율적인 스토리지 자원 활용 ‘가능’

구조화되지 않은 데이터 관리 요구 급증 … 차세대 계층적 스토리지 구성 해법 제시

스토리지를 크게 SAN과 NAS로 나눌 수 있다는 이야기는 이제 진부한 사실이 돼버렸다. 데이터베이스를 사용하는데 SAN을 사용하고, 파일을 저장하는데 NAS 혹은 파일서버를 사용하는 게 정설이 된 시점에서, 이러한 SAN 혹은 NAS의 가상화 문제가 대두되기 시작한 것은 불과 얼마 되지 않은 것이 사실이다. 이 글에서는 이 중 NAS 혹은 파일서버의 가상화, 즉 구조화되지 않은 데이터에 대한 가상화에 대해서 다루고자 한다. | 박경순 어코피아네트웍스코리아 차장·kpark@acopia.com |

기업의 가장 중요한 재산을 논하자면 가장 먼저 떠오르는 것이 인적 재산이다. 경쟁사의 재원을 스카웃하기 위해 무수히 많은 공을 들이는 요즘 기업들을 보면, 가히 인적 재산은 그 기업의 생명과도 같은 중요한 재산임에 틀림없을 것이다.
이에 못지 않게 중요한 재산은 역시 기업의 모든 것이라고 할 수 있는 디지털화된 데이터다. 과거에는 서류더미로 이뤄져있으나 현대 기업들에서 과거의 서류더미는 이제 모두 디지털 정보가 돼 디스크나 테이프에 저장돼 보관되고 있다. 이러한 데이터를 보존하는 디스크는 그 규모가 점차 방대해져서 스토리지라고 부르는 대단위 디스크의 집합체에 보관되고 있다.

구조화되지 않은 데이터 관리의 필요성
오늘날 수많은 기업들이 직면한 해결하기 어려운 문제중의 하나는 정보의 양이 기하급수적으로 늘어남에 따라 저장 매체에 대한 투자와 이러한 데이터에 대한 관리와 분배 문제다. 구조화된 데이터(Structured Data)란 말 그대로 이미 정형화되고 구조화돼 어느 정도 관리가 가능한 데이터를 말한다. 대표적인 예가 데이터베이스라고 할 수 있을 것이다.
그렇다면 구조화되지 않은 데이터(Unstructured Data)란 단순히 데이터베이스화되지 않은 데이터를 말하는 것일까? 이는 훨씬 넓은 의미를 내포하고 있다. 단적으로 말하면 파일로 이뤄진 모든 데이터를 넓은 의미에서 모두 구조화되지 않은 데이터라고 할 수 있다. 단순히 파일서버 내의 각종 문서들, 오디오 및 비디오 등을 담고 있는 멀티미디어 데이터, 각종 규제로 인해 장기간 보관돼져야 하는 파일들, 직원들의 중요한 백업 데이터들을 모두 구조화되지 않은 데이터의 범주에 넣을 수 있다. 이러한 데이터를 구조화되지 않은 데이터라고 하는 이유는 관리하기가 만만치 않고 그 양이 워낙 엄청나기 때문이다.
실제로 기업내의 데이터 중에 구조화된 데이터와 구조화되지 않은 데이터의 비율을 보면 거의 2대 8의 비율로 구조화되지 않은 데이터의 비중이 훨씬 높다. 하지만 지금까지 대부분 데이터베이스화돼 있는 데이터의 중요함만이 강조된 나머지 그 이외의 데이터들에 대한 관리는 소홀해 왔던 것이 사실이다. 하지만 그렇다고 데이터베이스는 중요하고 파일데이터는 중요하지 않다고 말할 수 있을까?
파일 서버를 포함한 NAS 스토리지는 다수의 클라이언트가 1대 혹은 그 이상의 스토리지를 NFS(Network File System) 혹은 CIFS(Common Internet File System) 표준 프로토콜을 사용해 공유하기 때문에 데이터의 중복을 최대한 억제할 수 있다는 이유로 흔히 파일 데이터를 저장하는데 최적의 솔루션으로 각광받고 있다.
데이터가 증가함에 따라 기업은 IT예산을 할당해 계속 스토리지를 투입할 수밖에 없게 된다. 하지만 새로운 스토리지를 투입함에 따라 스토리지의 관리는 점차 복잡해지고, 서비스의 일시적인 중단을 야기시키며, 스토리지의 정확한 효율성을 파악하기가 점차 힘들어진다는 모순이 생기게 된다.
이로 인해 알게 모르게 불필요한 중복 투자가 일어나고 운영에 들어가는 비용, 즉 총소유비용(TCO)이 점차 높아지게 된다. 더 크게는 각종 스토리지의 구성 변경이 가져오는 서비스의 다운타임으로 인한 기회 손실 비용이 날로 높아져 가고 있다. 여기서는 이러한 구조화되지 않은 데이터, 즉 파일 데이터의 저장에 대한 문제점 및 그에 대한 해결 방안을 짚어 보자.

파일 스토리지의 과제
·장비 중심의 관리

NAS 스토리지나 파일 서버(이하 파일 스토리지)들은 각각 개별적으로 관리될 수밖에 없다. 즉, 세 대의 파일 스토리지가 존재하고 이를 연결하는 4대의 클라이언트가 존재한다면 그 4대의 클라이언트는 모두 각각 3대의 파일 스토리지를 마운트(mount)해야 한다. 또한 각각의 파일 스토리지는 해당 장비 한대에 그 확장성이 제한되게 된다. 이러한 제약성이 ‘스토리지 고립(Island of Storage)’ 현상을 야기시키게 된다. 그야말로 전혀 통합된 관리 방법이 없을 뿐만 아니라 관리의 복잡성 또한 증대된다.
이러한 스토리지간의 데이터 마이그레이션(data migration)이나 용량의 추가 등은 시스템의 다운타임을 가져 올 뿐만 아니라 클라이언트의 재구성을 요구할 수도 있다. 더군다나 그 스토리지들이 모두 다른 제조사의 제품이라면 어떨까? 아마도 이 글을 읽는 많은 분들이 그 관리의 어려움을 직접 체험하고 있을 것이다.

·제한된 확장성
장비 중심의 스토리지 고립 현상은 성능 및 용량에 있어서 확장성의 한계를 극명하게 갖고 있다. 하이엔드급 NAS 스토리지가 그 자체의 확장성이 뛰어나다고 해도 한계가 있을 수밖에 없으며 그 자체로 하나의 독립적인 스토리지일 수밖에 없다. 하지만 기업 내의 애플리케이션의 요구와 점차 글로벌화돼 가는 기업의 특성상 결국 그 한계에 직면하고 이를 극복하기 위해 고민하기까지는 장비를 도입하고 나서 그다지 오랜 시간이 걸리지 않는다.

·비효율적인 가용성
다양한 이기종 스토리지에 대한 통일화된 관리 방법이 없이는 전체 스토리지의 가용성이나 수요 예측을 한다는 것이 거의 불가능하다. 그럼에도 불구하고 통일된 관리 방법이 거의 전무하기 때문에 어쩔 수 없이 한 제조사의 장비만을 도입하는 경우도 발생할 수 있다.

파일 스토리지 가상화의 적용
파일 스토리지의 이러한 문제점을 극복하기 위해 등장한 것이 파일 스토리지 가상화 솔루션이다. 파일 스토리지 가상화 솔루션은 현재 크게 소프트웨어기반의 솔루션과 하드웨어 기반의 솔루션이 있는데 국내에는 하드웨어 기반의 솔루션을 중심으로 본격적으로 소개되고 있다. 대표적인 하드웨어 기반(스위치 기반)의 파일 스토리지 가상화 솔루션인 어코피아 네트웍스(Acopia Networks)의 ARX(Adaptive Resource Switch) 제품을 중심으로 파일 스토리지 가상화를 적용할 수 있는 분야를 몇 가지로 나눠 알아보기로 하자.

글로벌 네임 스페이스
글로벌 네임스페이스(Global Name Space)란, 예를 들어 10대의 서로 다른 OS를 사용하는 서로 다른 제조사의 파일 스토리지가 있다면 이것을 마치 1대의 거대한 파일 스토리지가 있는 것처럼 클라이언트에게 보여주는 기능을 말한다. 클라이언트는 백엔드(Back-end)에 어떤 종류의 파일 스토리지가 있는지 전혀 신경 쓸 필요 없이 하나의 가상 IP 어드레스를 마운트해 사용하며, 저장되는 파일 또한 어디에 저장되는지 전혀 신경 쓸 필요 없이 ARX가 미리 정의된 룰에 의해 가장 적합한 스토리지로 파일을 저장한다.
이렇게 되면 실제로 어떤 파일 스토리지에 장애가 돼 네트워크에서 제거된다던가, 새로운 파일 스토리지를 도입해 네트워크에 추가하게 된다 하더라도 전체 서비스에 전혀 영향을 주지 않고 클라이언트는 이러한 사실을 전혀 눈치채지 못한 채 계속 서비스를 수행할 수 있게 된다. 아울러 모든 스토리지에 고르게 데이터를 저장함으로써 전체적인 용량 로드 밸런싱(Capacity Load Balancing) 효과를 가져오게 된다.

성능 향상
기업 내 애플리케이션이 날로 복잡해지고 다양해짐에 따라 하나의 파일 스토리지를 다양한 클라이언트가 액세스함으로써 종종 파일 스토리지 자체의 병목 현상이 생기곤 한다. 이를 해결하기 위해 고성능의 NAS 스토리지를 도입하기도 하지만 결국 NAS 스토리지 자체의 한계를 극복할 수는 없기 때문에 벽에 부딪치게 된다.
그러나 파일 스토리지의 가상화를 통해 다수의 물리적인 파일 스토리지를 두고 클라이언트는 마치 1대의 초 대용량 파일 스토리지를 사용하는 것처럼 구성할 수 있기 때문에 비즈니스 로직을 바꾸지 않고 다수의 파일 스토리지로 물리적인 분산을 효과적으로 꾀할 수 있으므로 전체적인 비즈니스 애플리케이션의 성능 향상을 기대할 수 있다.

데이터 마이그레이션
기존 스토리지의 용량 및 성능의 한계로 인해 새로운 스토리지를 도입한다면 피할 수 없는 당면 과제가 데이터 마이그레이션 작업이다. 데이터 마이그레이션은 오랜 시간을 필요로 할 뿐 아니라 필수적으로 서비스의 다운타임을 가져오게 되며 가장 사용률이 낮은 시간대에 이뤄져야 하기 때문에 보통 장기적인 계획을 가지고 순차적으로 하거나 밤샘작업을 여러 번 해야 하는 경우가 대부분이다. 하지만 ARX의 데이터 마이그레이션 정책을 사전에 정의해 놓기만 하면 클라이언트의 재구성이나 서비스의 다운타임 없이 자동으로 서비스 중에 데이터의 자연스러운 마이그레이션이 이뤄진다.
단적인 예를 들면, A라는 파일 스토리지에서 ARX를 통해 B라는 다른 파일 스토리지로 스트리밍 데이터를 계속 서비스하면서 마이그레이션 할 수도 있다. 또한 동일 기종의 스토리지간의 데이터 마이그레이션 뿐만 아니라 이기종의 다양한 스토리지 간에도 전혀 문제없이 마이그레이션할 수 있게 된다. 저성능의 파일서버를 사용하다가 고성능의 NAS 스토리지를 도입해 데이터를 마이그레이션해야 하는 경우, 혹은 그 반대로 고성능 NAS 스토리지의 액세스 빈도가 낮은 데이터를 저가형 파일 스토리지도 옮겨야 하는 경우 역시 다운타임 없이 전 과정을 자동으로 마이그레이션할 수 있다.

스토리지의 계층화
파일 스토리지는 이제 더 이상 단순한 파일 서버가 아닌 복잡한 다계층 인프라스트럭처(infrastructure)를 가지고 있다. 기업 내의 모든 데이터를 하나의 파일 스토리지에 보관하거나 주기적으로 테이프 라이브러리나 옵티컬 디스크에 백업하던 것과는 달리, 특히 SATA(Serial ATA) 디스크가 널리 보급됨에 따라 저렴한 대용량의 파일 스토리지가 시장에 등장하게 된 것이다.
기존의 테이프 라이브러리는 용량대비 가격이 저렴한 장점이 있으나 백업 및 복구의 복잡성 및 테이프 자체가 가지고 있는 선형적인 특정 때문에 특정 데이터의 복구가 대단히 부자유스러운 치명적인 단점이 있는데, 이러한 것을 극복하고자 흔히 2차 스토리지라고 부르는 값싼 대용량 디스크 솔루션이다.
하지만 과연 관리자가 그 모든 데이터를 일일이 어떤 스토리지에 보관해야 할지를 항상 결정하고 수동으로 옮긴다는 것이 가능할까? ARX 자체에 미리 정의할 수 있는 룰에 따라 자동으로 데이터를 옮길 수 있고 그에 대한 결과를 검토해 볼 수 있다.
이를테면 과거 60일 이내의 데이터는 고성능의 1차 스토리지에 저장하고, 그 이전의 데이터는 보다 저렴한 2차 스토리지에 저장하도록 사전에 룰을 정의해 놓는 것이다. 뿐만 아니라 특정 파일에 대해 액세스 빈도수에 따라 오래된 데이터라 하더라도 액세스가 많은 데이터는 1차 스토리지에, 최근에 생성된 데이터라 하더라도 액세스 빈도수가 적은 데이터는 2차 스토리지에 저장하도록 자동화하는 것이 가능하게 된다.
이러한 솔루션을 보통 ILM(Information Lifecycle Management) 혹은 DLM(Data Lifecycle Management) 솔루션이라고 부르는데, 지금까지는 소프트웨어적인 방법에 의존해 왔다.
하지만 ARX의 경우 스위치 내에서 모든 작업이 이뤄나기 때문에 솔루션 적용으로 인한 전체적인 성능저하를 근본적으로 막을 수 있으며 아울러 이기종 파일 스토리지를 자유롭게 혼합해 구성하는 데에도 아무런 문제점이 없게 된다.

·재해 복구 혹은 데이터 복제
재해 복구와 비슷한 맥락에서 생각해 볼 수 있는 문제중의 하나가 바로 원격지로의 데이터의 효과적인 분배 문제다. 웹 애플리케이션의 경우 CDN(Contents Delivery Network) 혹은 ECDN(Enterprise Contents Delivery Network)과 같은 솔루션을 사용해 중앙의 웹 애플리케이션을 원격 사이트에 미리 복제본을 가져다 놓고 원격지의 사용자에게 빠른 액세스 효과를 가져다 줄 수 있다.
이러한 개념을 웹 애플리케이션뿐만 아니라 모든 파일 데이터로 확장시킨 것이 ARX의 DR솔루션이다. 즉, 메인 센터내의 데이터를 제 2, 제 3센터로 사전에 특정한 룰에 의해 읽기만 가능한(Read-Only) 복제본을 옮겨 놓고 사용자가 가장 가까운 곳의 데이터를 액세스할 수 있게 함으로써 전체적인 액세스 시간을 획기적으로 단축시킬 수 있는 것이다. 이렇게 하면 메인 센터의 장애시 재해 복구 센터로서의 역할을 수행할 수 있을 뿐만 아니라, 당연히 메인 센터의 복구시 역으로 데이터를 복구할 수도 있다.
기존의 스토리지 제조사의 재해 복구 솔루션의 가장 첫 번째 조건은 메인 센터와 재해 복구 센터의 스토리지가 동일 기종, 혹은 최소한 동일 제조사의 제품이어야 한다. 이는 스토리지 도입 결정에 커다란 제약 사항으로 작용할 수밖에 없었다. 하지만 ARX의 DR 솔루션은 메인 센터와 재해 복구 센터, 혹은 원격 사이트의 스토리지 기종 및 제조사에 전혀 무관하게 자유롭게 데이터를 복제 및 복구할 수 있다.

향후 시장 전망
전 세계 시장도 마찬가지지만 국내 시장 역시 NAS 시장보다는 SAN 시장이 매출을 비교해보면 그 규모가 훨씬 크다. 하지만 IDC를 비롯한 각종 시장 조사 기관의 발표를 보면 향후 몇 년간 꾸준히 스토리지 시장이 한자리 숫자의 성장을 해 나가는 중에 유독 NAS 및 파일서버 시장만이 두 자리 숫자의 성장을 거듭 해 나갈 것으로 예측하고 있다.
이와 같이 파일 스토리지의 비중이 날이 갈수록 급격히 증가함에 따라 이에 대한 관리적인 측면과 효율성에 대한 고려가 무시될 수 없게 됐다. 이러한 경우 파일 서버 및 NAS 스토리지의 가상화를 통해 클라이언트에게는 서비스 중단 없이 모든 디스크 자원의 효율적인 활용이라는 장점을 줄 수 있고, 관리자에게는 정확한 수요 예측과 자유로운 물리적인 스토리지 구성 변경 및 데이터 마이그레이션으로부터의 해방을 가져다 줄 수 있다. 더 나아가 회사에게는 불필요한 스토리지의 추가 도입 및 각종 구성 변경으로 인한 서비스 중단으로 비롯되는 기회 손실 비용을 현저히 줄일 수 있는 솔루션이 될 것이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.