Tech Guide 디스크 백업
상태바
Tech Guide 디스크 백업
  • 승인 2006.05.23 00:00
  • 댓글 0
이 기사를 공유합니다

디스크 백업, 진보는 계속된다
자체 튜닝·COD·백업 SW 연동 등 진보 지속 … 자동 압축률 관리 등 향후 과제

지난 호에는 디스크 기반 백업이 대두가 되고 있는 이유와 여러가지 디스크 기반 백업 솔루션에 대해서 간단하게 살펴봤다. 최근 화두인 디스크 기반 백업의 배경과 적용 방법에 이어 이번 호에는 지난 호에서 언급한 디스크 기반 백업 솔루션 기술의 진보에 대해서 자세히 살펴본다. <편집자>

강연식

네트워크어플라이언스코리아 과장
Yuensik.Kang@netapp.com '

지난호에서 언급한 것 같이 디스크 기반 백업은 기존의 백업 방식(테이프 방식)의 여러가지 문제점들(백업/리스토어 속도, 백업/리스토어의 불확실성 등)과 디스크 가격의 하락으로 대두됐다.
이런 디스크 기반 백업 솔루션들은 크게 가상 테이프 시스템(VTLs) 방식과 디스크 시스템 방식(백업 소프트웨어를 이용한 방식과 벤더의 디스크 기반 시스템 방식)으로 나눌 수 있다. 다양한 디스크 기반 백업들은 각각 적용 환경과 장단점을 가지고 있고 고객환경에 올바르게 적용될 때 효용가치가 높다고 하겠다. 각 디스크 기반 백업 방식에 따른 기술 및 장단점을 살피면 다음과 같다.

VTL 방식과 용도
가상 테이프 라이브러리(Virtual Tape Library)는 가상 테이프 시스템(VTS), 디스크 기반 라이브러리(DLs), 디스크 기반 백업 디바이스 등 여러 가지 이름으로 시장에서 통용되고 있다. 가상 테이프 기술은 지능화된 스위치나 스토리지 가상화처럼 새롭게 등장한 기술은 아니다. 가상 테이프는 시간에 걸쳐 테스트돼 왔고 이미 증명된 기술이다.
가상 테이프 시스템의 장점은 기존 백업 프로세서 유지, 백업/리스토어 시간의 단축과 운영 비용 절감이라고 말할 수 있다. 가상 테이프 시스템은 하드 디스크 스토리지를 사용함으로써 빠르고 랜덤하게 원하는 위치로 옮길 수 있고 필요한 데이터를 효율적으로 관리할 수 있는 장점이 있다. 가상 테이프는 HSM(Hierarchical Storage Management)과 함께 저비용의 스토리지 미디어 팜 형태로 구성해 사용될 수 있고 또한 SAN(Storage Area Network)의 형태로 구성해 사용될 수도 있다. 보통 FC로 연결해 구축함으로써 고속의 백업환경에 맞게 구축되는 게 일반적이고 IP를 통해서 거리 제한 없는 구축도 가능하다.
VTL의 형태는 크게 두 가지로 나눌 수 있다.
첫째, VTL로 에뮬레이션(Emulation)할 수 있는 게이트웨이를 스토리지 앞단에 설치, 일반 스토리지를 서버에서 테이프 라이브러리로 보이게 하는 소프트웨어 방식의 VTL제품이 있다. 이 경우 디스크 직접 백업보다는 관리적인 측면에서 몇가지 장점을 가져갈 수는 있지만 게이트웨이 뒷단 스토리지 제품 자체는 기존 랜덤(Random) 접근에 최적화돼 있으므로 성능적인 이슈가 발생하는 문제점을 포함하고 있다. 하지만 기존 스토리지 시스템을 재사용한다는 관점으로 볼 경우에는 효율적인 구성이라고 볼 수 있다.
둘째, 스토리지 자체가 VTL기능을 제공해주는 제품으로써 하드웨어적으로 스토리지를 에뮬레이션해 테이프 라이브러리처럼 보이게 하는 제품이다. 이러한 하드웨어적 VTL제품의 가장 큰 특징은 기존 디스크 기반 VTL의 장점 외에도 ‘순차기록(Sequential Write)’에 최적화 되도록, 즉 백업 인프라에 최적화되도록 디자인돼 있으므로 소프트웨어적으로 구성되는 VTL에 제품에 비해 높은 백업 및 복구 성능을 제공하며, 심지어 기존 테이프 라이브러리의 성능에 비해 보다 높은 수치를 제공할 수 있다.
이처럼 각 구성 환경에 따라 백업 인프라를 비용적인 측면이나 관리적인 측면에서 효율적으로 구성할 수 있는 다양한 제품들이 있으며 단계에 따라 추가적인 여러 장점을 제공한다.
VTL은 우선 BC 및 DR 용도로도 사용될 수 있다.
VTL 장비를 어떻게, 어떤 용도로 사용할 것인가에 대한 이해가 BC(Business Continuance)와 DR(Disaster Recovery)을 지원하기 위한 첫 번째 스텝이다. 예를 들어 VTL 제품을 일간 또는 주간 백업용으로 사용하고, 니어라인 스토리지를 고정 콘텐츠, HSM 또는 아카이빙용으로 사용한다면 VTL은 기존의 전통적인 백업/복구 작업과 통합될 수 있다. 뿐만 아니라 스냅샷, 순간 복제, 데이터 보호 기능과도 연계가 가능하다. VTL을 오프사이트 용도로 사용한다면, VTL은 테이프장비의 수동적인 작업을 줄일 수 있으며, 테이프 드라이브 분실로 인한 데이터 손실과 같은 가능성을 없앨 수 있다.
운영의 관점에서 볼 때는 BC(Business Continuance)와 DR(Disaster Recovery)을 지원하는 VTL은 기존의 데이터 보호 소프트웨어와의 연동을 위해 다양한 종류의 테이프 드라이브와 라이브러리를 제공해야 하고 원격 볼팅(Vaulting)도 지원해야 한다.
이러한 솔루션적인 측면과 함께 VTL은 RAS(Reliability, Availability, Serviceability)를 향상시키기 위해 모든 구성요소의 이중화를 실현해야 하고, 컨트롤러 장애 시 페일오버(Failover) 기능도 제공해야 한다. 이러한 클러스터 VTL은 확장에 따라 가용성, 연결성, 성능 그리고 용량 확장 능력도 제공해야 한다.
VTL은 다양한 용도로 활용할 수 있도록 디스크의 장점과 테이프의 장점이 결합됐다. VTL은 그 자체만으로 여러 용도로 사용될 수 있지만 VTL 장비에 따라서 테이프 장비와 직접 연결을 통해서 데이터를 효율적으로 소산시킬 수 있고, 또한 디스크와 테이프 장비의 용량을 합하여 백업 소프트웨어에서 통합 풀로서 관리할 수도 있다.

디스크 시스템 방식
디스크 기반 백업 시장(D2D 백업 시장) 중 중요한 부분을 차지하고 있는 시장 중의 하나가 Disk As Disk, 즉 백업 소프트웨어의 타깃이 테이프 드라이브 또는 테이프 라이브러리 대신 디스크 어레이로 구성되는 방식이다. 이 방식의 경우 대부분 백업 소프트웨어와 연동해 디스크상에 미디어 파일을 생성한 후 그 부분에 데이터를 저장하는 방식이 주를 이루고 있다. 이 경우 서버는 스토리지로 직접 인식하지만 백업솔루션을 통해 볼 경우는 여러 테이프 미디어로 구성돼 있는 것으로 볼 수 있다. 이렇게 백업 소프트웨어를 이용하는 방식은 이기종 환경에서 적용할 수 있다는 특징이 있으나, 기존 백업 환경 변경이란 불편함이 있다.
또다른 형태의 디스크 시스템 방식은 벤더에서 제공하는 디스크 기반 백업 방식이다. 벤더에서 제공하는 디스크 기반 백업 방식은 각각 벤더마다 여러 유용한 기능을 탑재하고 있으며, 단일 벤더의 환경에서 최상의 성능 및 기능이 구현되는 경우가 많다.
● 백업 소프트웨어를 사용하는 방식
백업 소프트웨어를 사용하는 방식의 경우에는 보통 고용량/저비용의 SATA 방식의 디스크를 사용하는데 목적에 따라서 특화된 디스크 어레이를 사용하는 경우도 있다. 백업 소프트웨어에서는 디스크 백업 모듈을 추가함으로써 테이프 대신에 디스크로 직접 백업을 수행한다.

장점 이 방식은 2차 디스크 어레이가 용량을 확장할 수 있는 한 특별한 추가 비용이 없다. 모든 주요 백업 벤더에서 디스크 기반 타깃을 지원하며 백업 타깃을 기존 테이프 장비에서 디스크로의 전환 절차를 수행할 수 있다. 특화된 디스크 어레이를 사용 할 경우에는 디스크 용량에 한계가 왔을 때 테이프 장비로 데이터를 소산시킴으로서, 디스크 용량을 늘려주는 기능을 제공할 수도 있고, 디스크 용량을 효율적으로 사용하기 위해서 압축 기능을 제공하는 경우도 있다.

단점 대부분의 경우에 백업 타깃을 네이티브(native) 디스크로 사용한다는 것은 장기 보관을 위해서 데이터를 어떻게 소산할 것인가 등 여러 기존 백업 절차를 다시 수정해야 한다는 의미이다. 디스크 시스템은 서로 다른 OS(Operating Systems)를 지원하기 위해서 파티셔닝돼야만 하고 용량은 여러 파티셔닝에 걸쳐 공유될 수는 없다. 때문에 만약 어떤 OS의 백업 요구 사항이 증가하면 디스크 시스템은 재할당이 필요할 수도 있다. 네이티브 디스크 어레이는 기본적으로 디스크를 구성할 수 있는 기본 인터페이스를 제공하지만, 백업 작업을 모니터링 할 수는 없는 단점이 있다.

●벤더에서 제공하는 디스크 기반의 백업 방식
이 방식의 경우에는 스토리지 벤더에서 데이터의 백업 및 성능을 최적화하기 위해 스토리지 기반에서 구동되는 방식이다. 성능 및 관리 측면에서 백업 소프트웨어 방식이 제공치 못하는 여러 특징들을 제공 한다. 어떤 벤더는 스냅샷 기술을 기반으로 스토리지 시스템간 혹은 이기종의 스토리지를 사용하고 있는 전산 환경에서 디스크 기반의 백업을 수행할 수 있는 솔루션을 제공한다. 최초 사용되고 있는 데이터를 풀(Full) 백업받은 후 최소 매 시간 단위로 변경된 블럭만을 네트워크를 이용해 2차 디스크로 전송한다.
2차 스토리지에서는 매 시간단위로 스냅샷을 이용해 백업 데이터의 버전을 관리하기 때문에 변경된 데이터 블럭만 전송하지만 사실은 풀 백업 이미지로 관리할 수 있다. 즉, 증분 풀 백업 이미지(Incremental Forever, full backup image)를 구현할 수 있다. 일반적으로 주말에 풀 백업받은 후 매일 증분 백업을 수행하는 사용자 환경의 경우, 수요일 데이터 복구를 시도하면 전 주에 백업 받은 풀 백업 이미지에, 월요일과 화요일 수행한 증분 백업을 병합해야 하는 번거로운 작업이 필요하지만, 벤더의 디스크 기반 백업 솔루션을 사용하면 최대 1시간 전의 풀 백업된 이미지로 디스크에서 바로 복구할 수 있다.

장점 벤더의 디스크 기반 백업 방식의 가장 큰 장점은 백업 서버를 거치지 않고 스토리지간에 전송되기 때문에 백업 서버의 부하를 없앨 수 있다는 점이다. 또한 벤더의 스토리지 기술이기 때문에 여러 유용한 기능을 개발해 포함시키기에 용이하다.

단점 디스크 기반의 백업 방식의 가장 큰 단점은 호환성 부문이다. 따라서 동일 벤더의 스토리지간에 구현되는 경우가 가장 많다. 물론 오픈 환경에서 서버에 에이전트(agent)를 설치해 벤더의 2차 스토리지로 백업을 구현하는 경우도 있다. 이러한 부분은 향후 인프라를 구성하는데 제약 사항이 되며 하나의 벤더에 묶이게 되는 경우도 있다. 다음은 VTL에서 지원하고 있거나 향후 지원해야할 기능들이다.

VTL의 진보된 기술
업계에서 디스크 기반 백업은 이미 VTL 방식과 여러 디스크 시스템 방식들로 나눠져 있고 각각 그 특성에 따라 자기만의 시장을 형성한 단계다. 이 중 VTL은 순차 백업에 최적화된 아키텍처와 향상된 기능으로 올해 더 많은 조명을 받고 있는 분야다. 현재 많은 스토리지/테이프/백업 벤더들이 저마다의 VTL 장비들을 보유하고 있고, 시장 선점을 위해서 벤더간 치열한 경쟁을 벌이고 있다.

자체 튜닝 기능 : 고객들이 VTL을 고려하고 있는 가장 큰 이유는 백업/리스토어의 성능 부문이다. 많은 벤더가 고성능 VTL 제품을 선보이고 있지만, 지속적인 백업 업무와 데이터 소산을 지속하다보면 VTL 장비의 부하 분산이 제대로 이뤄지지 않아 성능 감소의 주요 원인이 되기도 한다. 지금까지는 VTL 장비의 부하 분산을 인위적으로 수행하기 위해서 VTL 장비의 지속적인 모니터링 및 분석이 필요했고 분석 후 가상테이프 생성을 부하가 없는 물리적인 스페이스로 인위적인 분산을 수행했다. 하지만 자체 튜닝 기능은 VTL 스스로 부하가 몰리는 곳을 스스로 파악해 백업 스트림이 가장 가용한 또는 부하가 없는 곳으로 자동 변경된다.

COD 기능 : COD(Capacity On Demand)기능은 다른 말로 오버 얼로케이션(Over-Allocation)으로 불린다. 고객들이 현재 보유하고 있는 공간을 초과해 가상 테이프를 생성하고 관리할 수 있는 COD 기능은 용량에 상관없이 백업 용량 및 정책을 미리 정할 수 있고 향후에 요구되는 물리적 용량을 필요에 따라 추가할 수 있어 관리적인 면에서 유용한 기능이라고 하겠다.

효율적인 테이프 관리 기능 : 많은 VTL 제품들이 물리적 테이프 장비를 직접 연결, 여러가지 연계 방안을 제공하고 있다. 규모가 작은 사이트 같은 경우는 데이터 백업이 VTL만으로도 가능할 수 있지만, 데이터 백업량이 많은 규모있는 사이트의 경우에는 테이프 장비와의 연계를 통해서 백업 관리를 해야 되는 경우가 있다. 그렇기 때문에 VTL장비의 효율적인 관리뿐 아니라 물리적인 테이프장비로의 효율적인 소산 및 관리가 필요하다. 보통 VTL에서 테이프 장비로의 소산은 1:1관계로 소산이 된다. 즉 VTL의 하나의 카트리지가 물리적 테이프 장비의 카트리지로 카피 또는 소산되는 형식이기 때문에 소산시 카피되는 관계를 효율적으로 관리하는 것이 향후 테이프 장비의 용량을 줄일 수 있다. 따라서 VTL에서 테이프 장비로의 소산 시 테이프 장비에서 압축을 사용하면 압축률을 예상하여 테이프 장비의 미디어를 최대로 사용할 수 있게 하는 기능이 향후 유용할 것이라고 판단된다.

스토리지 기반 백업 솔루션의 진보된 기술
벤더에서 제공하는 스토리지 기반 백업 솔루션의 가장 큰 단점은 호환성이라고 앞서 언급했다. 이기종 환경에서 벤더들은 자사의 모듈을 서버에 탑재함으로써 환경의 제약을 극복하려 하고 있지만 기존 대부분의 사이트에서 백업 소프트웨어를 이미 사용 중이기 때문에 이는 중복투자로 이어질 수 있다.
벤더의 스토리지 기반 백업을 고려하고 있는 고객들은 대부분 백업 소프트웨어를 통한 방식이 제공하지 못한 성능 및 기능을 원하는 경우가 대부분이기 때문에 기존 백업 소프트웨어를 이용하면서 스토리지 기반 백업 솔루션을 적용할 수 있는 방향으로 진화하고 있다. 기존에는 주 스토리지와 2차 스토리지가 모두 같은 벤더이야 했고 또는 주 스토리지가 이기종 스토리지 제품이면 벤더에서 제공하는 모듈을 설치해야 했다. 하지만 백업 소프트웨어와 연동이 되면서 2차 스토리지만 구입을 하면 이기종 환경에서 벤더가 제공하는 스토리지 기반의 백업의 다양한 기능들을 사용할 수 있다.
지금까지 살펴본 바와 같이, 현재 디스크 기반 백업은 자체 튜닝 기능, COD, 효율적인 테이프 관리 기능, 그리고 스토리지 기반 솔루션과 백업 소프트웨어와의 연동 등 진보된 기능을 탑재해 가면서 진화해 나가고 있다. 이러한 기능들이 든 벤더에서 제공하는 것은 아니지만 향후 디스크 기반 백업에서 필요한 기능이 될 것이라고 생각되며 대부분의 벤더에서 유사한 기능을 지원할 것이라고 판단된다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.