스토리지 통합 및 데이터 관리
상태바
스토리지 통합 및 데이터 관리
  • 승인 2005.01.28 00:00
  • 댓글 0
이 기사를 공유합니다

효율적 데이터 관리에는 ‘디스크·테이프 상호 보완’ 필수

고속·안정성 뛰어난 SAN 백업 ‘대중화’ … 비용절감·성능향상 등 신중 기해야

연·재·순·서

1. SAN이란 무엇인가
2. 가상화를 이용한 스토리지 통합
3. 데이터의 효율적인 관리(이번 호)

설진산
서울일렉트론 시스템사업본부 S/N 사업부 대리
jssul@sel.co.kr

지금까지 SAN을 기반으로 하는 스토리지 통합 및 가상화에 대한 개념을 살펴봤다. 그렇다면 이러한 탄력적인(Flexible) 볼륨의 데이터를 어떻게 효율적으로 관리할 수 있을까? 우선 지금까지 나와있는 여러 가지 백업 솔루션들을 예로 데이터 관리의 기법들을 소개하고자 한다. 나아가 요즘 화두가 되고 있는 디스크를 이용한 백업 솔루션의 장단점과 기존의 테이프 기반의 백업 솔루션을 비교해 효율적인 데이터 관리의 방향을 짚어보도록 하자. <편집자>

백업의 형태는 크게 3가지로 구분할 수 있다. 초기의 백업은 서버에 테이프 디바이스를 직접 연결해 데이터를 백업하는 DAS 백업, 데이터의 백업과 디바이스를 관리하는 백업 서버를 두고 네트워크에 연결돼 있는 클라이언트들의 데이터를 그 백업 서버를 통해 백업하는 형태의 네트워크 백업, 그리고 SAN 환경에서 백업 서버와 미디어 서버, 클라이언트를 두고 그들의 데이터를 파이버 채널 프로토콜상에 마스터와 미디어 서버를 이용해 백업이 이뤄지는 SAN 백업 등 3부분으로 나눠진다.

백업의 변화 과정
DAS 백업
예전의 백업 형태는 대부분 DAS 형태의 백업 구조를 가지고 데이터를 관리했다. 당시에는 SCSI 인터페이스를 이용한 백업이 대부분이었고, 미디어의 용량과 속도는 현저히 낮았다. 이러한 백업 구조는 호스트에 직접 백업 디바이스를 연결하는 점대점(Point-to-point) 연결 방식을 이용했다.
그러나 데이터의 양이 점점 늘어나게 되고 호스트의 성능이 향상됨에 따라 사용되고 있는 인터페이스도 SCSI에서 파이버 채널(FC)로 변경돼 백업의 성능부분을 한층 개선하게 됐다. 백업 디바이스도 스탠드얼론(Standalone) 형태에서 여러 개의 테이프를 보관하고 로봇 팔(Robotic Arm)을 통한 백업의 자동화를 구현해주는 테이프 라이브러리의 등장으로 백업의 성능과 테이프를 이용한 데이터 관리 부분에서 많은 변화를 가져왔다.

네트워크 백업
네트워크 백업은 백업 디바이스와 백업 서버, 클라이언트들이 모두 네트워크에 연결돼 테이프 라이브러리가 연결돼 있는 싱글 백업 서버를 통해 네트워크 클라이언트 데이터를 백업하는 형태를 말한다. 이 구성은 네트워크에 부하를 주고 온라인 백업이 어려워 소규모의 원격 백업에 적합하다.
대형 네트워크 구성에서 데이터를 백업할 경우에는 백업전용 네트워크망을 구성해 백업하는 형태가 있는데, 비용이 많이 든다는 단점이 있다. 백업 디바이스를 하나의 싱글 서버가 아니라 여러 대의 서버에 연결해서 네트워크 데이터를 백업해 성능을 개선하려 했으나, 네트워크 백업은 여전히 성능 부분에서 문제점을 드러내고 말았다.

SAN 백업
요즘 대부분의 백업 형태는 SAN의 아키텍처를 기반으로 한 SAN 백업이 사용된다. SAN 백업은 기존에 사용되던 DAS 백업과 네트워크 백업에 비해 백업 성능 부분에서 상당히 높은 백업 성능 효과를 가져다 주는 백업 형태라고 할 수 있다. SAN 백업은 파이버 채널의 패브릭 스위치를 이용해 호스트와 테이프 장비를 연결함으로써 고용량의 데이터를 빠르게 백업할 수 있는 백업 구성이다. 다양한 백업 솔루션을 적용해 백업 성능을 한층 더 향상시킬 수 있는 백업 구조인 셈이다.
SAN 백업은 SAN 상의 장비 공유를 통해 백업 장비의 효율성이 뛰어나고, SAN을 통한 로컬 백업으로 네트워크에 부하를 주지 않으며, 백업의 멀티플렉싱/로드밸런싱을 이용해 고속의 백업 환경 구축이 용이하다. 이렇듯 SAN 환경을 이용한 다양한 솔루션을 통해 백업의 성능 부분이나 효율성을 향상시킬 수 있다. 다만 이러한 구성을 하기 위해서는 별도의 SAN 네트워크 구축에 따른 비용이 들어간다.

SAN 기반의 백업 솔루션
앞서 언급한 것과 같이 SAN 기반에서 다양한 솔루션을 적용할 수 있다고 했는데, 이를테면 랜-프리 백업과 서버-프리 백업, 디스크를 이용한 백업, 그리고 가상화의 스냅샷 기법을 이용한 백업 솔루션 등 여러 가지 백업의 성능과 데이터의 복구를 고려한 기법들을 들 수 있다.

랜-프리 백업
기본 아키텍처는 SAN을 통한 백업 솔루션이고, 네트워크의 부하를 전혀 주지 않으면서 SAN 기반에 연결돼 있는 로컬 백업이다 즉, 백업 서버 클라이언트에는 부하를 주지만 데이터가 SAN의 구성에서 백업이 이뤄지기 때문에 네트워크에는 전혀 부하를 주지 않고 백업하는 방식을 말한다.

서버-프리 백업
애플리케이션의 서버에 전혀 영향을 주지 않고 별도의 SAN 브리지를 이용해 데이터를 이동하는 데이터 무버(Data Mover)를 통해 백업의 성능을 보다 더 향상시킬 수 있는 솔루션을 말한다. 이 구성은 호스트에는 실제 데이터의 이동이 없고 매타 데이터만이 이동할 뿐이다. 실 데이터는 SAN의 환경에서 파이버 채널 케이블을 통해 데이터가 이동되기 때문에 성능이 더 향상된다. 이 기능을 사용하기 위해서는 서버의 부하를 줄이기 위해 별도의 데이터를 이동시켜 줄 수 있는 장비가 필요하다. 그것이 바로 데이터 무버이며, 크로스로드(crossroad)와 같은 브리지를 예로 들 수 있다.

디스크를 이용한 백업
디스크를 이용한 백업 솔루션은 두 가지로 나눌 수 있다. 디스크 어레이를 이용한 방법과 스냅샷 기법을 이용한 방법이다.
첫 번째로 디스크 어레이를 이용한 백업에는 백업데이터를 디스크의 한 영역으로 백업을 하는 디스크 1차 백업과 그 데이터를 테이프로 자동 소산 보관하게 해주는 2차 백업이 있다. 기존의 디스크 어레이를 테이프로 에뮬레이터해서 서버에서는 여러 개의 테이프로 인식할 수 있는 버추얼 라이브러리(virtual library)를 이용한 백업방식도 있다. 이런 것들이 데이터를 관리해주는 솔루션들 중 HSM이나 아카이빙의 한 부분이라고 말할 수 있을 것이다.
이렇게 디스크 기반의 백업솔루션이 나타나게 된 배경을 살펴보면 그 첫 번째 이유는 당연히 디스크 가격의 하락이라고 할 수 있다. 예전에는 디스크의 가격이 너무 비쌌기 때문에 백업용으로 사용할 미디어로는 부적절했다. 덕분에 소산 보관이 용이하고 가격이 저렴한 테이프가 주목받았다. 그러나 지금은 디스크의 가격이 큰 폭으로 하락하고, 저가형 디스크 어레이가 출시되면서 디스크를 이용한 여러 솔루션들이 나오기 시작했다. 현재 저가형 스토리지로는 ATA 및 SATA 스토리지를 들 수 있고, 주로 1차 백업용으로 많이 사용된다.
또 하나는 버추얼 라이브러리의 등장이다. 버추얼 라이브러리는 저가형 디스크를 레이드 레벨(예를 들어 RAID 5)로 구성해, 그것을 에뮬레이터 서버를 이용해 테이프로 인식하게 한다. 따라서 백업 소프트웨어는 레이드로 인식하는 것이 아니라 백업의 테이프 장치로 인식해 백업을 하게 되는 것이다. 테이프의 구성자체가 레이드로 구성돼 있기 때문에 디스크의 오류(Fault)에도 문제없이 백업과 복구가 가능한 구조여서, 백업의 안정성을 한층 더 보완해 주는 솔루션이 될 수 있다.
그러나 장점이 있다면 단점도 존재하기 마련이다. 디스크를 이용하면 랜덤 액세스 방식이기 때문에 성능 향상에는 당연히 테이프의 시퀀셜 방식에 비해 월등히 뛰어나다. 다만 전력소비가 많고 발열이 발생하며 이동성이 어렵다는 단점도 가지고 있다.
두 번째로 가상화의 스냅샷 기법을 이용한 솔루션을 들 수 있다. 기본적으로 SAN 기반에서 사용하고 있는 데이터의 볼륨을 가상화로 구현해 그 볼륨의 데이터를 스냅샷 기법을 통해 순간 복제를 하게 된다. 이렇게 해서 만들어진 스냅샷 볼륨을 백업에 이용하거나 다른 서버에 추가해 데이터를 이용하는 방식을 오프-호스트 프로세싱(Off-Host Processing)이라고 한다. 이 기법을 이용해 백업에 적용하게 되면 볼륨의 복제를 로컬이나 원격지로 복제함으로써, 수초 내지는 수분안에 업무의 연속성을 보장해 줄 수 있는 장점이 있다.

디스크와 테이프 비교
디스크를 이용한 백업은 테이프를 이용한 백업보다 당연히 성능면에서 우수하다. 그러나 데이터의 효율적인 관리 부분에서는 반드시 디스크만을 이용해서는 안된다. 왜냐하면 디스크의 장점이 있다면 단점도 있기 때문이다. 여기서는 디스크를 이용한 백업솔루션의 단점을 테이프의 특징에 접목시켜 보다 효율적인 백업 솔루션을 제시해 본다. 이렇듯 백업의 미디어로 디스크와 테이프는 상호 보완적인 관계로 인식해 나가야 할 것이다.

맺음말
지금까지 스토리지의 통합과 데이터 관리라는 주제로 SAN의 개념과 가상화, 그리고 데이터의 보호 솔루션 등 데이터의 효율적인 관리와 그 기반이 돼야할 요소들을 살펴봤다. 앞으로도 데이터 양은 계속해서 기하 급수적으로 증가하게 될 것이다. 그러한 데이터를 효율적으로 관리하는 것은 비용절감과 성능향상을 통한 손쉬운 데이터 관리만이 해결책이다. 이를 위해서는 SAN을 기반으로 한 데이터 통합과 가상화, 데이터 관리라는 3가지 측면을 이해하고 자신의 환경에 접목시킬 수 있는 솔루션을 찾는 것만이 요즘같이 급격히 증가하는 데이터에 대한 하나의 대안일 것이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.