Cover Story - CDP(Continuous Data Protection) 시장분석
상태바
Cover Story - CDP(Continuous Data Protection) 시장분석
  • 승인 2006.03.15 00:00
  • 댓글 0
이 기사를 공유합니다

쉬지말고 보호하라 ...서서히 수면 위로 부상 중
실시간 복제.정기적 스냅샷 기능 지원해야 ...제품들간 큰 폭의 차이

이제 IT에서는 며칠, 심지어 몇 시간이 지난 백업에서 복원하는 것으로도 부족하다. 바로 CDP(Continuous Data Protection)가 필요한 시점이다. 이 달에는 CDP 기술을 구성하는 것들이 무엇인지를 살펴보고, 오늘날 이용 가능한 제품들의 능력과 한계를 검토해 봤다.

데이터를 백업하는 데 사용하는 기술은 9 트랙 테이프에서 시작해 많은 발전을 거듭해 왔지만, 오늘날 비즈니스가 의존하고 있는 실시간 온라인 애플리케이션을 따라가지 못하는 회사의 정책들이 너무도 많다.
매 시간 수백 건의 고객 트랜잭션을 저장하는 데이터베이스는 정기적인 야간 백업 이상의 것을 필요로 하며, 그 해결책은 바로 CDP(Continuous Data Protection)가 될 수 있다. CDP 제품은 전통적인 백업의 대체품은 아니지만, 트래픽 양이 많은 시스템이 갑자기 잘못될 경우 곤란한 상황에서 벗어나도록 해줄 수 있다.
회사들은 이 개념을 천천히 받아들이고 있다. 본지 설문조사에서 응답자의 40%가 현재 CDP를 두고 있거나 12개월 이내에 할 예정이라고 답했으며, 41%가 계획이 없다고, 그리고 19%가 24개월 내에 이행할 계획이라고 답했다.
그렇다면 CDP는 IT 전략의 어디에 들어맞을까? 포괄적인 데이터 보호 계획이라면 세 가지 기본 능력을 포함하고 있어야 한다. 우선 보통은 카피를 만드는 방법을 이용해 데이터를 만들고 관리하는 호스트와 애플리케이션으로부터 데이터를 보호해야 한다. 불량 프로세스(즉 데이터베이스 서버에 있는 웜이나 바이러스)에 의해 데이터가 손상이 되면 애플리케이션 복구를 위해 이 보호되는 카피로 액세스를 할 수 있어야 한다. 그리고 보호되는 데이터 카피나 뷰들은 너무 많은 데이터를 유실시키지 않고 애플리케이션의 데이터를 유용한 뷰로 전환시킬 수 있을 만큼 충분히 세밀해야 한다. 일부 업체들은 스냅샷(snapshot) 기술이 이러한 필요를 충족시켜 준다고 주장하지만, 스냅샷에는 한계가 있다.
둘째, 주 데이터 카피가 보관되는 스토리지 장비에서 백업 데이터를 제거하라. 이것은 단일 디스크 어레이 오류로 인해 주 데이터와 백업 데이터가 모두 파괴되거나, 둘 다 액세스가 불가능하게 되는 일을 막아준다.
셋째, 로컬 구내장비로부터 데이터를 제거하라(그 유명한 오프사이트 백업). 장애 복구에서는 거리가 열쇠다. 사실 우리 설문조사에서, 오프사이트 백업은 독자들이 CDP에 통합하고자 하는 프로세스로서 가장 자주 언급됐다.

스냅샷, 한계가 있다
지능적인 SAN 장비나 디스크 어레이 기능들과 함께 통합돼 호스트 소프트웨어에 의해 제공될 수 있는 데이터 복제 시스템은 주 스토리지에서 보조 스토리지로 데이터를 복제함으로써 데이터 센터에서 이것을 복사할 수가 있으며, 원래는 이것이 실시간으로 가능하다. 하지만 복제로 인해 사용자와 애플리케이션의 제어권에서 데이터가 벗어나지는 않는다. 실무에서 우리는 한 임원이 민감한 문서의 카피 두 개를 서버에 두고 싶지 않아 하나를 지우는 것을 목격했다. 이러한 삭제는 눈 깜짝할 사이에 주 시스템과 부 시스템 모두에서 데이터를 제거한다.

데이터를 사용자, 멀웨어 및 기타 손상 소스의 범위에서 벗어나게 하면서 동시에 세분화된 복원 지점을 제공하기 위해 사용돼 온 전통적인 방식은 정기적인 스냅샷(periodic snapshot)을 확보하는 것이었다.
호스트 기반, 혹은 보다 일상적으로 디스크 어레이 기반의 구성에서 우리는 스플리트 미러(split-mirror)나 카피 온 라이트(copy-on-write) 기술을 이용해 다중 복원 지점을 만들 수가 있었다. 하지만 스냅샷은 하나의 데이터 보호 메커니즘으로서 심각한 한계를 보이고 있다. 이들은 보호하고자 하는 데이터베이스를 돌리는 호스트와 같은 호스트에 추가되는 볼륨이며, 따라서 처음에 데이터를 손상시켰던 그 멀웨어와 소프트웨어 결함에 취약하다. 혹은 이들은 같은 디스크 어레이 서브시스템에 있기 때문에 디스크 시스템의 오류로 인해 데이터와 전체 스냅샷이 모두 망가질 수 있다.
디스크 어레이 기반 스냅샷에서의 또 다른 문제는 일반적으로 할 수 있는 일이 스냅샷을 보통 읽기 전용의 추가 볼륨으로 쌓아가거나, 혹은 주 볼륨을 스냅샷이 확보됐을 때의 상태로 돌려놓는 것밖에 없다는 점이다. 변덕스러운 개발자가 이것을 손상시키기 이전에 생산 스냅샷에서 생산 데이터베이스를 복원하고, 스냅샷들 간에 데이터를 캡처하기 위해 로그파일 전송을 신중하게 수행하는 노련한 데이터베이스 관리자라면 이 정도로 충분할 수 있다. 단 IT 세계에서는 신중하게란 말이 ‘새벽 4시가 넘도록 앉아 있으라, 엉덩이가 아프게’란 뜻임을 명심하라.
하지만 선임 VP가 바로 복원해야 하는 엑셀 스프레드시트를 찾으려 하는데 마지막으로 이것을 언제 보았는지를 정확히 기억하지 못할 경우에는 정확한 버전의 파일을 찾느라 엄청난 시간을 스냅샷 마운팅에 보내게 될 수 있다. 게다가 대부분의 시스템에는 몇 개의 스냅샷 밖에 보관돼 있지 않다. 누군가 일을 하고 있을 하루 12시간 동안의 시간별 스냅샷을 원할 경우에는 전형적인 64 스냅샷 캐시를 통해 지난 주의 데이터만 복원할 수 있다.

트랜젝션 DB 보다 파일 보호 욕구 커
데이터 보호 계획을 짤 때는 모든 데이터가 같지 않다는 사실을 알아야 한다. 물론 오래된 데이터일수록 아카이빙(archiving)이 돼야 한다. 신선한 데이터의 경우에는 미션 크리티컬한 부분이나, 주어진 세트의 추정 가치에 대해 괴로워하기보다 재생산성(reproducibility) 부분을 생각해야 한다. 예를 들어 로펌의 마이크로소프트 워드 문서가 있다고 하자. 이들은 크리티컬하기도 하지만 재생산도 가능하다. 우리가 로펌에서 파일 서버를 한시간(심지어 두 시간)된 백업이나 스냅샷으로 전환시켜야 한다면 불평은 듣겠지만 사용자들이 서류와 계약서를 고쳐쓸 수 있게 된다.
반면에 이메일 서버가 한 시간을 거슬러 올라가야 한다면 내일 공판이 열리기 이전에 상대편 위원회에서 협정 타결을 제안했다는 사실을 아무도 모를 것이다. 마찬가지로 전자상거래 사이트 뒤에 있는 데이터베이스가 한 시간어치의 트랜잭션을 유실한다면, 그 한 시간분의 매출뿐만 아니라 일부 고객들까지도 잃게 된다.
본지 설문조사 결과, CDP 시스템으로 보호하고 싶은 게 무엇인지를 묻는 질문에서 트랜잭션 데이터베이스는 파일보다 두 배나 더 자주 언급됐다. 이러한 주제들을 다루기 위해 마이크로소프트, 시만텍 및 IBM 등과 같은 대기업에서부터 소위 창고형 신생업체들에 이르기까지, CDP를 제공하는 제품들을 내놓고 있다. 하지만 지금 우리 입장에서 보기에 이런 대부분의 제품들에 공통되는 유일한 한 가지는 CDP란 약어를 사용하고 있다는 것뿐이다.

CDP의 역사와 정의
CDP란 말을 처음 접할 수 있었던 것은 1990년 넷월드에서 보텍스시스템즈(Vortex Systems)에서 레트로크론이라는 제품을 선보였을 때였다. 레트로크론은 보조 디스크 드라이브로 쓰기를 저널링(journaling)한 네트웨어 파일 서버용 외장형 디스크 서브시스템이었다. 명령어 라인 유틸리티들을 통해 특정한 임의의 때에 주 볼륨으로부터 데이터를 포함한 추가 볼륨을 마운팅할 수가 있었다.
레트로크론은 시대를 앞선 까닭에(그리고 우리 기억이 옳다면 디스크 서브시스템으로서는 느린 속도로 인해) 시장에서 실패했으며, CDP는 우리 레이더망에서 사라졌다. 하지만 기술의 발전으로 인해 15년 전만 해도 손에 넣기 힘든 신화속의 원소는 이제 가능하게 됐다.
오늘날에는 SNIA(Storage Networking Industry Association)의 CDP SIG(Special Interest Group)에서 CDP를 다음과 같이 정의하고 있다.
“데이터의 변경 상태를 지속적으로 캡처 및 추적하고, 주 데이터와 독립적으로 변화된 것들을 저장함으로써 과거 어느 지점에서부터든 복원을 할 수 있게 해주는 방법론. CDP 시스템은 블록, 파일, 혹은 애플리케이션 기반이 될 수 있으며, 무한하게 변경 가능한 복원 지점으로 객체들의 복원이 가능한 정밀한 입도(granularity)를 제공할 수 있다.”
일부 순수주의자들은 이 정의를 있는 그대로 해석해 CDP로 불리는 제품은 데이터를 무한한 수의 복원 지점까지 복원할 수 있어야 한다고 주장하기도 한다. 우리는 이보다는 융통성을 발휘해 여기서 ‘무한’이란 용어는 제외시키기로 했다. 사실상 쓰기가 이루어질 때마다 변화가 기록이 되며, 이런 변화 지점들이 무제한에 가깝도록 복원이 가능하다.
우리는 스냅샷 앤 엑스포트(snapshot-and-export) 모델을 사용하거나, 혹은 실시간으로 백업 리포지터리(repository)에 변화된 것을 보내지 않는 다른 방법인 슈도(pseudo) CDP를 사용하는 제품들을 범주에 포함시켰다. 파일즈엑스(FilesX)의 엑스프레스 리스토어(Xpress Restore), 망크로소프트의 데이터 프로텍션 매니저(Data Protection Manager) 및 미모사 시스템(Mimosasa System)의 니어포인트(NearPoint) 등과 같은 슈도 CDP 제품들은 덜 중요한 재생 불가능한 데이터의 백업 관리를 훨씬 수월하게 해줄 수 있지만, 하나에 의존하면 장애시 몇 분동안의 데이터를 유실할 수 있다는 점을 명심해야 한다.

‘무제한은 없다(?)’
시만텍(Symantec)의 백업 이그젝 컨티뉴어스 프로텍션 서버(Backup Exec Continuous Protection Server) 같은 제품에는 약간 더 관대한 마음이 든다. 이것은 데이터를 실시간으로 백업 리파지토리로 복제하지만 무제한의 복원 지점을 제공하지는 않으며, 대신 정기적으로 스냅샷을 확보한다. 분주한 온라인 트랜잭션 프로세싱 시스템용으로 적합한 솔루션은 아닐지 몰라도 이런 업체들의 제품을 연속적(continuous)이라고 부를 수 있게 허용하고자 한다.
복원 지점이 무제한으로 있다는 것은 실제보다도 이론상 더 그럴듯해 보이는 게 사실이다. 개발자가 생산 서버에서 새로운 인벤토리 루틴을 테스트하고 이로 인해 데이터를 손상시키기 이전에 SQL 서버 데이터베이스를 복원하려 한다면, 언제 이런 일이 일어났는지 추측하고 싶지는 않을 것이다.
CDP 시스템이 SQL 서버(혹은 오라클이나 DB2) 인지가 가능하기를 원할 것이며, 시스템 체크포인트, 네임드 트랜잭션(Named Transactions) 및 기타 애플리케이션 전용 이벤트들을 이용해 복원 스케줄 주석을 달고 싶을 것이다. 이들은 말보다 실체가 더 어려우며, 이런 것들을 관리해 줄 수 있는 제품이 더 반가운 이유도 바로 이 때문이다. 이런 점을 감안할 때 임의 시간(arbitrary time)을 선택하고 데이터베이스를 구성하는 파일을 복원시키기만 한다면, 부분적으로 포스팅된 트랜잭션이나 다른 내부적인 모순이 하나 이상 있는 경우는 지나쳐버릴 가능성이 많다.
데이터베이스 디자이너들은 이런 현상을 “크래시 불일치(crash inconsistency)”라고 부르며, 이런 상태를 인식하고 부분적으로 포스팅된 트랜잭션을 버림으로써 이것을 깨끗이 청소해 주는 복구 루틴을 만들었다. 윈도 VSS(Volume Shadow Copy Service)에서 제공하는 것과 같은 일관성 트리거(consistency trigger)는 10분마다 데이터베이스를 일관성 있는 상태가 되도록 강요할 수 있으며, 트랜잭션 로그로부터 포워드 롤링을 할 수 있다.
업체들은 CDP 제품을 만드는 데 있어 몇 가지 다른 방식을 택하고 있다. XO소프트(XOsoft), 팔콘스토어(Falcon-Stor) 및 카샤(Kashya) 등과 같은 복제 업체들은 기존의 기술에 변형을 가했다. 즉 이들은 실시간으로 데이터를 캡처하고 원격 시스템에 지속적으로 전송을 함으로써 변화를 저널링하고, 시간이나 애플리케이션에 따른 저널에 주석달기를 제공하고, 롤백 엔진(rollback engine)을 만드는 방식으로 CDP를 지원하고 있다.
XO소프트는 롤백을 자사의 왠싱크(WANSync) 호스트 기반 복제 제품의 기본 사양으로 포함시키는 수준까지 발전했다. 이 회사는 또한 복제 기능 없이 데이터 캡처와 롤백 기능을 통합시킨 엔터프라이즈 리와인더(Enterprise Rewinder)라는 제품도 만들었다. 엔터프라이즈 리와인더는 보호되고 있는 시스템에 자신의 저널을 저장한다.

어플라이언스 CDP 제품 선호
제2부 CDP 제품 리뷰에 포함된 호스트 소프트웨어 제품들 외에 CDP 어플라이언스를 제공하고 있는 업체들도 있다. CDP와 같은 애플리케이션을 어플라이언스에 두면 이행 속도가 빨라지며, 호스트 애플리케이션용으로 소중한 프로세스 사이클을 남길 수 있고, 업체 측에서 포팅보다는 사양과 기능 및 테스팅에 R&D 비용을 지출할 수 있게 해주며, 무대행자 어플라이언스의 경우 유명하지 않은 애플리케이션이나 OS가 있는 사용자들도 CDP의 혜택을 누릴 수 있게 해준다. 사실 우리 설문조사 응답자들의 절반 이상이 어플라이언스 CDP 제품을 선호한다고 답했으며, 나머지 응답자들은 별도 서버 상의 애플리케이션 제품과 스토리지 어레이에 통합된 제품으로 반반씩 나뉘었다.
예를 들어 리비비오(Revivo)의 CPS 1200 어플라이언스는 호스트 서버와 애플리케이션을 다른 디스크 어레이와 마찬가지로 감시한다. 예전의 레트로크론과 달리 리비비오 어플라이언스는 서버 데이터를 저장하는 대신 사용자의 파이버 채널 어레이를 이용해 자신의 CDP 데이터를 저장하며, 사용자의 서버는 주 스토리지 어레이와 직접 통신을 하게 된다. 사용자가 해야 할 일은 애플리케이션의 주 디스크를 어플라이언스가 보여주는 LUN으로 미러링하도록 볼륨 매니저를 구성하는 것뿐이다.
리비비오에는 에이전트가 없기 때문에 애플리케이션이 체크포인트나 다른 심각한 이벤트에 도달할 때를 알 수가 없다. 애플리케이션에 의해 사용되던 예전 버전의 볼륨에 액세스하고 싶을 경우에는 특정 시간용으로(초 단위까지) 가상 볼륨 세트를 만들어야 한다. 일단 뷰가 만들어지면 이것을 호스트로 마운팅하고 데이터를 확인(validation)할 수 있다.
몇몇 제품들은 이런 종류의 복원 뷰를 만들 수 있지만, 대부분은 데이터가 복사 및 복원될 수 있는 읽기 전용 뷰만을 제공하고 있다. 대형 데이터베이스에서는 이렇게 하는 데 오랜 시간이 걸릴 수 있다. 리비비오는 바로 이용이 가능한 읽기-쓰기 가상 볼륨을 제공할 뿐만 아니라, 백그라운드에서의 복구 뷰와 맞추기 위해 데이터의 주 카피를 롤링해 바뀌어야 하는 블록만을 복사하기 때문에, 가능한 한 완전하게 보호받는 상태로 다시 돌아갈 수 있다.
복제용으로는 두 가지 어플라이언스, 즉 FCIP나 다크 파이버(dark fiber) FC와 많은 대역폭이 필요할 것이다. 보안은 보통 조닝(zoning), LUN 마스킹(masking) 및 기타 표준 FC 기술들에 의해 제공이 된다. 데이터 암호화를 원한다면 네오스케일시스템즈(NeoScale Systems)나 캐스턴체이스(Kasten Chase)와 같은 별도의 장비를 구입해야 할 것이다.
카샤의 KBX5000 또한 마찬가지로 서버와 그 주 스토리지 사이의 데이터 경로 바깥에 있는 파이버 채널 SAN에 배치가 된다. KBX5000은 쓰기 복사를 위한 SANtap이 있는 시스코의 MDS 9000 등의 지능형 SAN 스위치나 호스트 대행자를 이용해 IP나 파이버 채널에서 동기적으로나 비 동기적으로 보조 KBX5000으로 복제를 함으로써 원격 보호나 로컬 보호를 할 수 있다. 호스트 대행자를 사용할 경우에는 익스체인지, 오라클, SQL 서버 및 기타 VSS 애플리케이션용 이벤트로 시간 흐름(time stream)에 주석을 달 것이다.
멘도키노 소프트웨어(Mendocino Software)는 최근에 자사의 리커버리원(RecoveryOne) 소프트웨어를 HP 어플라이언스에 번들링하도록 HP와 재판매 계약을 맺은 바 있는 전도유망한 업체로, EMC는 멘토키노의 기술을 자사의 리커버리 포인트(Recovery Point) 어플라이언스의 코어로 이용하고 있다. 유닉스, 리눅스 및 윈도용 대행자를 갖춘 멘도키노는 애플리케이션 인지 CDP에서 최고라고 할 수 있다.
멘도키노 대행자는 블록 레벨에서 디스크 쓰기를 보제하고, 이 데이터를 어플라이언스로, 저널로 전송한다. 이것은 또한 데이터베이스 체크포인트와 다른 이벤트에서 메타데이터를 전송하는데, 리커버리원 어플라이언스는 복구 뷰를 만들고 싶은 지점을 선택하는 타임라인에 따라 이것을 보여준다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.