> 뉴스 > 테크가이드 > 통신/네트워크
  • 트위터
  • 페이스북
  • 구플러스
  • 네이버밴드
  • 카카오스토리
     
1. 왜 CDP인가
Tech Guide - CDP
2006년 09월 15일 00:00:00
차세대 백업은 CDP가 책임진다
기업 데이터 실시간 보호 … 타임머신 기능으로 변경 데이터도 원하는 시점으로 복원

박희범 // 한국에이템포 기술지원부 부장 heebum.park@atempo.com

백업 솔루션의 차기 주자로 일컬어지는 CDP(Continuous Data Protection)는 실시간 데이터 보호란 내포된 의미에서도 알 수 있듯 기업의 중요한 데이터를 보호하는데 있어 핵심적인 역할을 수행한다. CDP 기술을 이용해 기업의 중요한 데이터의 변화에 대한 안전한 대비책을 확보하며, 시스템이 동작하는 이상 IT관리자는 더 이상 ‘백업’의 스트레스를 받지 않아도 된다. 기존 ‘백업’에 대한 관심에서 ‘복구’에 대한 관심사로 데이터 보호에 대한 패러다임을 바꾸고 있는 CDP에 대해 알아본다. <편집자>


연재순서
1. 왜 CDP인가(이번호)
2. CDP 제품의 포지셔닝


매일 밤 기업에서 수행되는 것이 그날 생성되고 업데이트된 데이터를 안전하고 신속하게 백업하는 일일 것이다. 테이프나 디스크(또는 VTL) 등 사용되는 백업 장치의 종류에 상관없이 정해진 일정 시간에 수행된다는 점에서 백업은 ‘스케줄(Schedule)’ 개념이 적용된 행위다.
백업 미디어적인 측면에서 볼 때, 전통적으로 사용해오던 테이프 백업 장치는 백업 장치로 점차 디스크가 많이 사용되면서 점차 소멸될 것이라는 분석가들의 기대를 뒤로하고 여전히 중장기 및 소산을 위한 미디어로 독보적인 자리를 굳히고 있으며, 디스크 백업장치와 상호 호환적인 관계를 유지하고 있다. 테이프와 디스크는 서로의 장단점을 보완하며, 기업 내 백업 시스템의 일익을 담당하고 있는 셈이다.
기업 내 시스템에서 복구를 바라보는 관점은 크게 두 가지로 볼 수 있다. RPO(Reco- very Time Objectives)와 RTO(Recovery Time Objectives)가 그것으로, 백업 시스템은 이 두 가지를 점진적으로 개선하려는 노력의 방향으로 흘러 온 셈이다.
이런 차원에서 전통적인 스케줄 백업(Scheduled Backup)의 상호 보완적인 관계로 CDP(Continuous Data Protection)가 등장했으며, CDP를 통해 기존 백업 시스템의RPO와 RTO는 획기적으로 개선될 수 있다. 하지만, 그렇다고 해서 기존의 백업이 사라지는 것은 아니다. CDP 역시도 기존 백업과 서로간의 상호 보완적인 관계를 유지하게 된다.
개념에 머물던 CDP가 기업 내 도입이 가능한 실제의 기술로 대두되는데, 한 몫을 한 것은 ATA(Advanced Attach- ment Technology) 디스크의 등장과 같은 하드웨어의 발전이다. ATA가 등장함으로써 저가이면서도 고용량을 제공하는 스토리지를 사용할 수 있게 됐기 때문이다.
CDP의 등장 배경을 간략하게 요약하면 ▲기업 내 RPO/RTO 개선 요구사항 증가 ▲저가/고 용량의 ATA 스토리지 등장이라 말할 수 있다.


왜 CDP인가
최근 데이터 보호 솔루션은 급증하고 있는 기업 내 정보를 빠른 시간 내에 백업하고 복원하는 역할을 수행하는데, 한계를 보여 주고 있다. 보다 빠른 속도를 제공하는 디스크 매체가 백업 및 복구 시스템에 활용되고 있지만, 24시간 하루를 기준으로 볼 때 일반적으로 한 번 정도 수행되는 반복 행위를 하고 있는 것이 사실이다.
디스크 백업이 전통적인 테이프 기반 백업보다는 상대적으로 신속한 복구 시간을 제공하지만, RPO 관점에서는 하루를 기준으로 볼 때 단 한 번의 RPO 지점만을 제공하고 있는 것이다. 이는 곧 복구 시 백업이 수행됐던 하나의 특정 지점으로밖에 복원할 수 없다는 점을 의미한다.
최근 전통적인 백업 방법은 새로운 도전과제에 직면하고 있다. 새로운 도전과제 중 하나는 오늘날 기업 내 정보가 하루 기준 관점에서 조차도 지속적으로 생성 및 변경된다는 것이다. 이러한 변화에 따라 복구 요구 또한 ‘백업 이전’ 또는 ‘백업 이후’에 관계없이 변경된 데이터 복구에 대한 필요는 점차 높아지고 있다.
또 다른 도전과제는 이전 버전의 파일 및 애플리케이션 복구 요구다. 이는 특히 데이터의 변동률이 매우 높은 기업 환경에서 절실히 요구되는 사항이다. 이러한 예로는 최근 트랜잭션 내용으로 원복과 최근 시점까지 업데이트된 시점으로까지의 스프래드시트의 복원을 들 수 있다.
세 번째 문제는 꼭 필요한 시간 내에 백업을 완료하는 것이다. 백업 윈도(백업에 할애 할 수 있는 시간)를 준수하는 것은 엔터프라이즈급 기업 내에서 여전히 도전과제로 남아 있다.
이런 관점에서 최근 데이터 보호와 관련해 대표 주자는 CDP라고 할 수 있다. 전통적으로 데이터 보호 솔루션은 주기적인 데이터 백업에 초점이 맞춰져 왔다. 하지만, 이러한 전통적 백업은 매일 스케줄링 백업을 수행하는 동안 운영 시스템에 주게 되는 부하, 개방된 파일 및 데이터베이스에 대한 보호 등에 대한 고민과 더불어 점차적으로 줄어만 드는 백업 윈도와 같은 갖가지 이슈들에 직면하고 있다.
CDP에 의해 데이터 보호에 대한 패러다임은 기존 ‘백업’에 대한 관심에서 ‘복구’에 대한 것으로 점차 이동하고 있다. CDP 기술을 이용해 기업의 중요한 데이터의 변화에 대한 안전한 대비책을 확보할 수 있으며, 시스템이 동작하는 이상 IT관리자는 더 이상 ‘백업’의 스트레스를 받지 않아도 된다. 또 만일 재해 상황이 발생했을 경우에도 CDP 기반의 솔루션은 과거의 원하는 시점으로 유연하면서도 빠르게 데이터를 복원해 낼 수 있는 이점을 제공한다.
CDP는 특정 시점의 데이터를 생성, 관리하고 저장하는 전통적인 데이터 보호 솔루션 보다 신속한 복원 시간(RTO)과 유연한 복구 지점(RPO)을 제공한다. CDP는 어느 특정 시점이나 사전에 정해 놓은 시간대에 관계없이 모든 데이터의 변화를 지켜보며 이를 캡처함으로써 사용자가 원하는 어느 시점(at any point in time)으로든 데이터 접근이 가능하도록 만들어준다. 이는 곧 데이터 유실과 다운 타임으로 인한 비용 손실을 제거하는 결과로 이어지게 된다.


CDP 정의
3년 전부터 많은 기업들은 ILM(Information Lifecycle Management) 전략을 기본으로 한 IT플랫폼을 구축하기 시작했다. 스냅샷 또는 스토리지 통합이 RTO/RPO 요구 수준을 수용하기 위함이었다면, ILM은 QoS(Quality of Service) 상승을 위한 전략이라고 할 수 있다.
이러한 ILM은 하부 구조에 존재한 SAN(Storage Area Network)을 근간으로 한다. 소프트웨어적인 부문이 다소 가미돼 있지만, 기본적으로 물리적 시스템에 기반한 ILM에서 부족한 부문은 민첩성, 또는 신속성이라고 여겨진다. 집에 들어서서 형광등의 전원을 넣으면 바로 밝은 불빛이 들어오듯, 수도꼭지를 틀면 바로 수돗물이 나오듯 사용자의 요구에 즉각적으로 대응할 수 있는 민첩성이 필요한 것이다. 이러한 요구에 대한 해결책으로 등장한 것이 바로 CDP다.
그렇다면, CDP는 어떻게 간단명료하게 정의내릴 수 있을까. SNIA의 DMF CDP SIG(Special Interest Group)에서는 “CDP는 변경되는 데이터 트랙을 실시간 캡처해 운영 스토리지와 독립된 별도의 공간에 저장하고, 이를 통해 과거의 어느 시점으로든 복원할 수 있는 방법론이다. CDP 시스템은 블록, 파일 및 애플리케이션 기반으로 동작해 매우 세세한 복구 가능한 시점과 무수히 많은 복원 시점을 제공한다”고 정의한다. 이 정의에 따르면, 모든 CDP 제품은 아래 3가지의 특성을 가지고 있다.


1. 연속성 : 데이터의 변경이 실시간 캡처된다.
2. 별도의 저장 공간 : 모든 변경되는 데이터는 운영 스토리지와 독립된 별도의 스토리지 공간에 저장 된다.
3. 임의 시점 복원 : 모든 임의 시점의 복원 지점을 제공하기 때문에 실재 복원 전에 정의할 필요가 없다.

CDP 제품의 특징
블록, 파일 및 애플리케이션 기반을 포함한 다양한 기술적인 접근법이 존재하며, 오늘날 많은 벤더들은 특정 애플리케이션과 데이터 환경에 무관한 솔루션을 제공하고 있다. 그러나, 기술적인 접근을 벗어나 CDP는 최저 비용에 복잡하지도 않은 관리 포인트 제공과 함께 비즈니스 연속성 향상과 진일보한 데이터 보호와 신속한 데이터 복원을 수행한다. CDP 솔루션의 일반적인 특징은 아래와 같다.


■ 호스트 에이전트
몇몇 CDP 솔루션들은 보호할 호스트에 변경되는 데이터 접근을 위해 별도의 에이전트 소프트웨어를 설치한다. 다른 CDP 제품은 보호할 대상 서버 또는 네트워크 인프라에 내재된 데이터 전송 프로토콜을 사용하기도 한다(NFS, CIFS, MAPI, FC, iscsl등).

■ 복원 수준(Recovery Granularity)
또 다른 CDP 솔루션은 다른 수준의 복원 레벨을 제공한다. 예를 들면, 오름차순으로 정리하면 복원 단계가 볼륨 그룹, 각각의 볼륨 또는 파일 시스템, 각각의 폴더 또는 파일 그룹 또는 단일 파일 및 전자 메일과 같은 애플리케이션 오브젝트 등으로 나열할 수 있다.

■ 복원 시간 기준의 애플리케이션 연동
어떤 종류의 CDP 솔루션들은 애플리케이션 복원을 위한 통합된 접근 방식을 취하고 있다. 이러한 애플리케이션 통합에는 ‘자동화(Automatic)’와 ‘확장(Extensible)’이란 두가지 방법이 있다.
애플리케이션과 완전 통합 형태로 제공되는 것이 자동화 방법이다. 예를 들어, 데이터베이스의 체크포인트 또는 완결된 트랜잭션과 같이 가장 최근 시점까지 정합성이 보장되는 이벤트 정보의 자동 검출 및 기록이 이에 해당한다.
CDP 솔루션은 또한 ‘Extensible’이라는 외부 명령어나 프로세스에 의해 애플리케이션의 특정 지점으로 복원할 수 있는 구조를 제공한다. 예를 들면, 바이러스 감염 직후 또는 기업의 매 분기 후에 자동으로 수행하는 인터페이스를 제공하는 것이다.
애플리케이션 기반의 CDP는 통상적으로 특정 애플리케이션 복원 지점으로의 환원을 자동 수행할 수 있지만, 파일 및 블록 기반의 CDP 솔루션들은 이와 같은 애플리케이션 통합 방식이 필요하다.


■ 데이터베이스 실시간 보호
수많은 CDP 솔루션들은 오라클, MS-SQL 익스체인지 등과 같은 범용 데이터베이스 환경을 실시간 보호, 지원하고 있다.

■ 시스템 볼륨 보호
수많은 CDP 솔루션들은 부팅 가능한 볼륨 및 데이터 파일 시스템의 완전한 복원을 지원한다.

■ 네트워크 파일 서버 보호
수많은 CDP 솔루션들은 CIFS(윈도), NFS (유닉스)와 같은 네트워크 파일 서버 플랫폼에서 데이터의 실시간 보호를 수행한다.

■ 지원 운영 체제
CDP 솔루션들은 각 운영체제 시스템별 벤더로부터 반드시 테스트해 인증받아야 한다.

■ 저장소(Repository) 구조
대부분의 CDP 솔루션들은 CDP 스토리지가 랜, 왠 또는 SAN에 접속된 지점된 노드에 저장하도록 설계돼 있다.

■ 저장소(Repository) 복제
어떤 CDP 솔루션은 CDP 저장소를 다른 원격 저장소에 복제할 수 있어 운영 환경의 CDP 저장소에 대한 장애 발생 시에도 장애가 발생한 것을 알지 못하게 할 수 있다.


보통 CDP 제품은 별도의 독립된 스토리지에 지속적인 보호를 통해 임의의 복원 지점을 제공하고 있다. 하지만, CDP를 구현할 수 있는 다양한 방식이 존재하는 것처럼 각각의 CDP 솔루션은 기반 방식에 다소의 차이점들을 갖고 있다.
CDP 솔루션들은 블록, 파일 및 애플리케이션 단위로 운영되도록 설계됐다. 먼저, 블록 기반의 솔루션을 살피면, 이 방식은 물리적인 스토리지 계층 또는 논리적인 볼륨 매니저 계층에서 동작된다. 데이터 블록이 운영 스토리지에 기록되면 CDP 시스템에 의해 캡쳐돼 독립적인 스토리지 공간에 저장되는 것이다. 이와 유사하게 파일 기반의 CDP 솔루션은 파일 시스템 단에서 동작하도록 설계돼 파일 시스템 데이터와 메타 데이터 이벤트(파일 생성, 수정 및 삭제)를 캡처하게 된다.
애플리케이션 기반의 CDP 솔루션은 보호 대상인 애플리케이션과 직접 연동해 작동하도록 설계돼 있다. 이러한 솔루션은 애플리케이션 자체와 밀접한 연동관계를 갖거나, 특별한 애플리케이션 프로그래밍 인터페이스와 연동해 모든 변경에 대한 접근성을 제공한다.
블록, 파일 기반의 CDP 솔루션들은 다른 종류의 다양한 애플리케이션을 지원하는 장점을 가진다. 반면, 애플리케이션 기반의 CDP는 각 애플리케이션 단위의 CDP 기술을 제공해 지원 애플리케이션의 수의 한계를 갖지만, 보다 밀접하게 애플리케이션과의 연동 부분을 지원할 수 있는 이점이 있다.


CDP, 또 하나의 시간축 제공
데이터를 매일 백업하고 복구거나, 또는 스냅샷을 이용해 보관했을 때 데이터 지속성은 시간 또는 일 단위의 연속성만을 보장하게 된다. 백업과 스냅샷 사이에 생성되거나 변경된 내용을 되찾을 길이 없는 것으로, 비록 장애를 해결해 서비스를 재개할 수는 있겠지만 그 사이에 발생한 모든 정보의 유실을 감수해야만 한다. 따라서 초 단위의 실시간 정보를 캡처해 단위 파일 단위 또는 단위 전자 메일 단위의 복원 할 수 있는 CDP에 대한 관심증대는 필연적인 현상으로 볼 수 있다.
최근의 CDP 구축 동향을 살펴보면, 윈도 기반의 개인 데스크톱PC부터 24시간 운영돼야 하는 메일 시스템을 기준으로 많은 기업이 구축하는 추세인데, 이는 오늘날 비즈니스 환경에서는 유닉스 서버에 있는 데이터베이스의 테이블 보다 데스크톱에 저장돼있는 엑셀 또는 문서 파일 등이 보다 값어치가 있을 수 있으며, CEO의 전자 메일 한 개가 어떤 정보보다 더 기업의 경쟁력을 강화하는데 기여할 수도 있기 때문이다.
현재 비즈니스 성격과 요구수준으로 인해 유닉스 기반의 서버보다는 개인 사용자의 윈도 환경에서 더욱 많은 요구가 일어나고 있으며, 이에 따른 구축이 이뤄지고 있는 것이다. 이와 관련 가트너데이터퀘스트는 “2006년까지 많은 기업이 CDP를 적극 검토해 적용 분야를 만들어 가고 있으며, 2007년부터는 CDP 구축이 활성화될 것”으로 예측하기도 했다.
최근 모 TV 광고에서 생방송을 캡처했다가 되돌려 보는 타임머신 기능이 강조되고 있다. 생방송을 캡처했다가 되돌려 보듯, 실시간 정보를 캡처해 원하는 정보로 언제든지 되돌아갈 수 있는 CDP는 또 하나의 시간 축을 제공하는 기술이라고 말할 수 있다.
ⓒ 데이터넷(http://www.datanet.co.kr) 무단전재 및 재배포금지 | 저작권문의  

     

인기기사

 
가장 많이 본 기사
인사·동정·부음
전체기사의견(0)  
 
   * 200자까지 쓰실 수 있습니다. (현재 0 byte/최대 400byte)
   * 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
전체기사의견(0)
사명: (주)화산미디어 | 주소: 서울시 강남구 강남대로 124길 26 유성빌딩 2층 | 전화: 070-8282-6180 | 팩스: 02-3446-6170
등록번호: 서울아03408 | 등록년월일: 2014년 11월 4일 | 발행년월일: 2003년 12월 17일 | 사업자등록번호: 211-88-24920
발행인/편집인: 정용달 | 통신판매업신고: 서울강남-01549호 | 개인정보관리 및 청소년보호 책임자: 박하석 | 호스팅 사업자: (주)아이네임즈
Copyright 2010 데이터넷. All rights reserved. mail to webmaster@datanet.co.kr