1. 데이터 보호의 과거·현재·미래
상태바
1. 데이터 보호의 과거·현재·미래
  • 데이터넷
  • 승인 2007.06.26 00:00
  • 댓글 0
이 기사를 공유합니다

데이터 보호
전통적 백업 방식 해체…
새로운 방법 절실한 변혁기

‘데이터량 증가·가용 시간 감소’ 모순 상황 … 백업 방식 대혁신 요구

오늘날의 비즈니스 환경에서 데이터의 중요성은 아무리 강조되도 부족함이 없다. 작은 데이터 손실로도 기업은 치명적 손실을 입을 수 있다. 그러나, 보호해야 할 데이터는 기하급수적으로 증가하는 반면, 무중단 서비스 요구에 따라 백업 가용 시간은 오히려 더욱 감소되고 있다. 이에 따라 기업의 가장 큰 도전과제가 된 데이터 보호는 데이터 증가와 백업 윈도 감소를 이겨낼 수 있는 새로운 방법을 절실히 요구하고 있다. 전통적 백업 방식이 해체되고, 새로운 방식이 탄생하는 변혁의 시기가 돌아오고 있는 것이다. <편집자>

연재순서
1. 데이터 보호의 과거·현재·미래(이번호)
2. 차세대 데이터 보호 방안

천종윤 //
시만텍코리아 제품기술본부 차장
Jay_cheon@symantec.com

이제 데이터 또는 정보는 단순하게 기업의 장부를 전산화하고 이를 통해 기업의 매출집계 또는 업무흐름에 필요한 자료 산출만을 위한 근거 자료에 그치는 것이 아니다. 이제 데이터는 고객의 수요를 예측하고, 나아가 정보의 재창출을 통해 기업의 존망까지 좌우할 정도로 중요한 위치로 자리매김하고 있다.
이렇듯 위상이 높아진 데이터는 인터넷, B2B, B2G등의 전자상거래, ERP, CRM 등 업무 및 애플리케이션의 증가에 따라 급속도로 증가되고 있으며, 이는 스토리지 크기의 확대를 더욱 부추기고 있다. 기하급수적으로 확장되고 있는 데이터로 인해 이러한 막대한 ‘어떻게 안전하게 유지하고, 재해 발생 시 빠르고 효율적으로 복구할 것인가’의 문제는 IT 관리자의 주요 고민거리가 되고 있다.

개인PC로 확장되는 데이터 보호
데이터 보호라고 하면 백업부터 떠올릴 정도로 대부분의 기업들이 백업을 기업 내 데이터 보호 전략의 방안으로 사용해 왔다. 기업들의 관심이 높은 만큼 많은 백업 제품들이 시장에서 경쟁을 벌이고 있으며, 각 제품이 저마다 그에 상응하는 다양한 백업 방식들을 가지고 지속적인 발전을 이뤄오고 있는 것이다.
과거의 데이터 보호는 대부분 데이터 센터 내의 상용 RDBMS 및 파일 서버 위주로 백업을 수행하는 것이었으며, 이 때 데이터는 정형화된 데이터로 성장 및 향후 증가분에 대해 사전 예측이 가능한 것이었다. 따라서 운영자는 데이터 증가에 대한 예측을 통해 필요한 백업 미디어 수량과 요구되는 백업 드라이브에 대해 쉽게 산정을 할 수 있었다. 하지만, 오늘날 데이터가 기하급수적으로 늘어나고 있는 주요 원인이 되고 있는 비정형 데이터의 경우에는 증가분을 예측하기가 쉽지 않다.
인터넷 확산에 따라 동영상, 이메일 데이터는 놀라운 속도로 증가하고 있는 한편 기존 데이터 센터 내 데이터에 대한 백업은 물론 사용자 PC의 내부 데이터까지도 백업해야 하는 요구도 높아지고 있다. 2002년 IDC 조사 자료에 의하면, 기업 내 데이터의 60% 이상이 개인 사용자의 PC 및 노트북에 존재하고 있다. 따라서 개인 사용자 PC에 대한 데이터 보호 요구는 자연스러운 현상이라고 할 수 있다.
더불어 2002년 재정돼 미국뿐만 아니라 전 세계에 영향력을 미치고 있는 SOX(Sarbanes-Oxley)법은 기업 내 데이터, 파일, 이메일, 메신저 등에서 비즈니스와 관련된 거래 문서들은 모두 데이터 보호 규정을 준수할 것을 요구하고 있다. 이에 따라 기존의 백업 방식과는 다른 차별화된 백업 방안이 요구되고 있으며, 개인 사용자의 파일 및 이메일에 대한 데이터 보호 방안뿐만 아니라 아카이빙 방안의 구축도 요구되고 있다.
백업과 아카이빙의 차이점에 대해 간단히 말하면, 이는 보관과 보존의 차이다. 예를 들어 정육점에서 고기를 사왔다고 한다면 백업은 언제 먹을지는 모르지만 나중에 먹기 위해 냉동실에 꽝꽝 얼려 두고 보관을 하는 것이고 아카이빙은 저녁때 바로 먹기 위해 냉장실에 얼리지 않고 냉장 보관 상태로 보존하는 것이다. 즉, 백업이 데이터의 안전한 보관을 위해 사용하는 방법이라면 아카이빙은 자주 사용하지 않는 데이터를 별도의 외부 공간에 저장하고 사용자의 요청이 있을 경우 바로 데이터를 불러오는 과정을 수행한다. 아카이빙의 대표적인 사례로 병원의 PACS 시스템을 들 수 있다.

가용 시간 단축 ‘도전과제’
최근에는 UCC(User Created Contents)의 영향으로 사용자가 직접 제작한 동영상과 사진 데이터가 엄청난 규모로 생성되고 있다. 이에 따라 UCC 서비스 기업에서는 서비스에 필요한 스토리지를 연간 페타바이트(PB)씩 도입을 하겠다고 발표할 정도다. 불과 5~6년 전만 해도 1테라바이트(TB)에 대한 데이터 보호 방안이 시장 이슈가 되었던 것을 생각하면 엄청난 데이터 증가를 엿볼 수 있게 하는 한 단면이다.
이러한 데이터의 증가와 더불어 업무 시간 외라는 개념이 없어진 오늘날 비즈니스 상황도 백업의 악조건이 되고 있다. 백업은 예기치 못한 서버 장애에 대비한 작업이지만, 백업을 수행하는 동안에는 해당 서버의 자원을 이용하기 때문에 작업 중에는 서버에서 동작하는 모든 애플리케이션과 서비스 활동이 제약을 받을 수밖에 없다.
따라서 과거에는 서버 내 RDBMS 백업에서도 한시적으로 서비스를 종료하고 백업 수행 후 다시 서비스를 재개하는 오프라인 백업을 이용해 데이터를 보호했다. 업무 영향을 최소화하기 위해 보통 백업 수행 시간을 업무 시간이 지난 20시부터 다음날 06시까지 작업을 수행하는 방식이 바로 전통적 백업의 모습이다. 이와 함께 주말에만 전체 백업을 수행하고 주중에는 전체 백업 이후 변경된 데이터만을 백업하는 증분 백업을 수행했다.
그러나 근래에 이르러서는 업무 시간 외라는 개념이 사라진 지 오래다. 365일(365×24×7) 무중단 서비스 요구는 점점 더 높아지고 있으며 백업을 위해 업무나 서비스의 중단, 오프라인은 꿈도 못 꾸는 상황이다. 주말에도 전체 백업을 받기 위한 시간이 턱없이 부족하게 돼 최초 1회 전체 백업을 수행하고 주중 증분 백업을 이용해 풀백업 이미지를 생성하는 신세틱 백업(Synthetic Backup)을 수행하는 곳도 많아졌다. 즉, 데이터는 급속도로 증가하는 반면, 이를 위해 필요한 백업 가용 시간은 점점 줄어들면서 백업 작업은 더욱 큰 도전 과제를 안게 된 것이다.

즉각적인 복구·자동화 요구 증대
빠른 백업과 더불어 최근에는 빠른 복구에 대한 요구도 높아지고 있다. 백업의 주 목적은 복구에 있다. 데이터가 유실됐을 경우, 백업 데이터를 이용해 복구를 수행해야 하는 것이다. 이때 많은 데이터를 복구하기 위해서는 복구에 소요되는 시간 또한 길어지게 된다. 하지만, 복구 시간이 늘어나게 되면 다운타임이 증가하게 되고, 결국 기업의 서비스에 막대한 영향을 주게 된다. 이에 빠른 백업은 물론 빠른 복구를 더욱 요구하는 기업은 점점 더 많아지고 있다.
최근의 한 조사에 따르면, 예기치 못한 장애는 전체 장애의 약 70%를 차지하며, 이중 상당수가 하드웨어 장애라기보다는 사람의 실수 등에 의한 논리적인 장애가 많은 부분을 차지하고 있다. 이러한 논리적인 장애가 발생하는 순간, 가장 필요한 것이 바로 순간 시점 복구 솔루션(point in time recovery)으로, 예기치 못한 장애에 대해 빠르게 복구 하고 장애 시간 또한 줄일 수 있다.
또한 자동화에 대한 요구도 점점 증가하고 있다. 과거에는 관리해야할 대상 서버의 수가 한정돼 있었지만, 관리자가 관리해야할 대상 서버는 점점 늘어나고 있다. 뿐만 아니라 단일 플랫폼이 아닌 유닉스, 리눅스, 윈도 등 다양한 운영 체제와 수백개의 애플리케이션이 디스크, 백업 장비, SAN 스위치, 네트워크 등 이전에 비해 훨씬 다양하고 복잡해진 기업 시스템 환경은 자동화된 백업 솔루션을 절실히 필요로 하고 있다. 복잡하고 다양한 환경을 쉽고 간단하게 운영할 수 있는 직관적이고 단일화(Single Pane)된 사용자 인터페이스를 가진 자동화된 백업 솔루션을 요구하고 있는 것이다. 이에 따라 최근의 백업 제품은 마법사(Wizard) 기능을 통해 마우스 클릭만으로 복잡한 기업 환경에서도 손쉽게 시스템 구성을 하고, 백업 작업을 수행할 수 있도록 지원하고 있다.
흔히 백업 및 복구는 RPO(Recovery Point Objective), RTO(Recovery Time Objective), 이 두 가지로 비교를 하게 된다. RPO는 장애가 발생한 시점을 기준으로 얼마만큼의 데이터를 복구할 수 있는가를 측정하는 수치이고 RTO는 복구 시간이 얼마나 필요한지를 측정하는 수치다. 물론 이 두 가지 모두 장애가 발생한 시점으로부터 가까울수록 이상적인 솔루션이라고 할 수 있다.
지속적으로 늘어나는 데이터와 더불어 짧아진 백업 가용 시간 내에 많은 데이터를 처리하기 위해서는 백업 방식도 달라져야 한다. 답은 간단하다. 보다 빠르게 백업을 수행하고, 데이터를 조금만 받으면 되는 것이다. 디스크 백업과 중복제거기술은 바로 이러한 요청의 응답이라고 할 수 있다.

디스크 관점 데이터 보호 솔루션 ‘대두’
정해진 시간 내에 빠르게 백업을 받는 방법은 그 동안 많은 백업 방식들이 존재해 왔지만 이중 가장 대표적인 방식이 디스크를 이용한 백업이다. 디스크 백업이란 말 그대로 과거 테이프를 이용하던 방법에서 매개체를 디스크로 변경한 것이다.
디스크 기반의 백업 방식은 전통적인 테이프 백업의 여러 단점들을 보완해준다. 테이프에 비해 빠른 백업은 기본이고 테이프가 가지던 물리적 지연 시간(테이프 마운트 타임, 포지셔닝 타임, 검색 시간, 언마운트 타임)을 디스크가 가진 고유의 랜덤 접근으로 제거한다. 또한 RAID 기술을 통해 하드웨어에서 드물게 발생하는 복구 시 테이프 불량이나 드라이브 장애로부터 데이터를 보호할 수도 있다. 이런 디스크 기반의 데이터 보호 방안들은 최근 디스크 매체의 가격 하락과 저장할 수 있는 데이터 공간의 확장으로 인해 더욱 높은 관심을 받고 있다.
다양한 디스크 관점의 데이터 보호 솔루션은 크게 두 가지 관점으로 분류할 수 있다. 진화적인 관점의 디스크 데이터 보호 솔루션과 혁신적인 관점의 디스크 데이터 보호 솔루션이 바로 그것이다.

1) 진화적인 관점의 디스크 데이터 보호 솔루션
진화적인 관점의 디스크 데이터 보호 솔루션은 이전 백업 환경에서의 제한적인 단점들을 보완하고 이를 수정한 백업 방식이다. 즉, 앞서 설명한 기존의 테이프 백업 방식이 가진 단점들을 보완한 백업 방식이라 할 수 있다. 이 방식의 가장 초기화 단계는 D2D 백업이다. 원본 디스크에서 사본 디스크로 백업을 받으며, D2D2T 등으로 확장된다. VTL(Virtual Tape Library)은 이러한 방식의 대표적 솔루션이라 할 수 있다. VTL은 디스크 자체를 테이프 드라이버로 가상화한 후 기존 테이프 방식 그대로 백업을 수행함으로써 테이프와 디스크가 가진 장점을 수용하고 있다.

2) 혁신적인 관점의 디스크 데이터 보호 솔루션
혁신적인 디스크 데이터 보호 솔루션은 기존 데이터 보호와는 방식 자체가 다른 기술이다. 데이터를 백업하기 위해 해당 서버에서 백업을 수행하는 방식이 아니라 스토리지 하드웨어 단에서 데이터를 복제해 별도의 백업 서버에서 백업을 수행하는 ‘오프-호스트(Off-host) 백업’ 방식과 ‘서버-프리(Server-free) 백업’ 방식이 그 대표적인 사례다. 또한 최근에는 CDP(Continuous Data Protection)를 통해 데이터를 실시간으로 백업받는 솔루션이 큰 관심을 받고 있다.

테이프 드라이브인가, 디스크인가?
최근 디스크 백업이 각광받으면서 ‘앞으로 테이프 드라이브를 이용한 백업은 사라지는 것인가’, ‘테이프 백업을 디스크로 교체하면 지금 보다 더욱 빠르게 백업이 수행되는가’ 등의 고객 문의가 증가하고 있다. 테이프와 디스크 중 어떤 매체를 통해 백업을 수행할지 결정하기 위해서는 먼저 ‘어떤 정보들을 보유하고 있고, 그 정보들이 어디에 사용되며 어떤 가치를 갖고 있는지’에 대해 확인해야 한다. 또한 ‘만약 그 정보들이 손실되면 어떤 결과가 벌어질지’에 대한 분석도 필요하다. 두 매체가 각기 다른 장단점을 갖고 있기에 보유하고 있는 정보의 가치를 바탕으로 보호 규모 및 범위를 결정해야 하기 때문이다.
테이프 백업은 테이프 매체 즉, 미디어의 보관이 용이하다는 것이 큰 장점이다. 디스크로 백업을 받는 것은 속도 측면에서는 빠를 수 있지만 데이터가 누적되면 저장 공간 부족 문제가 발생하게 된다. 백업용 디스크를 증설하는 것이 아니라면 이중 가장 오래된 데이터를 삭제하던지 아니면 외부로 옮겨서 저장하는 소산 작업이 반드시 필요하며, 소산 용도에는 테이프 백업이 가장 적합한 매체라고 할 수 있다. 특히 금융권 등에서는 데이터 의무 보관 연수가 적용돼 5년, 10년, 혹은 영구 보관을 해야 하는 데이터가 존재하는데, 이러한 경우에는 디스크를 이용한 백업보다는 테이프 백업이 훨씬 효율적일 것이다.
비용 측면에서 살펴보면, 테이프 백업의 이점이 뚜렷하다. 용량 대비 가격으로 비교를 했을 경우, 아직은 테이프를 이용한 백업이 저렴하다고 할 수 있으며, 특히 최근에는 테이프 드라이브도 디스크 못지않은 발전을 이뤄 디스크 백업과 버금가는 테이프 드라이브가 출현하고 있기도 하다.
예를 들어, 현재 가장 많이 사용되고 테이프 드라이브의 경우 비 압축 백업 시 초당 전송률이 80MB로 시간당 288GB의 데이터가 전송되지만, 최신 테이프 드라이브의 경우는 비압축시 초당 전송률이 240MB에 달해 시간당 864GB의 데이터를 받을 수 있다. 과거 DLT 테이프 드라이브가 초당 전송률이 5MB에 불과했다는 점을 생각하면, 상상할 수 없을 정도의 성능 향상을 이뤄낸 것이다.
그렇다면 테이프 백업인가 디스크 백업, 둘 중에 어떤 것이 정답일까? 이에 대한 답은 다음호 글에서 찾아보도록 하겠다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.