Market Focus - 정보 수명주기 관리(ILM)-데이터 보호 방안과 ILM
상태바
Market Focus - 정보 수명주기 관리(ILM)-데이터 보호 방안과 ILM
  • 승인 2005.03.30 00:00
  • 댓글 0
이 기사를 공유합니다

PART 5

데이터 보호 방안과 ILM

“차세대 데이터 보호 핵심은
백업·복제의 혼용이다”

기업들은 저마다 서로 다른 백업 개념을 바탕으로 시스템을 운용할 수 있다. 하지만 어떤 기업이든 적절한 백업 윈도와 재난 복구 및 비즈니스의 연속성을 보장할 수 있는 백업 기술을 선택하지 않으면 안된다. 더구나 최근에는 데이터 수명주기 관리/정보 수명주기 관리(DLM/ILM)를 적용한 백업 및 복구에 대한 관심이 점차 확대되고 있어 이에 대한 IT 담당자들의 기본적인 개념 인식이 필요한 시점이다.
최민호 HDS코리아 부장·minho.choi@hds.com

기존의 테이프를 이용한 백업에서 이를 보완한 디스크간 백업 옵션, 아울러 DLM/ILM 개념을 도입한 백업 복구에 이르기까지 다양한 형태의 백업 기술이 관심을 끌고 있다. 그러나 최신 개념인 DLM/ILM을 도입한다 해도 백업의 기본 중의 기본인 테이프 백업에 대한 수요는 분명 존재한다. 상황에 따라 다양하게 활용되는 백업의 기술은 TCO 절감과 비즈니스 연속성을 무기로 등장하는 디스크-투-디스크(D2D) 방식의 DLM/ILM 개념의 백업 등장에도 당분간 이어질 것으로 보인다.

“백업은 데이터 복사가 아니다”
대부분의 사람들은 심지어 IT 관련 종사자들까지도 백업을 단순한 데이터 복사 정도로 이해하고 있다. 이는 가장 기본적이고도 간단한 정의이기는 하지만, 데이터 보호와 비즈니스의 연속성 측면에서 볼 때 정확하다고 볼 수는 없다.
백업이란 파일 시스템이나 데이터베이스 또는 기타 데이터를 별도로 장착된 논리 장치에 수시로 복사하는 것을 의미한다. 데이터는 애플리케이션 서버 디스크에 부착돼 있는 디스크 어레이 즉, DAS(Direct Attach Storage)나 SAN(Sto-rage Area Network)에서 직접 백업할 수 있다. 또한 데이터를 NAS(Network Attached Storage)에서도 백업할 수 있다. 백업 프로세스는 랜(LAN)이나 SAN을 통해 이뤄지기 때문이다.
일반적으로 기업들은 데이터 백업 일정 수립, 백업 수행, 추적, 복구 등의 작업을 지능적으로 수행할 수 있는 소프트웨어 패키지를 이용한다. 기존의 백업은 테이프 장치에서 이뤄지며, 이 역시 백업 패키지를 통해 관리된다. 이와 같은 방식은 디스크 기술을 백업 매체로 채택하면서 빠르게 변화했다. 대기업의 경우는 미디어 카트리지 추적 및 미디어 회전 관리와 관련한 제약이 상당히 큰 편이다.
뿐만 아니라 대부분의 운용시스템들은 유닉스의 TAR 같은 백업 명령이나 유틸리티들을 제공한다. 이들은 편리하지만 데이터 보호 및 비즈니스의 연속성을 보장하는 데는 그 효과가 제한적이다.
소프트웨어 패키지와 관계없이 백업 인프라에서 일반적으로 발견할 수 있는 것이 클라이언트/서버(C/S) 아키텍처인데, 전용 서버 한 대가 모든 백업 장치의 중심 역할을 하게 된다. 백업 대상 시스템을 주로 클라이언트라고 한다. 일부 패키지들은 ‘스토리지 노드’나 ‘미디어 서버’를 제공하는데, 이들은 근본적으로 데이터를 주로 테이프에 저장하는 특수한 클라이언트에 해당한다.

백업 기술의 뜨거운 감자 ‘테이프 백업’
기존의 테이프 백업은 데이터 보호에 있어서 안정적이며 상당히 예측 가능성이 높은 기술이다. 이 기술은 오랜 세월에 걸쳐 신뢰성을 입증받은 바 있으며, 전 세계 모든 중소 기업과 대기업들이 백업 방식으로 현재까지 사용하고 있는 방식이기도 하다. 한 가지 기술이 이렇게 까지 널리 채택되고 있는 경우를 찾기란 좀처럼 쉽지 않을 것이다.
하지만 모든 기술에는 단점이 있기 마련이다. 이러한 백업은 백업 윈도에서 허용하는 시간보다 더 많은 시간이 소요되며, 네트워크 폭주나 장비의 장애 등으로 인해 실패할 수 있으며, 대규모 기업 환경 하에서는 절차가 복잡하고 많은 자원이 소요된다. 무엇보다 물리적으로 엄청난 개수의 테이프를 쌓아 놓고 관리하는 것도 비용면에서 골칫거리다.
복구 능력을 시험하는 데는 상당히 많은 자원이 필요하며 IT 부서에 매우 많은 업무 부담을 주는 것이 사실이다. 사실상 테이프 백업의 복구에는 상당히 길고 복잡한 과정이 소요된다. 안정적이고 신뢰성이 높은 것은 사실이지만 ‘데이터 복구가 필요할 때 실제로 백업 테이프가 손상없이 보관돼 있으리라는 장담은 할 수 없다’는 말이 정설처럼 전해지기도 한다.
이 전통적인 백업방식은 다수의 백업 클라이언트에서 온 데이터를 다중화하거나 교차 삽입하는 방법을 통해 백업 효율을 극대화함으로써 백업 윈도 양을 크게 줄일 수 있다. 하지만 이와 같은 방식에는 중요한 한계가 있다. 백업 복구 시 데이터를 역다중화해야 하기 때문에 시간 소모가 크다는 것이다.
또 한 가지 생각해 봐야 할 문제는 고속 테이프 라이브러리와 매체 관리에 소요되는 비용이다. 이로 인해 많은 기업들이 복구능력 시험 등과 같은 영역에 투자되는 자원을 제한하지 않을 수 없다. 테이프 기술의 속도가 반드시 느린 것은 아니지만 테이프 장치의 속도가 매우 빨라지게 되면 투자 자원을 충분히 활용하기 어렵다고 불평하는 사람들도 생길 것이다. 정교한 테이프 장치에 점진적인 백업을 적용할 경우 데이터가 연속적으로 저장되지 않기 때문에 이용효율을 극대화할 수 없다는 점이 좋은 예가 될 수 있다.
사무실이나 상점 등이 분산돼 있는 기업의 경우, 또는 소수의 IT 요원이 상주하는 계열사 등의 경우는 독립형 테이프 드라이브를 사용한다. 정기적으로 테이프를 장착하거나 교체하기 위해 IT 요원이 상주할 필요는 없다. 이와 같은 경우 여러 가지 원칙, 예를 들면 정기적인 오류 보고 등)이 요구되는데 많은 경우 백업 실패가 보고되지 않는다. 중앙집중적인 제어가 이뤄지는 경우라도 전문요원이 상주하지 않는 로컬 영역을 관리하기란 쉽지 않다는 의미다.
현재 사용중인 테이프 백업이 주는 가장 큰 장점은 테이프 매체를 휴대할 수 있다는 점이다. 이 장치들은 손쉽게 사이트 외부에 보관했다가 컴파일, 저장, 복구 등의 목적으로 사용할 수 있다. 이와 같은 사이트 외부 보관장소를 전문적으로 제공하는 기업들도 생겨났을 정도이며 유사한 서비스가 전 세계적으로 널리 확산되고 있다.
스토리지 백업과 고난이도 데이터베이스 백업
백업 소프트웨어 공급업체들은 현재 백업 성공 여부를 추적할 수 있는 관리 툴들을 이미 제공하고 있다. 이들은 매우 편리하긴 하지만 테이프 매체와 관련해 사람이 저지를 수 있는 실수에 완벽하게 대처하거나 원격지에서까지 사람의 개입이 전혀 필요 없는 서비스를 제공하지는 못한다.
현재, 대부분의 백업 소프트웨어 공급업체들은 디스크 기반의 백업 매체와 애플리케이션들을 지원해 기업에서 백업 테이프 드라이브를 스토리지 시스템이나 NAS 서버 등으로 교체할 수 있도록 지원하고 있다. 합리적인 중앙집중형 관리 기능과 더불어 이 새로운 인프라스트럭처는 백업 윈도 감소를 통해 서비스 레벨 향상(디스크는 테이프에 비해 전반적인 성능이 우수하다), 헬프데스크를 통해 원격 복구 서비스 지원 가능(최신 백업 테이프를 찾을 필요가 없다), 기업의 데이터 자원 보호 기능 강화(디스크 기반의 스토리지 시스템 비용이 더 저렴하며, 상대적으로 많은 양의 데이터 저장이 가능하다), 데이터 유실 위험 감소(휴대할 수 없으므로 특히 단기 백업 시 데이터 유실 위험을 줄일 수 있다) 등의 장점을 갖는다.
다른 한 편으로는 백업 통합과 중앙집중화가 가능하다는 점이다. 대기업의 경우 다수의 백업 클라이언트에서 중앙 집중형 서버 하나로 데이터를 이동시킴으로써 규모의 경제 실현이 가능하다. 또 사이트 외부에서 데이터를 보다 쉽게 복제할 수 있고 백업 자원들이 한 곳으로 집중되므로, 사이트 외부의 서비스(offsite-vaulting services)를 최적화할 수 있다.
복구와 관련해서는 두 가지 방법 모두 장단점을 가지고 있다. 로컬 백업 기능은 재난 위험을 여러 사이트로 분산시키는 효과가 있다. 반면 중앙집중형 백업의 경우는 복구 프로세스를 간소화함으로써 복구 속도를 높일 수 있으며, 자원 이용률을 극대화시킬 수 있다.
데이터베이스는 그 구조가 복잡할 뿐 아니라 항상 온라인 상태를 유지해야 한다는 점 때문에 백업이 용이하지 않다. 백업 방식에는 ‘핫’ 백업과 ‘콜드’ 백업 두 가지가 지원된다. 콜드 백업이란 백업을 실시하기 전에 데이터베이스를 다운시키는 경우에 해당한다. 이는 오픈 파일이 잠금처리돼 백업이 불가능하기 때문에 필요한 과정이다.
반대로 파일을 백업하는 동안은 다른 애플리케이션에서 이 파일을 이용할 수 없다. 대부분의 백업 애플리케이션들은 오픈 파일, 핫 백업 옵션을 제공해 데이터베이스를 정기적으로 백업할 수 있게 한다.
단, 구조가 복잡한 경우(데이터 파일, 로그 파일 등 파일 종류가 많거나 용량이 큰 경우)는 보호하기 힘들뿐 아니라 논리적 파괴의 위험도 크다. 히타치 데이터 시스템즈에서 제공하는 낸코카피(NanoCopy) 재난 복구 매니저와 같은 복제 기술을 이용할 경우 오픈 데이터베이스의 데이터를 보호할 수 있다. 대부분의 데이터베이스 관리 시스템들이 핫 백업과 같은 백업 유틸리티를 제공한다는 사실에 유념할 필요가 있다.

빠른 복구는 비즈니스 연속성 ‘첩경’
백업에 대해 논의하기 위해서는 백업의 궁극적인 목적인 복구 문제를 고려하지 않을 수 없다. 복구와 관련한 가장 큰 문제는 시간이다. 왜냐하면 시스템 운용이 불가한 시간 동안은 비즈니스에 직접적으로 부정적 영향을 미칠 수 있기 때문이다. 시스템 다운 시간이 길어질수록 매출 손실이 커지며, 기회 손실도 동반된다. 일반적으로 복구 시간 목표와 복구 시점 목표 등 두 개의 기준을 고려할 수 있다.
복구 목표 시간(Recovery Time Objective)이란 비즈니스 기능이나 애플리케이션 복구에 소요되는 시간을 의미한다(재난 선포 전 시간과 복구 임무 수행 시간 포함). 복구 목표 시점(Recovery Point Objective)이란 데이터를 복구해 처리를 회복해야 하는 시점을 가리킨다(흔히 가장 최근에 이뤄진 백업과 장애 발생 시점 사이의 시간으로 평가한다). 사용한 기술 또는 솔루션 형태에 따라 복구 시간과 복구 시점, 비용 사이에 가감이 있을 수 있다.
테이프 백업 등 기존의 전통적인 백업은 재난 발생 후 데이터를 복구하기 위해 가장 신뢰할만한 방법이긴 하지만 그 시간이 매우 길게 소요된다는 한계가 있다. 한편, 새로 부상하고 있는 디스크 백업 기술은 복구 시간을 줄이는데 도움이 되긴 하지만 그 비용이 높다는 단점이 있다. 이 두 가지 방법의 장점만 취할 수 있는 백업기술은 없을까?
기존의 백업 기법을 유지하면서 복구 시간을 줄일 수 있는 방법은 분명히 있다. 백업 인프라스트럭처에 많은 예산을 투자해 온 대다수 기업들이 염원하는 이 방법은 스냅샷 백업, D2D 백업 등 몇 가지 기술진보 내용들을 기반으로 한다.
현재 많은 기업들이 백업 매체로 디스크 스토리지 시스템을 채택하고 있다. 대부분의 백업 소프트웨어 공급업체들은 D2D 백업을 지원한다 일부에서는 단계별, 계층적 디스크 백업을 여러 해 동안 지원해 오기도 했다. 기본적으로, 단계적 백업이란 백업 프로세스에서 중간 단계에 해당하는데, 백업 데이터를 일단 디스크에 저장한 후 다시 테이프 매체로 이동시키는 방법을 가리킨다. 디스크 서브시스템의 가격이 저렴해짐에 따라 기존의 테이프 환경을 개선할만한 새로운 백업 인프라의 개발이 가속화되고 있는 것이다.
디스크에 먼저 백업한 뒤 데이터를 테이프로 전송할 경우 인프라 및 소프트웨어 구성에 미치는 변화를 최소화할 수 있다. 백업 속도가 디스크 속도에 따라 빨라질 수 있으므로 로우엔드 디스크 서브시스템으로도 하이엔드 테이프 장치의 속도에 맞먹거나 이를 능가할 수 있다. 이는 단기 백업이나 보유 시간이 짧은 백업에 특히 유리하다.
데이터를 다수 복사할 필요가 없으므로 복구가 빠르며 테이프로의 전송시 포맷 상 유리한데 디스크 속도에 따라 복구가 빠르다. 따라서 업계간 속도 단축을 위한 경쟁이 치열한 상태이다. 소비자들의 설문 조사 결과만을 두고 봐도 복구 속도가 놀랄 만큼 빨라진 것이 사실이다.
사이트 외부 보관을 목적으로 데이터를 테이프로 이동시킬 수 있으며 다수 복사할 필요가 없어 테이프 투 디스크(Tape-to-Disk) 복구가 빠르다. 이 프로세스는 자동화와 오프라인 실행이 가능해 생산 시스템 및 네트워크에 미치는 영향을 최소화할 수 있다.

DLM/ILM 적용한 D2D 백업
시간의 흐름과 함께 가치가 변하는 데이터나 정보를 효율적으로 보관하자라는 개념은 오래 전부터 나온 것이다. 수년 전부터 제기돼 온 효율적 데이터 관리의 필요성이 DLM 전략으로 옷을 갈아입고 현재 스토리지 시장에서 높은 관심을 얻고 있는 이유는 데이터의 급증 때문이다. 즉 기업이 그 동안 늘어나는 데이터 보관을 위해 투자했던 스토리지 솔루션 구입 비용보다 스토리지 보관 및 장비 관리를 위한 유지에 더 많은 비용을 투자하게 되는 기형적 상황에 직면했기 때문이다.
이러한 급작스런 스토리지의 증가는 경제상황 악화로 전기를 맞게된다. 좋은 투자 여건을 갖추지 못한 대다수의 기업들은 데이터를 일괄적으로 값비싼 1차 스토리지 제품에 저장하기보다는 데이터의 활용 가치에 따라 가격이 훨씬 저렴한 2차 스토리지로 옮기길 원했기 때문이다.
즉 데이터의 수명주기에 따른 스토리지 관리를 위해 전략 차원에서 머물러 있던 DLM이 솔루션으로 가시화되기 시작한 것이다. 총소유비용(TCO) 절감을 내세운 각 기업의 백업과 복구 기술의 빠른 DLM 응용은 산업 전반에 급파됐고, DLM 구현에 필요한 스토리지 통합환경 인프라 환경이 조성됨으로써 DLM을 스토리지 시장의 가장 큰 이슈로 부각시킨 원인이 됐다.
데이터 수명주기 관리(DLM) 전략과 정보 수명주기 관리(ILM)는 사실상 같은 목적에서 출발했다. 단지 스토리지 리소스를 데이터로 볼 것인지, 정보로 구분할 것인지에 대한 시각의 차이만 있을 뿐 시간의 흐름과 함께 그 가치가 더해지거나 줄어드는 데이터를 효과적으로 관리하려는 목적은 같다고 할 수 있다.
하지만 이를 실현하기 위해 접근하는 방법은 사뭇 다르다. 우선 DLM은 ‘비즈니스 데이터의 생성부터 소멸에 이르기까지 데이터의 생명주기를 비즈니스 프로세스 시각에서 접근하고 관리하는 것’으로 데이터 관리를 위한 인프라 전반에 걸친 수평적인 개념이다. 따라서 계층적인 데이터 백업과 복구는 늘 핵심적인 문제로 대두돼 왔다. 이는 DLM이 비전이나 전략이기보다는 현실성 기반의 데이터 백업, 복구, 아카이브 등과 같은 데이터 관리를 위한 기술적인 측면이 강하다는 것을 의미한다.

DLM 백업의 핵심은 ‘스토리지 영역 관리(SAM)’
기업들이 직면하고 있는 중요한 문제 중 하나는 기업 활동에 핵심적인 시스템이 예기치 않게 정지되는 경우다. 예컨대 태풍, 토네이도, 지진, 테러 공격 등과 같은 급작스러운 사건이 일어나더라도 기업 활동을 계속 수행할 수 있느냐 하는 것이다. 이런 사태를 맞이한 후 가장 효과적으로 기업 활동을 재개하기 위해, 기업은 다양한 운영체제가 액세스하는 데이터베이스와 파일 시스템으로부터 최신의 데이터(기업 활동이 중단된 당시에 가능하면 가장 근접한 시점의 데이터)를 복구할 수 있어야 한다.
스냅샷/이미지 백업은 이런 DLM의 비즈니스 연속성 및 백업 복구 개념에 근거한 구체적인 D2D 백업의 진화과정이라 할 수 있다. 기존의 백업은 여러 개의 파일로 구성되기 때문에 백업 클라이언트의 오버헤드를 증가시킨다. 스냅샷이나 이미지 백업은 백업을 시작하기 전에 일정량의 데이터에 대해 정적 이미지를 블록 레벨에서 제작한다. 그런 다음 가공하지 않은 데이터 파일 시스템 블록을 백업 매체로 전송한다. 일관성 유지를 목적으로 백업 프로세스가 진행되는 동안 변경됐을지도 모르는 데이터를 보존하는데 장점이 있다. 파일 시스템 내에 여러 개의 파일이 있는 경우에는 이미지 백업 기법을 사용하는 것이 좋다는 것이 일반적인 여론이다. 따라서 이미지 백업과 D2D 백업을 함께 사용할 경우 그 효과를 극대화할 수 있다.
가상 테이프 라이브러리와 관련된 논의들이 최근 들어 많이 이뤄지고 있는데 간단하게 말한다면 테이프 라이브러리를 에뮬레이션한 디스크 시스템이다. 백업 애플리케이션은 디스크 시스템으로 백업하고 있는 동안 자신이 테이프 장치로 백업하고 있다고 느낀다. 이와 같은 접근 방법은 메인 프레임과 개방형 시스템 모두에 일정한 장점을 제공한다. 물론, 개방형 시스템 환경에서는 백업 애플리케이션 내에 기본적인 D2D 기능을 사용하려는 경향이 강하기는 하다. 이에 대한 논의가 활발히 이뤄지고 있으므로, 소비자들에게 어느 방법이 더 바람직한 지 머지 않아 밝혀질 것이다.
백업 기술은 데이터 보호의 역사와 함께 확고하게 그 자리를 굳히고 있다. 비즈니스 연속성을 보장하기 위한 노력의 일환으로 이 기술이 여전히 중요한 역할을 하고 있는 것은 사실이지만 언제나 복구 목표 시간을 만족시키는 것은 아니다. D2D 백업 기법이 확산됨에 따라 백업 윈도에 대한 제약을 어느 정도 완화해 주면서 동시에 테이프 인프라를 개선할 수 있는 새로운 지평을 제시하고 있다.
기존의 백업과 복제 기술 사이의 경계가 점차 흐려짐에 따라 기업들은 이 두 가지 요소들을 각자의 복구 목표 시간 및 서비스 규약, 인프라 최적화 요건 등에 맞춰 혼합해 사용할 필요가 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.