[재해복구 솔루션①] 안전하게 보관하고 예방할 방법을 찾아라
상태바
[재해복구 솔루션①] 안전하게 보관하고 예방할 방법을 찾아라
  • Network Computing
  • 승인 2004.04.08 00:00
  • 댓글 0
이 기사를 공유합니다

“안전하게 보관하고 예방할 방법을 찾아라”
가능한 피하고, 발생하면 대처하라 … ‘디스크 對 테이프·데이터 델타·비용’ 등 고려해야
돈을 딸 가능성이 매우 희박한 게임이 있다고 하자. 기회는 단 한번이고 모든 판돈을 걸어야 한다. 이런 위험한 도박을 왜 하냐고 하겠지만 실제로 이런 도박을 하는 사람들이 많다. 핵심 비즈니스 프로세스가 존속 가능한 현재의 데이터 카피로 방해받지 않고 접근하는 데 의존하는 당신은 의자에 몸을 기댄 채 앉아 있을 뿐이다. 그리고 장비 고장, 전원 고장, 천재지변 및 불만 근로자의 폭동, 사이버 공격자들, 반쯤 구워진 소프트웨어, 그리고 심지어 아인슈타인까지도 당신의 반대편에, 도박장 주인의 입장에 있다.

조직에서 재해복구 및 데이터 보호 임무를 띤 사람들에게는 이 비유가 남달리 느껴질 것이다. 그리고 많은 전문 도박사처럼 이 용감한 영혼들은 스스로의 선택에 따라 내기를 걸 시스템이나 전략을 찾는다. 이들 대부분은 예측 가능한 손실을 피하는 데 도움이 되고 불가피한 손실에 노출되지 않게 막아주는 기술을 찾으면서 게임에 참가한 다른 사람들(승자든 패자든)을 지켜보고 있다. 미국에서는 어쏘시에이션 오브 컨틴전시 플래너즈(Association of Contingency Planners)와 같은 기관이나 많은 주립 및 지방자치 사용자 집단들이 도움을 주고 있다.

수년 동안 DRP(Disaster Recovery Planning)와 그 사촌인 BCP(Business Continuity Planning)에서는 네트워크, 서버 및 소프트웨어와 같은 인프라 요소들을 복잡한 n층의 클라이언트/서버 구성에서도 보호할 수 있는 다양한 방법들을 만들어 냈다. 하지만 데이터는 여전히 심각한 위험에 처해 있는데, 그 이유는 물리적인 인프라 보호 및 복구 전략이 중복성이나 대체를 기반으로 하고 있기 때문이다. 데이터는 대체될 수 없기 때문에 승산은 50%로 줄어들며 이것을 보호할 수 있는 방법은 중복성뿐이다. 즉 좋은 카피를 안전하게 보관해야 한다.

어떤 이들은 재해복구가 IT 인프라 대체에 초점이 맞춰져야 한다고 주장하지만 BCP는 비즈니스 프로세스의 연속성에 초점을 두고 있다. 또 ‘복구가 가능하다면 어떻게 재앙이 될 수 있는가?’라며 DRP가 모순이라고 주장하는 사람들도 있다. 이들은 BCP가 활동 목표로 보다 일리가 있으며 더 긍정적인 심리적 효과를 가져다준다고 주장하고 있다.

결론적으로 말하자면, 이것을 DRP라 부르던 BCP라 부르던 상관은 없다. 이 모든 것이 의미하는 바는 예방이 가능한 중단 사태를 피하고 예방할 수 없는 사태에 대처할 전략을 만든다는 것이기 때문이다.

카피도 쉽지 않다

첫 번째 단계는 데이터 카피다. 아주 쉬운 일이라고 생각하겠지만 결코 그렇지 않다. 데이터 복제에서는 여러 가지 요소들로 인해 복잡성과 비용이 추가된다. 예를 들어 시간이 있다. 카피 작업에는 시간이 든다(디스크일 경우 보다 적게, 테이프일 경우 보다 많이). 오늘날 실험실에서 이뤄진 가장 빠른 테이프 백업 속도는 시간당 약 2TB로, 이는 든든한 상호접속과 최첨단 드라이브, 완벽한 매체 및 잘 돌아가는 소프트웨어 스택이 있는 환경에서다. 디스크 투 디스크 카피는 테이프보다 훨씬 적은 시간이 소요되지만 이것 또한 강력한 상호접속(보통 왠), 어레이 컨트롤러의 효율성, 그리고 기타 많은 요소들 덕분이다.

그리고 지리적인 문제를 생각해야 한다. 아마도 데이터를 충분히 멀리 두어 원래 것으로의 접근을 방해했던 것과 같은 재앙을 당하지 않게 하고 싶을 것이다. 테이프에서는 이것이 문제가 되지 않는다. 착탈식 매체의 이동성 덕분에 로컬 카피를 해서 이것을 안전한 곳에 둘 수 있기 때문이다. 디스크 투 디스크에서는 카피가 곧장 진행 중에 네트워크 상호접속을 거쳐 오프사이트 타깃 플랫폼으로 이뤄져야 한다.

디스크 투 디스크 카피에서는 다양한 것들이 소스와 타깃간에 수용 가능한 거리에 영향을 미치지만, 원 디스크 플랫폼과 원격 플랫폼간 거리가 멀어질수록 두 장비간에 동기화되지 않는 데이터가 많아진다는 사실을 명심하라. 이를 재해복구 용어로는 델타(delta)라고 하는데, 데이터 델타는 호황이냐 붕괴냐간 차이가 될 수 있다. 보다 정확히 말하자면, 델타는 데이터의 원격 카피가 중단시 애플리케이션 프로세싱 복구에 사용될 수 있는지 여부를 결정지을 수 있다. 이 개념을 간단히 표현한 말이 크래쉬 컨시스턴시(crash consistency)다.

상호접속이나 플랫폼의 효율성과 관계없이 델타는 신호 속도에 대한 광속 압박 덕분에 데이터가 약 16킬로미터를 이홍하면 저절로 시작된다. 통신 시스템에서 전파 지연(propagation delay)이란 소스에서 신호가 떠날 때와 목적지에 신호가 도달할 때 사이의 시간 지체를 뜻한다. 동기적 미러로 구성된 두 개의 어레이가 16Km 이상 떨어져 있게 되면 스토리지 I/O 신호에 생기는 전파 지연으로 인해 애플리케이션 성능에 눈에 띌 만한 대기시간이 야기된다.

기본적으로, 애플리케이션은 응답이 수신돼 데이터가 주(로컬) 및 보조(원격) 어레이 모두에 기록되었음을 확인할 때까지 다음 I/O 작업을 기다려야 한다. 어레이가 비동기적 미러로 구성됐을 경우에는 애플리케이션이 원격지에서 기록 확인을 기다리지 않는다. 하지만 델타는 로컬 및 원격 어레이간의 전송 시간을 반영하며, 두 어레이가 멀리 떨어질수록 더욱 악화된다. 거리에 의한 대기시간을 해결하기 위한 시도로 저널링, 스푸핑 및 캐싱 전략들이 확산되고 있는데, 이러한 전략들은 전파 지연 문제를 완전히 극복할 수 있게 해준다기보다는 이와 함께 살아가는 방안을 제공한다고 볼 수 있다.

카피 프로세스에 영향을 미치는 또다른 요소들로는 데이터 카피가 이뤄지는 동안 서버나 애플리케이션을 정지(끄거나 휴면 상태로 두는 것)시켜야 할 필요와 백그라운드 카피 작업으로 인한 생산 서버나 네트워크 과부하를 피하기 위해 좁은 창 안에서 카피를 해야 할 필요를 들 수 있다. 많은 회사들의 24×7×365 운영 스케줄로 인해 오프라인 카피나 백업의 가능성이 점점 더 희박해지고 있다.

나아가 카피돼야 하는 데이터의 양이 늘어남에 따라(분석가에 따르면 연간 40~100% 사이) 작은 기회의 창에서 방대한 양의 데이터를 카피한다는 생각은 점차 웃음거리가 돼가고 있다.

마지막으로 옵션 비용과 관련된 프로그램적인 압박으로 인해 대부분의 회사에서 데이터 보호 대안들이 제약을 받고 있다. 최근까지 업계에서는 데이터 카피에 대해 디스크 투 테이프(스트리밍 백업)와 디스크 투 디스크(미러링), 두 가지 선택만을 제공했다. 테이프는 지난 20년간 대부분의 회사에서 데이터 보호에 줄곧 사용돼 온 반면, 거리가 들어간 어레이 투 어레이 미러링은 주머니가 두둑한 사람들이나 다운타임 내구성 제로인 곳에서 고급 옵션으로 이용돼 왔다.

미러링을 권유하지만…

전용 미러링 방안은 디스크 투 디스크 카피에서 언제나 비용을 늘리는 요인이기도 했다. 전통적인 미러링에서는 회사에서 업체측의 원격 미러링 소프트웨어를 이용하기 위해 같은 업체로부터 두 개의 어레이(멀티홉 미러링의 경우는 세 개)를 구입해야 했다.

지금은 많은 시스템들이 ‘업체 중립적인’ 소프트웨어 기반 미러링을 권유하고 있지만 이를 위해서는 스토리지 어레이를 먼저 파이버 채널 패브릭(즉 SAN)에 집합시켜야 하며, 그런 다음 여기에 카피 작업을 활성화하기 위해 가상화 기술을 적용시켜야 한다. 이러한 구성은 여전히 가격이 높으며, 그런 다음에도 왠 상호접속 유지비나 원격 데이터 카피의 보안 및 암호화 추가경비도 생각해야 한다.

물론 이런 돈으로 신속한 복구라는 소중한 자산을 얻게 된다. 디스크 투 디스크 복제는 많은 시간을 절약해 주고 테이프에서 사용 가능한 형태로 데이터를 다시 띄워야 하는 부담을 없애준다. 하이엔드 미러링은 중단에 극도로 민감하게 운영되는 금융과 같은 특정 업계에서 중요하다. 이러한 회사들은 같은 장비로 중복 데이터 센터를 만들어 운영이 확실하게 중단되지 않도록 보장하는 경향이 있다.

하지만 대부분의 다른 곳에서는 대기 중에 있을 맞춤 데이터 센터를 구축할 비용은 예산에 두지 않는다. 그 다음으로 좋은 방법은 재해복구 설비 서비스 사업자와 계약을 맺고 복구 전략을 자주 점검하며 행운을 비는 것이다. 이런 사업자들에게는 데이터 복구의 유연성이 복구 속도만큼이나 중요한 경우가 많은데, 그 이유는 상용 재해복구 설비들이 과잉 가입을 받는 일이 많고 생산 설비에서 사용되는 것과 동일한 스토리지 플랫폼을 복구에 사용할 수 있다는 보장을 하기 힘들기 때문이다.

테이프의 경우는 어떤 LUN(Logical Unit Numbers)로 진행 중에 데이터를 복구할 수 있는 수단이 제공되기 때문에 여기서 1점을 따고 들어간다.

경제성과 효율성 향상

디스크 투 디스크 지지자들은 시대가 변하고 있다고 말한다. 파이버 채널 패브릭과 새로운 소프트웨어, 그리고 저렴한 시리얼 ATA 디스크 어레이의 지원을 받는 디스크 투 디스크는 이제 데이터 보호의 경제성과 효율성을 향상시켜줄 것이기 때문이다. 브리스힐(Breece Hill), 닉산(Nixsan) 및 퀀텀(Quantum) 등 수많은 업체들이 주 어레이나 생산 어레이와 테이프 백업 라이브러리들 사이에 두 번째 디스크 층을 둠으로써 백업 시간을 단축시키고 복구를 촉진시키는 디스크 기반 제품들을 내놓고 있다. 브리스 힐은 중소기업 시장을 염두에 두고 디스크와 테이프 오토로더를 한 박스에 통합시키기도 했다.

어떤 업체들은 디스크를 이용해 테이프를 에뮬레이팅함으로써 디스크의 속도를 활용해 백업 프로세스를 촉진시킨 다음 집합된 백업 스트림의 데이터를 오프라인 과정을 통해 테이프에 담는다.

그리고 또 다른 곳에서는 티어 2 디스크 플랫폼을 디스크로 활용하여 중단 사고가 발생했을 때 특정 파일을 신속하게 복구할 수 있도록 하고 있다. 티어 2 디스크 플랫폼은 또한 데이터가 테이프에 기록되기 전에 바이러스 스캐닝이나 정크 데이터 청소, 중복 데이터 제거 등과 같은 데이터 위생 기능들이 수행되는 장소가 되기도 한다.

한편 아키바이오(Arkivio)나 애버마르 테크놀로지스(Avamar Technologies) 등과 같은 업체들의 제품은 단순한 데이터 카피를 너머 데이터 수명 관리에까지 이른 진보된 데이터 보호 방안을 제공한다. 이들은 자주 사용하지 않는 데이터를 위한 덜 비싼 저장소와 액세스 필요조건에 따라 데이터를 티어 2에서 디스크나 광 매체(혹은 휴지통)로 마이그레이팅할 수 있는 관리 툴을 제공한다.

이러한 모든 ‘향상된 백업’ 제품들은 데이터 카피와 데이터 보호에서 선택의 폭을 넓혀주고 있다. 지난 해에는 이런 새로운 방안들이 초창기 업계 연합인 EBSI(Enhanced Backup Solutions Initiative)에서 검토되고 있는 과정이었으며, 이 유명한 조직은 처음에 봉쇄됐다가 SNIA(Sto- rage Networking Industry Association)에 흡수됐다.

2002년 말 EB SI가 웹 사이트를 연지 며칠도 안 돼 지원을 자청하는 수가 450을 넘어설 만큼 이 조직은 소비자들에게 엄청난 인기를 모았다. 데이터 보호 대안들이 확산되는 데 대한 건강한 점검의 필요성을 강조하며 대중의 반응을 고무시킨 이 조직은 또한 많은 업체들과 SNIA의 주목을 집중시키기도 했다.

SNIA는 겉으로는 경쟁 집단의 인기와 비 SNIA 집단에 지출되는 멤버 업체 자금의 위협을 염려하는 듯 SNIA는 SNIA가 같은 부분을 다루는 SNIF(Storage Network Industry Forum)를 곧 내놓을 것이라며 EBSI에 가입하려는 회원들을 만류했다. 들리는 말로는 EBSI 설립자들은 SNIA에 흡수되도록 가만히 있지 않으면 EBSI에 했던 투자를 건지지 못할 것이라는 얘기도 들었다고 한다. 설립자들은 SNIA 안으로 활동 무대를 옮기기로 했으며, 이 곳에서 데이터 프로텍션 포럼(Data Protection Forum)으로 다시 태어났다.

시장에 등장하고 있는 데이터 보호 솔루션들을 심사 및 비교한 이래로 거의 행해진 일들이 없다. 2003년 열린 폴 스토리지 네트워킹 월드(Fall Storage Networking World)에서는 이 그룹이 결성된 이래 두 번 회의가 있었고 대부분의 시간을 연속적 데이터 보호(continuous data protection)란 말에서 연속적인(continuous)이 무엇을 의미하는지를 놓고 논쟁을 벌이는 데 썼다는 농담을 회장이 직접 한 적도 있다. 올해는 진척이 있기를 바라는 바다.

또 한가지 혼란스러운 계획 작업으로 정부 규정의 불명확함을 꼽을 수 있다. 9.11 사태 이후 금융 집단에서의 데이터 보호의 타당성을 평가하고자 규정 기관 패널이 소집됐다. 하지만 집단에서는 데이터 미러링을 위한 거리 필요조건을 지정 혹은 권고하는 데는 이르지 못했다. 회계 스캔들에 이어 데이터 보호를 전면에 내세웠지만 정작 규정에 따라 어떻게 보호를 제공해야 하는지에 대해서는 거의 지침을 주지 않는 기업 관리 규정들이 등장했다. HIPAA(Health Insurance Portability and Accountability Act)와 같은 보건 데이터 프라이버시 및 이식성 법안을 비롯한 수많은 홈랜드 시큐리티(Homeland Security) 법안 및 규정들도 또한 데이터 보호에 초점을 두고 있긴 하지만 준수 시스템이나 감사 표준은 여전히 움직이는 타깃으로 남아 있다.

만사형통 솔루션은 없다

최종 분석에서, 데이터 보호를 위한 최적의 전략 선택은 다른 대형 IT 투자와 별반 다르지 않게 애플리케이션 필요조건과 예산으로 좁혀진다. 가장 중요한 것은 계획자들이 애플리케이션과 애플리케이션이 지원하는 비즈니스를 이해해야 한다는 점이다. 이들은 데이터가 이것을 만들어내는 애플리케이션으로부터 상속되는 특성들을 위험성, 복구 우선순위, 그리고 접근, 보유 및 보안 필요조건 면에서 명확히 집어내야 한다.

이러한 분석은 어떤 데이터가 카피돼야 하는지, 카피들이 얼마나 자주 업데이트돼야 하는지, 그리고 어떤 플랫폼이 복구 설정에 있는 데이터를 호스팅해야 하는지 등을 파악하는 데 도움이 된다. 불행히도 이것은 노동력과 시간 소모적인 작업이며, 자동화로 단축시킬 방법은 없다. 하지만 철저한 분석을 통해 선택의 폭을 좁힐 수는 있다. 애플리케이션의 필요조건을 평가하는 방법에 자신이 없다면 대신 해주거나 기본적인 것들을 가르쳐줄 컨설턴트를 찾아 보라.

한 가지로 만사형통인 솔루션은 없다는 사실을 잊지 말라. 애플리케이션과 데이터는 저마다 다른 복구 필요조건을 갖고 있을 것이며, 몇 가지 시스템을 이용해 가장 잘 지원될 수도 있다. 좋은 정책 기반 스토리지 관리 소프트웨어가 복합적인 세팅에서 통제를 통해 다중 프로세스를 유지하는 데 유용할 수 있다. 필요조건과 인프라에 맞는 후보 제품들을 철저히 테스트해 보라. 그리고 필요조건이 변하는 데 따라 테스트도 계속 돼야 한다.

마지막으로 자신의 결과와 경험을 사용자 집단이나 온라인 포럼을 통하거나 본지로 편지를 보내 공유하라. 계획자들이 신뢰할 수 있는 내부 정보가 너무나도 부족하며 언제나처럼 업체측의 말들은 과장이 너무 심하다. 당신의 경험이 정보 단절 문제를 해결하는 데 도움이 될 수 있을 것이다.

결론적으로 말하자면, 데이터 보호는 많은 회사에서 너무 많은 인력을 너무 오랜 시간 필요로 하는 중요한 업무다. 그리고 불행히도 이로 인해 별다른 전문 교육을 받지 않은 사람들이 대부분인 계획자들은 복구를 염두에 두고 설계된 게 아닌 인프라에 솔루션들을 끼워맞춰야 하는 난감한 상황에 처해 있다.


FYI

이번 RFP에 참가한 업체들에게 위험 절감뿐만 아니라 비용 절감과 비즈니스 가치까지 요구하는 포괄적인 비즈니스 케이스를 다윈사에 제공할 것을 요청했다. 베리타스는 복제 기술에서 추구해야 하는 핵심 기능들로 다음과 같은 항목들을 꼽았다: 하드웨어 독립성, 네이티브 IT 지원, 특정 네트워킹 컨버터 장비 불필요, 오라클과 동기 및 비동기 모드에서 인증; 거리 제한 없음, 추가 비용이 없는 직관적인 관리 GUI, 진행 중 구성 변경 가능, 그리고 광역 클러스터링 지원.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.