제 2부 : 컴플라이언스 & 아카이빙 기술 기고
상태바
제 2부 : 컴플라이언스 & 아카이빙 기술 기고
  • 데이터넷
  • 승인 2007.08.21 00:00
  • 댓글 0
이 기사를 공유합니다

컴플라이언스 & 아카이빙 시장 현황
제 2부
백업·복구·아카이빙 통해 컴플라이언스 요구 ‘충족’
전자문서 보편화로 법적 규제 대두 … 효율적인 시스템·프로세스 확보 중요

김정균
퀀텀 프리세일즈 컨설턴트 과장
JungKyun.Kim@Quantum.com

오늘날 기업의 자산 중 중요성이 점차 부각되고 있는 것 중 하나가 바로 종업원 및 비즈니스 프로세스 상에서 발생하는 이메일 메시지, 데이터베이스, 재무보고서, 인스턴트 메시지, PDA 저장 파일, 협업 저장물 및 저장된 문서 등의 데이터이다. 전자 문서의 형태로 저장되는 모든 정보는 생성, 복사 및 수정이 간편할 뿐만 아니라 복잡한 관리 문제를 수반한다.
전자 문서가 종이 기반의 기록물을 대체함에 따라 전자 문서가 모든 법적 규제의 대상으로 떠오르고 있다.
미국에서는 회계 투명성을 위한 사베인-옥슬리(SOX) 규정과 증권거래위원회 SEC의 17a-4, 규정, 미국 금융서비스 현대화 법률(GLBA: Graham-Leach-Bliley Act), 미국 건강정보 관련 법률(HIPAA) 등이 정보 보호 및 백업, 아카이빙에 대한 업계의 시각을 완전히 바꾸고, 이에 걸맞은 시스템 및 프로세스 구축을 가속화하고 있다. 일본 역시 올해 발효되기 시작한 일본판 사베인-옥슬리(J-SOX) 규정이 IT 업계를 뜨겁게 달구고 있다. 국내에서도 회계개혁법, 증권거래법, 주식회사의 외부감사에 관한 법률 등 K-SOX로 불리는 관련 규제에 대한 인식이 확산되면서 데이터 관리 방법, 정보보호 정책 및 시스템 전반을 새롭게 점검하려는 움직임이 가속화되고 있다.
백업, 복구 및 아카이빙 인프라스트럭처를 갖추고 효율적으로 운영하는 것이야말로 컴플라이언스 준수의 출발점이라고 할 수 있다. 특히 장기간에 걸친 데이터 보존을 위한 아카이빙은 컴플라이언스 준수를 위한 최적의 솔루션으로 떠오르고 있다.

백업 vs 아카이빙
아카이빙은 더 이상 사용하고 있지는 않지만 언젠가 사용할 가능성이 있는 데이터를 저장하는 방법이다. 백업의 경우 액티브(Active)와 인액티브(Inactive) 데이터 레코드로 구성되지만 아카이빙의 경우 인액티브 데이터 레코드만을 포함한다. 백업과 달리 아카이빙은 데이터가 사고로 삭제되거나 손상되었을 때 데이터를 복구하기 위한 작업이 아니다.
아카이빙은 액티브 아카이빙(Active Archives)과 딥 아카이빙(Deep Archives)의 두 종류로 구별된다. 액티브 아카이빙은 사용률이 낮거나 혹은 전혀 액세스하지 않는 데이터 레코드를 데이터베이스/데이터 라이브러리에서 제거하는 방법이다. 딥 아카이빙은 액세스 비율이 낮거나 전혀 업데이트가 일어나지 않는 데이터 레코드를 추출해 내거나 장기간 저장돼야 하는 데이터를 관리하기 위한 방법이다.

(1) 액티브 아카이빙
시간이 경과함에 따라 데이터베이스는 급속도로 확대된다. 예를 들어 특정 기업에서 제품을 구매한 고객의 리스트로 구성된 데이터베이스를 가정해 보자. 시간이 경과함에 따라 일부 고객은 더 이상 그 회사의 제품을 구매하지 않는 ‘비활동(Inactive)’ 고객으로 바뀌게 될 것이다.
인액티브 고객 데이터 레코드를 액티브 데이터베이스 애플리케이션의 일부로 계속 관리한다면 호스트 스토리지 요구사항을 증대시킬 뿐 아니라 애플리케이션의 성능을 급속도로 낮출 수밖에 없다. 이 경우 비활동 고객 정보를 보다 저가의 스토리지 디바이스로 이동해 준다. 향후 데이터가 필요할 경우 애플리케이션이나 관리자가 이 파일에 액세스한 후 리스토어할 수 있다.
액티브 아카이빙의 주된 목적은 데이터를 보호하는 것이 아니라, 사용빈도가 낮고 오래된 데이터를 찾아내 저가형 디스크나 테이프 스토리지에 저장하는 것이다. 백업 애플리케이션과는 달리 액티브 아카이빙은 매일 수행될 필요는 없지만, 정규적으로 진행해야 한다. 아카이빙 수행 빈도는 데이터 성장 속도, 데이터가 인액티브되는 주기 및 스토리지 예산에 따라 달라진다. 인액티브 데이터는 디스크, 테이프, 옵티컬 스토리지에 저장된다. 데이터에 할당되는 디스크 스토리지의 양을 줄여줌으로써, IT 관리자는 비용을 절감할 수 있다.

(2) 딥 아카이빙(Deep Archiving)
최근 대부분의 기업은 데이터를 얼마나 오랜 기간 저장할 것인지에 대해 내부 정책을 수립해 놓고 있다. HIPAA와 SEC 17a-4와 같은 정부 규제는 데이터 보존 기간을 개별 기업의 손에 맡기는 것이 아니라 정해진 기간을 준수해야 하는 의무 사항으로 만들었다.
딥 아카이빙 데이터는 백업 복제본, 또는 재해복구 사본과는 성격이 다르다. 은행 거래 기록과 같이 빈번하게 업데이트가 일어나지 않는 성격의 데이터를 대상으로 한다.
대신 오랜 기간 저장되며, 자주 액세스되지는 않고 업데이트가 발생하지 않는 성격의 데이터가 대부분이다. 이런 성격의 데이터는 고정 콘텐츠(Fixed-content), 비규격화된 (Unstructured) 레퍼런스 데이터 레코드라고 일컬어지기도 한다.
딥 아카이빙은 특정 기간 동안만 데이터를 저장하도록 설계돼 보존 기간이 종료되면 삭제하는 것이 일반적이다. 딥 아카이빙으로 저장돼야 하는 데이터는 그리 많지 않다. 아카이빙은 디스크, 테이프, 옵티컬 매체 등 여러 종류의 미디어에 저장될 수 있다. 백업은 여러 벌의 데이터를 저장한다. 그러나 아카이빙은 오직 한 벌의 특정 데이터 레코드를 저장한다.
SEC 17a-4와 같은 규정은 기업체가 아카이빙 데이터를 오프 사이트에 보관하도록 규정한다. 이 경우 IT 관리자는 원본과 오프사이트 복제본, 이렇게 두 벌의 데이터를 보관해야 한다. 또한 동 규제의 경우 아카이빙 소프트웨어가 데이터 보존 기간 중에 있는 데이터의 경우 덮어 씌우기를 하거나 파일 삭제 또는 내용 수정을 하지 못하도록 정하고 있다.
백업 및 아카이빙은 서로 다른 목표복구시간(Recovery time objective)을 갖고 있다. 예를 들면 고객 서비스 데이터베이스는 백업 데이터로부터 1시간 이내에 복구를 수행해야 한다. 그러나 아카이빙 데이터 레코드의 경우 훨씬 더 긴 복구 시간을 갖는다. 기업이 법적인 소속에 휘말려 이를 보충할 자료를 법적인 내용 증명 차원에서 찾아내야 한다면 1~5일 정도의 시간 내에 복구를 수행하면 된다.
아카이빙 데이터는 몇 주, 몇 개월이 아니라 몇 년에 걸쳐 보관된다. 그러므로 기업은 데이터 레코드의 보호 기간 전반에 걸쳐 데이터를 보호하는 데 소요되는 비용을 고려해야 한다. 시스템 및 소프트웨어 초기 투자비용만으로는 전혀 의미가 없기 때문이다.

무결성·접근성·감사가능성 ‘중요’
일반적으로 컴플라이언스 요구사항은 다음 네 가지 카테고리로 나누어진다. 광범위하고도 다양한 컴플라이언스 요구사항은 크게 데이터 무결성(Integrity), 접근성 확보(Accessibility) 및 감사 가능성(Auditability)로 나누어 생각할 수 있다.

(1) 데이터 무결성(Integrity)
데이터 라이프사이클 전반에 걸쳐 데이터는 완전한 상태로 보존돼야 한다. 기업은 손상되지 않고 입증 가능한 데이터를 필요하면 언제든지 확보할 수 있도록 해야 한다. 재해 상황에 대비해 견고한 스토리지 인프라를 구축해야 함은 물론이다.
백업은 파일이나 레코드의 복제본을 여러 벌 구축함으로써 데이터의 보존성을 높이는 방법이다. 백업은 재해 상황과 데이터 손실, 유실 및 손상에 대응하며, 원래의 온라인 카피의 삭제에 대응하도록 해준다. 신뢰성을 충분히 보장하기 위해 분리된 미디어에 여러 벌의 복제본을 저장한다. 원 사이트에 손실이 발생할 것에 대비, 한군데 이상의 장소에 데이터를 유지하는 것이 중요하다.
백업 전략은 오프사이트 스토리지가 없을 경우 완벽하다고 하기 어렵다. 여벌의 백업 복제본은 재해복구, 아카이빙, 버전 관리 등 여러 가지 용도로 활용된다. 그러나 백업 카피를 디스크나 테이프에 저장하는 것만으로는 데이터 무결성을 확보하기에 충분하지 않다.
백업 애플리케이션을 장기 아카이빙에 활용함에 있어 부정적인 면은 미디어가 독점적인 논리적 포맷(Proprietary logical format)으로 기록되며, 기록된 애플리케이션(originating application)에서만 읽을 수 있다는 점이다. 진정한 장기 아카이빙은 전체 백업 시스템(컴퓨터, 리코딩 하드웨어 및 소프트웨어) 뿐 아니라 미디 (여러 벌의 복제본 포함) 역시 아카이빙돼야 한다. 따라서 이전의 두 세대 정도는 호환할 수 있는 로드맵을 갖춘 드라이브를 선택해야 한다.
보다 실용적인 데이터 영속성을 갖추려면 테이프 기술을 매 5년마다 새롭게 업그레이드해 업계에서 주도적인 위치를 확보하고 있는 테이프 포맷 및 주요 데이터 표준을 따르는 것이 좋다. 거의 6년 단위로 업그레이드되는 테이프 세대 전환에 발맞춰 고용량, 고속의 드라이브로 전환하면서 이전 세대 호환성을 확보하는 것이다.
장기 아카이빙 실행력을 높이려면 신뢰할 수 있고 보편적인 기술을 채택하는 것도 중요하다. LTO의 경우 성능에 민감한 환경에 권장한다. 가격대비 높은 성능을 갖추고 있고 신뢰성이 높으며 이전세대 LTO 기술과 호환이 된다. 반면 DLT 테이프는 30년 이상의 아카이빙 수명을 제공할 만큼 신뢰성 높은 제품이다.
전자 데이터는 한정된 보존 기준을 갖고 있으므로 안전하게 데이터를 폐기하는 것도 중요하게 고려돼야 한다. 대부분의 기업은 법적인 보존기간이 지나자마자 데이터를 지우거나 기록을 파기하는 방식을 채택한다.
보안을 고려할 때 기한이 지난 데이터를 휴지통에 바로 버리는 것은 또 다른 문제의 야기할 수 있다. 이 경우 테이프의 자성을 지우거나 물리적으로 분쇄하는 방법을 권장한다. 레코드는 물리적으로나 논리적으로 모두 폐기하는 것이 필요하다.

(2) 접근성(Accessibility)
기업에서 데이터가 필요한 상황에서 데이터를 찾아내는 능력을 의미한다. 매우 단순해 보이는 조항이지만 이를 준수하는 것은 그리 쉬운 일이 아니다.
데이터 액세스 성공률을 높이기 위해 목표복구시간(RTO: Recovery Time Objective)를 고려해야 한다. RTO는 데이터의 종류와 데이터가 생성된 후 경과된 시간(age), 스토리지 미디어 종류에 따라 달라진다. 모든 종류의 데이터에 대해 데이터 라이프타임 전반에 걸쳐 접근성 가이드라인과 목표가 명확하게 설정되어야 한다. 접근성 요구사항 및 RTO에 맞춰 데이터를 올바르게 분류한다.
컴플라이언스 준수는 물론 적정한 서비스 수준을 유지하려면 데이터 분류와 함께 올바른 스토리지 계층을 결정하는 것이 필요하다. 물론 모든 데이터를 온라인으로 유지하면 가장 높은 수준의 데이터 접근성을 보장할 수 있다. 그러나 성능, 비용 및 실질적인 관리 노력을 종합적으로 고려한다면 VTL을 가장 현실적인 솔루션으로 고려할 수 있다. VTL의 경우 기존 테이프와 비교할 때 10배 이상의 빠른 데이터 액세스를 가능하게 한다. 목표 복구 시간이 1시간 이내 등 매우 짧게 설정된 경우 VTL은 매우 유용한 솔루션이다.
데이터에 대한 적정한 액세스를 확보한다는 것은 데이터 보안도 일정 수준 이상 유지한다는 점을 의미한다. 기업은 스토리지 보안 정책을 가동하여 오직 권한을 가진 사람만이 데이터에 액세스하도록 하고, 모든 액세스에 대해 모니터링을 수행하는 것이 바람직하다.

(3) 감사가능성(Auditability)
기업이 데이터를 정확하게 확보하고, 보전성과 가용성을 확실히 하고, 필요할 경우 효과적으로 데이터를 찾아낼 수 있다고 하더라도 컴플라이언스를 완벽하게 준수하고 있다고 말하기 힘들다.
데이터 삭제, 수정 및 레코드 유형에 따라 관리 절차를 정확히 규정함으로써 아카이빙된 내용의 감사 가능성을 확보해 두어야 한다. 예를 들어 증분백업(인크리멘탈 백업)과 데이터베이스 스냅샷을 자주 만들어 두는 경우 레코드나 이메일은 연대기 순으로 복구돼야 한다.
예를 들면 미국식품의약국의 경우 컴퓨터로 생성됐고, 안전하게 보관돼 있으며, 시간이 명기된 감사추적을 요구한다. 즉, 법적인 요구사항과 제출 목록을 완전하게 이해한 후 컴플라이언트 프로세스를 생성하는 것이 중요하며, 이에 따라 백업, 복구, 아카이빙 인프라스트럭처를 설계해야 한다. 프로세스 워크플로우 전반에 걸쳐 감사추적이 가능하도록 한다.
감사가능성을 확보하려면 WORM(Write Once, Read Many) 기술의 사용을 검토한다. 최근에는 테이프 미디어도 WROM 기능을 제공하고 있어 낮은 비용에 빠른 백업을 가능하게 하고 더불어 수정 불가능한 상태로 원본 데이터를 보존하도록 해준다. SDLT의 경우 WORM 기능을 제공하며, DLTIce는 WROM 과 함께 보안 기능을 함께 제공하여 컴플라이언스 미디어로 활용할 수 있다.
이처럼 백업, 복구, 아카이빙은 데이터 가용성과 컴플라이언스의 근간을 형성한다. 컴플라이언스는 정보의 생애주기 전반에 걸친 관리의 중요성을 부각시키는 요소이며, 데이터 관리 프로세스 전반을 향상하는 계기로 활용될 수 있다. 다양한 기능에 걸쳐있는 컴플라이언스 요구 특성상 데이터 스토리지 전반을 검토하고 가장 효율적인 시스템과 프로세스를 확보하는 일이 무엇보다 중요하다.

보존·아카이빙을 위해 권장되는 베스트 프랙티스
- 데이터는 정확히 확인 및 분류되어야 한다. 정규적으로 데이터를 아카이빙하고 이를 준수하도록 문서화된 최신 계획 및 프로세스를 관리한다. 테이프 액세스 및 복구 권한을 정확히 명기하고 정확한 미디어 및 라이브러리 관리 프로세스가 수립되어 있는지 관리한다.

- 분리 가능한 미디어에 데이터가 저장되고 테이프 시스템에서 빼낸 시점부터 데이터 아카이빙을 고려한다. 소프트웨어의 확인(Verification) 기능을 활용, 아카이빙 데이터를 기록하고, 기록된 데이터 세트를 읽을 수 있는지 꼭 확인한다.

- 정확한 미디어 핸들링이 필수적이다. 특히 영구적인 기록이 필요한 경우 더욱 그렇다. 광범위하게 활용되고 있는 표준 디지털 데이터 포맷을 활용한다.

- 장기 아카이빙 시스템이 정확하게 확보되어 있는지 확인하고 환경적인 면도 검토한다. 아카이빙 미디어에 명백한 손상이나 오염이 발생되지 않았는지 정기적으로 점검한다.

- 미디어는 가급적 가장 신뢰할 수 있고 선호되는 회사의 제품을 고른다. 조금 저렴한 가격에 구입할 수 있다고 해서 리사이클된 제품이나 품질이 떨어지는 미디어를 사용하지 않도록 주의한다.
장기 아카이빙을 위해 여러 벌의 데이터 복제본은 여러 개의 미디어에 저장한다. 저장 시스템을 장기간 활용할 수 있는지 검토하고 운영 시스템과 애플리케이션 소프트웨어 및 서버, 미디어 등 모든 요소를 세심히 확인한다. 마이그레이션을 대비해 테이프 기술을 5년 단위로 새로 바꾼다. 마이그레이션을 진행하면서 모든 데이터가 완전한지 확인한다. 오래된 볼팅 카피는 신뢰할 수 있는 카피로 대체하거나 보다 저렴한 미디어로 이동한다. 그러나 아카이브 미디어를 절대 리사이클 하지 않는다. 영구 보관이 필요한 경우 세컨드 카피본을 활용함으로써 원본 데이터에는 액세스를 제한한다.

‘접근성’ 극대화하기 위해 권장되는 베스트 프랙티스
- 데이터의 라이프사이클 전반에 걸쳐 데이터를 분류하고 목표복구시간(RTO)을 설정한다. RTO를 기준으로, 데이터를 적절한 스토리지 계층에 위치시킨다. 신속한 RTO가 필요한 경우 데이터를 ‘니어라인(Near-line)’에 배치함으로써 신속한 복구를 가능하게 한다.
RTO가 짧은 경우 데이터를 상대적으로 속도가 느린 ‘오프라인’ 미디어로 마이그레이션한다.

- 여러 장소에 여러 벌의 데이터 복제본을 관리한다. 읽기만 가능한(WORM) 버전을 함께 관리함으로써 내용물을 함부로 고치지 못하도록 한다.

- 저장된 데이터가 사실상 액세스 가능한지 확인하고 이를 복구할 수 있는 애플리케이션 및 절차가 갖추어져 있는지 살핀다. 데이터 카테고리별로 복구가 가능한지 정규적으로 테스트함으로써 사전에 수립한 RTO에 부합하는지 확인한다.

- 데이터 인덱스를 관리하고 검색 능력을 체크한다. 데이터를 찾아내고 그 위치를 확인하는 것은 컴플라이언스를 준수하기 위한 시작점이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.