데이터 장기 보관, 적절한 정책 필요하다
상태바
데이터 장기 보관, 적절한 정책 필요하다
  • Network Computing
  • 승인 2003.08.16 00:00
  • 댓글 0
이 기사를 공유합니다

스토리지 매체의 진화에도 불구하고 데이터 장기 저장은 전혀 용이해지지 않고 있다. 일단 문서가 마이크로피시(microfiche)로 옮겨지거나 박스에 담겨 치워져 버리면, 이들을 다시 찾기 위해서는 필름을 뒤지거나 종이 뭉치들을 들춰보아야 한다. 오늘날의 도전은 스토리지 하드웨어가 앞으로 몇 년 동안 데이터에 액세스할 수 있도록 디지털 매체를 관리하는 일이다.

열쇠는 법과 회사 목표를 염두에 두고 계획 및 실행되는 장기적 저장 정책이다. 이 계획에서는 IT 직원의 이직에서부터 기술 도전들, 그리고 데이터 보유 필요조건에 이르는, 발생할 수 있는 모든 문제를 다뤄야 한다. 여기서 인력 항목은 종종 간과되는 부분이다.

예를 들어 IT 직원이 그만두면 재편성 과정에서 중요한 데이터가 사라질 수 있으며, 이는 특히 그 기록이 제대로 문서화돼 있지 않거나 혹은 데이터의 물리적 소재지를 추적할 수 없을 때 가능성이 더 높다. 기술 쪽에서는 장기적으로 지속되고 저장고에 액세스할 필요가 있을 때 쉽게 사용할 수 있는 스토리지 매체(테이프나 CD, 혹은 DVD 등)를 선택할 필요가 있다.

저장 수단 필수

조직에서는 저장된 데이터를 관리하는 임무를 맡은 IT 직원이 최소한 한 사람은 있어야 한다. 대부분의 회사들이 아직 이러한 장기 스토리지 매니저 자리를 두고 있지 않지만, 곧 이런 상황은 바뀔 것으로 전망된다. HIPAA(Health Insurance Portability and Accountability Act)와 기타 사생활보호 관련 정부 규정들로 인해 조직들은 장기적 데이터를 보다 잘 보호하고 지키기 위해 조화롭게 잘 관리되는 보관 전략을 갖추게 될 것이기 때문이다. 장기 스토리지 담당자는 법조쪽 뿐만 아니라 개별 부서장들과도 긴밀한 관계를 유지하여 데이터 보유 필요조건을 파악해가야 한다. 예를 들어 재무부서에서 7년간 금융 데이터를 보유하고 있어야 한다면 만기 일정을 설정해서 저장된 데이터가 관리되도록 할 수 있다.

장기 데이터 저장 정책 및 프로시저 계획은 회사에서 내부 용도나 고객용으로 소프트웨어를 개발할 때 매우 중요하다. 오래된 코드는 재활용이나 조사할 일이 생길지도 모르기 때문에 보관해 두는 게 좋다. 세부 판매 기록, 고객 데이터 및 기타 정보는 동향 분석용으로 사용될 수 있으며, 회사 통신 기록은 특허권 분쟁에 연루됐을 때 효과를 발휘할 수 있다(코드가 내부적으로 개발된 것임을 입증할 수 있기 때문에). 반면에 비업무용 기록들이나, 혹은 업무용이라 하더라도 법적으로 보호받지 못하는 이메일 통신 기록들은 삭제함으로써 불필요한 법적 문제로부터 회사를 구할 수도 있다.

계획 중에서 기술적인 부분에 있어서는 테이프나 CD에 데이터를 넣고 상호연관시킬 수 있는 간단한 수단이 필요하다. 문서 관리 시스템과 같이 자동화되거나, 혹은 기록 기반의 경보 기능을 갖추어 데이터가 만기될 때를 알려주고 스토리지 정책에 따라 삭제될 수 있는 룩업 시스템(lookup system)을 선택하라.

또한 장기적 데이터 저장을 위한 예산도 확보해야 한다. 여기에는 내부적으로 진행되든 외부에 맡기든 오래된 디지털 포맷을 새 것으로 바꾸는 데 드는 비용도 포함시켜야 한다. 장비들의 유지보수 비용도 간과해서는 안 된다(바꾸기 이전의 디지털 포맷들을 읽어내는 테이프 드라이브 등).

하드웨어 부문

향후 몇 년 동안 읽지 못한다면 그 데이터의 사후수명은 없는 셈이다. 따라서 최소한 데이터를 보존하는 동안 생존해 있을 스토리지 하드웨어를 선택해야 한다. 스토리지 하드웨어가 쉽게 고장나거나 파손될 수 있다는 사실을 명심하라. 예를 들어 구식 테이프 드라이브의 메커니즘은 테이프 조작 롤러 손상 등 여러 가지 고장들로 문제를 일으키곤 했다.

수 년 전 필자가 일했던 한 회사에서는 듀얼 중복 서버 시스템에서 데이터 복구용으로 낡은 IBM QIC(Quarter-Inch Cartridge)를 사용했다. 이 회사의 모든 소재지(100개 이상)에는 이 드라이브가 있었으며, 백업에서 데이터를 복구해야 할 때 우리는 테이프를 사용했다. 언젠가 250개 서버에서 코드를 업데이팅시켰을 때 그 곳에 있던 거의 모든 테이프 드라이브가 고장이 났기 때문에 우리는 각각의 소재지에 작동하는 드라이브를 보내야 했다.

테이프 드라이브의 열을 식히는 것은 내부에 있는 팬으로, 이것이 카트리지 슬롯을 통해 공기를 끌어들여 시스템 뒤로 내보냄으로써 내부 메커니즘과 회로판의 과열을 방지한다. 그 과정에서 어떤 부분은 그대로 남겨지며 계속되는 공기의 흐름 덕분에 읽기-쓰기 헤드나 테이프 조작 장치에 작은 먼지 조각들이 앉기도 한다. 고무로 된 테이프 조작 롤러는 많은 드라이브에서 굳거나 파손돼 있으며 그나마 제대로 돌아가는 것들은 우연히 꺼져 있던 것들이었다. 이런 것들은 계속 사용할 수가 없었다. 훨씬 더 당황스러웠던 것은, 망가진 것들을 교체하기 위해 사용된 테이프를 찾기가 어려웠을 때였다.

사실 스토리지 하드웨어는 테이프들만큼 관심을 받으며 다루어지지 않고 있다. 이런 하드웨어들은 적절히 보관되지 않는 경우가 많다. 즉 먼지 낀 장이나 서랍, 혹은 심지어 책상 밑에 뒹굴고 있기도 하며 사람들은 더 오래 된 테이프 백업 시스템을 찾기도 한다. 따라서 장기적 스토리지에 대한 계획을 세울 때는 데이터를 추출해내기 위해 사용하게 될 하드웨어 상태를 염두에 두어야 한다. 이것이 제조업체에서 지정한 온도와 다른 환경 조건들에 맞게 안전하게 보관되고 있는지를 확인하라. 그리고 고장이 난 특정 테이프 드라이브 시스템을 교체해야 할 때는 그 드라이브 포맷에 장기적인 데이터를 남겨두지 말라.

스토리지 스택

스토리지는 보통 데이터의 중요도와 액세스 및 복구 속도에 따라 계층적으로 배열된다. 장기 스토리지는 기업 데이터 에이징 스택에서 가장 아래에 놓인다.

데이터 스택의 형태는 다음과 같다. 첫 번째는 메인라인 스토리지로, 여기에는 주요 스토리지 시스템, SAN(storage-area network), 그리고 가장 빠르고 믿을 수 있는 스토리지가 있다. 이 곳은 프로젝트 파일과 같이 정기적으로, 그리고 급하게 필요로 하는 데이터를 두기 가장 좋은 장소다. 두 번째 스토리지는 보통 직접 연결되는 서버 스토리지와 특수 용도 스토리지 형태다. 세 번째는 데이터 에이징과 디스크 투 디스크 백업에 일반적으로 사용되는 니어라인 스토리지다. 그리고 가장 아래에 테이프 백업 드라이브 및 자동화 시스템이 놓인다.

어떤 회사에서는 이 최종 스토리지 스택에 메인 어레이에 부착되는 CD-롬 기록시스템과 같은 보조 스토리지를 갖고 있기도 한다. 이것은 예전에는 쓸 만한 스토리지 확장안이었지만 오늘날에는 비효율적인 데이터 스토리지 방안으로 여겨지고 있다. 가지를 추가하면 복잡성이 늘어나며, 이는 백업 프로세스에 혼란과 에러를 야기할 수 있다. 모든 데이터는 스택을 따라 내려가야 한다.

테이프는 장기 저장용으로 가장 흔히 사용되는 매체다. 물론 테이프 스토리지의 가장 큰 문제는 데이터를 검색하는 데 걸리는 시간과 여기에 액세스하는 데 사용되는 하드웨어의 신뢰성이다. 적절히 보관될 경우 많은 현대식 자기 테이프 포맷 수명은 최고 30년이다. 이것도 또한 진보하고 있는데, 소니에서는 SAIT와 AIT-3 테이프 기술의 일회 기록용 버전을 만들어내고 있으며, 이것은 영구 보관 테이프를 제공한다. AIT-3 WORM(Wirte Wonce, Read Many)는 현재 출시되고 있으며 SAIT WORM은 곧 출시될 예정이다. 이런 테이프들은 특수한 드라이브를 필요로 하지 않기 때문에 기존의 드라이브 하드웨어 상태가 괜찮기만 하다면 이것을 사용할 수 있다.

무조건 저렴한 시스템은 안돼

최근에는 테이프 포맷이 최소한 읽기 호환성 있어서 점점 더 후방 호환성을 갖춰가고 있는 추세다. 예를 들어 소니의 AIT-1은 나중에 나온 AIT-3와 AIT-2 드라이브에서 읽혀진다. HP나 IBM, 퀀텀, 씨게이트, 소니 및 스토리지텍 등과 같은 테이프 드라이브 제조업체들이 후방 호환성에 대한 고객의 요구에 귀를 기울임에 따라 DLT, LTO 및 기타 테이프 포맷들 또한 후방 호환성을 제공한다.

또 한 가지 장기 스토리지 기술은 광학, 혹은 광 자기 WROM 스토리지로, HP, 플렉스터, 파이오니아 및 도시바 등이 광학 스토리지 매체 및 드라이브의 주요 공급업체들이다. HP는 20~25년의 후방 호환성 수명을 갖춘 고용량 스토리지 시스템을 제공하고 있다.

CD-R와 DVD 기록용 스토리지 포맷들도 또한 나와 있다. CR-R은 일회 쓰기, 반복 기록용 매체로 저장 수명이 5년밖에 되지 않는다. 일부 DVD 제조업체들은 특정 종류의 DVD 매체 수명이 100년이라고 주장하기도 한다. DVD나 새로 등장하고 있는 블루 레이저 창안들과 같이 20~50GB에 달하는 유사 기술들은 DVD 기록 가능 주크박스를 이용해 장기 스토리지 시장에 침투하고 있다.

한편, 여러 개의 재기록이 가능한 DVD 드라이브를 하나의 박스에 담은 미확인 업체들로부터 나오는 조합식 스토리지 시스템에 유의해야 한다. 장기적인 서비스와 지원이 필요할 것이기 때문에 업체측에 업그레이드와 저장수명에 대한 주장을 확인해 보아야 한다. 기록 시스템은 향후에도 읽기가 가능해야 하기 때문에 스토리지 장비 유지보수 계약을 맺어두어야 한다. 일단 지원을 받지 못하게 되면 데이터는 더 이상 쓸 수 없는 것이나 마찬가지이기 때문이다. 그리고 장기적 데이터 보관 시스템으로 무조건 저렴한 시스템을 선택하는 우를 범해서는 안 된다. 장기 데이터는 너무도 소중한 자산이기 때문이다.

DVD 포맷의 장단점

오늘날 DVD 스토리지 표준은 하나로 통일돼 있지 않으며 대신 DVD+R과 DVD+R 일회 기록용 포맷이 서로 경쟁을 벌이고 있다. DVD+R은 DVD+RW 얼라이언스에서 개발했으며, DVD-R은 DVD 포럼에서 내놓은 것이다.

현재 공식 DVD 표준화 기구인 DVD 포럼(www.dvdforum.org)은 업계용으로 하나의 포맷 표준을 정하기 위해 고심하고 있다. 이 업계는 경쟁 포맷들과 어지러운 ‘+’ 및 ‘ - ’ 명칭들로 혼란을 빚고 있기 때문이다. 하지만 이 포럼의 역할은 결국에 가서 그리 중요하지 않게 될 것 같다. 왜냐하면 불량 포맷들이 계속해서 등장하고 있으며 시장은 어찌됐든 DVD의 표준 포맷을 결정할 것이기 때문이다.

한편, 새로운 기술인 광학 블루 레이저 또한 비슷하게 꼬인 경로를 따라가는 듯하다. 블루 레이저 포맷에는 AOD(Advanced Optical Disk)와 블루레이(Blu-ray) 두 가지가 있다. NEC와 도시바에서 개발한 AOD는 싱글 레이어 디스크에 20GB 용량을 갖고 있으며, 듀얼 레이어 디스크에 40GB를 갖고 있다. 블루레이(www.blu-way.com)는 쏘니와 JVC, 파나소닉, 필립스 및 파이오니아 등 다른 8개 업체들이 내놓고 있다. 싱글 사이드, 싱글 레이어 디스크에는 27GB의 용량이, 싱글 사이드, 더블 레이어 디스크에는 50GB의 용량이 있다. DVD 포럼은 블루레이와 AOD 광학 포맷을 모두 연구 중이다.

NEC나 도시바를 제외한 모든 업체들은 블루레이를 지원하며, 업계에서는 이들 두 업체도 블루레이를 채택하기를 희망하고 있다. 소니는 일본에서 블루레이 레코더를 내놓았지만, 미국에서는 2004년에나 볼 수 있게 될 것이며, 전면적인 생산은 2005년으로 예상된다. 따라서 DVD 포럼과 블루레이저 개발자들이 한 가지 포맷에 정착해서 또 다른 DVD 표준 전쟁을 피할 수 있게 되기까지는 시간이 더 필요할 것 같다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.