자료 보관 활용 호환 OAIS 모델 각광
상태바
자료 보관 활용 호환 OAIS 모델 각광
  • 승인 2006.08.30 00:00
  • 댓글 0
이 기사를 공유합니다

Tech Guide - 통합 아카이빙 시스템 구축
자료 보관·활용·호환 OAIS 모델 각광
아카이빙 위한 ISO 권고 표준 … 한국형 아카이빙 표준 제정위해 OAIS 검토 필요

박노원/ 컴트루테크놀로지 이사/ rwpark@comtrue.com

1. OAIS의 참조 모델 - 기본 개념(이번호)
2. OAIS 모델의 응용 - 실제 응용사항을 중심으로

장기적으로 전자문서를 보관하기 여러 기술적 방법들이 제시될 수 있다. 하지만, 현재까지는 OAIS 참조 모델이 가장 공신력있는 방법으로 인정받고 있다. OAIS 참조모델은 디저털 정보의 장기보존을 위해 요구되는 사항들에 대한 합의에 따라 ISO에서 제정된 기술적인 권고사항으로 지난 2002년도에 제정된 것이다. 디지털자원의 장기보존을 위해서 필수적인 구성요소들과 개념을 제시하는 OAIS 참조모델을 중심으로 일반 아카이빙 시스템을 구성할 수 있는 개념 및 기능, 그리고 구체적인 방법을 소개한다. <편집자>

학문적으로 가치가 있는 정보는 동시대의 여러 기관에서 공유하거나 후세에도 전달돼 장기간 활용될 필요성이 있다. 아카이빙 표준화가 논의되는 목적은 후세의 세대들과 공유할 수 있는 가치 있는 정보를 공유하고자 하는 보다 장기적인 필요성에 의해서 발생한 것이라 볼 수 있다. 범위를 좁혀서 생각하면 기관이나 기업체에서 필요로 하는 정보도 구체적인 아카이빙 대상이 된다.
2002년 미국 NASA의 CCSDS(Consultative Commi ttee for Space Data System)와 남미와 유럽의 연구기관들은 공동으로 수행한 연구결과를 발표했다. OAIS(Open Architecture Information System) 참조모델은 ISO에서 제정된 디지털정보의 영속적인 장기보존을 위해 요구되는 사항들에 대한 광범위한 합의를 중심으로 개발된 기술적인 권고사항으로, 참조모형 문건의 부록에서 알 수 있듯이 데이터 교환구조와 관련된 표준 개발 작업의 연장 선상에서 제시된 것이다.

OAIS 참조모형 개발 배경
OAIS 참조모델을 개발 프로젝트가 최초 개발단계에서 관심을 갖진 사항은 다음과 같다.

O식IS의 참조모형의 서문은 이를 “한 아카이브가 디지털 정보를 영구적이거나 무기한 장기적으로 보존하는데 있어서 광범위한 의견일치에 도달하기 위해 개발된 기술적 권고안”으로 소개하고 있다. 광범위한 의견일치란, 디지털 정보를 장기적으로 보존하는 활동을 수행하는 모든 기관들 사이의 의사소통 기반을 마련해 앞으로의 협력을 활성시킨다는 의도를 말하는 것이다.
아울러 OAIS는 현재까지의 아카이빙 솔루션들이 비교적 단기적인 관점에 치중해 개발됨에 따라 매체의 오류점검이나 백업 개념 등에 머물러 있는 아카이빙의 개념을 더욱 확대해 데이터 상호간 연동성 확장, 또는 자료의 연계 구조 확장 방법을 고려하는 것이다. 즉, 자료구조의 호환성, 장기적인 보관, 자료의 적극적인 활용 등의 가치를 만족시켜주는 것이 OAIS모델이라고 말할 수 있다.

OAIS 모델 개념
장기간에 걸쳐 아카이빙된 문건이 생성, 관리, 전달되기 위해 OAIS에서는 다음과 같은 기본모델을 제시하고 있다.
<그림 1>과 같이 OAIS 모델은 3가지 주요 실체(Entity)를 가정하며, 이 3가지 엔티티는 상호작용하는 환경을 구성한다. 정보의 생산자로서 제작자(Producer)는 클라이언트 입력시스템을 포함하는 개념이며, 관리(Management)는 OAIS를 통해 장기보존에 필요한 요소와 절차들이 체계화될 수 있도록 수행하는 주체다. 소비자(Consumer)는 아카이빙시스템에서 정보를 활용하기 위해 수행하는 실체로서 클라이언트 시스템을 포괄한다. 특히 지정 집단(Designated Community)이란 개념은 특정유형의 정보를 소비·이용할 수 있는 집단으로 실체 상호간 교섭 방식에 대해 다음과 같은 작동방식으로 존재한다.
<그림 2>처럼 OAIS 에서 유통되는 정보패키지는 콘텐츠정보(CI)와, 보존기술정보(PSI)의 두 가지 유형이 정보를 갖는 개념적 컨테이너라고 볼 수 있다. CI는 OAIS가 대상으로 하는 보존돼야 하는 정보의 집합이면서 장기간 보관의 대상(object)이다. PSI는 CI를 오랜 시간이 지난 후에도 이해될 수 있도록 도와줄 수 있는 메타데이터 역할을 수행하는 것이다.
패키지 정보(package information)는 이러한 CI와 PSI가 결합돼 하나의 실체로 구성될 수 있는 캡슐화(encapsulation)된 단위정보로 개념적 수용체 형태로 존재한다. 소비자는 1차로 패키지 정보에 대한 데이터(Descriptive Information about package)를 참조해 활용할 수 있다.

OAIS모델에서 PSI를 구성하는 정보는 네 가지로 구분된다.
<그림 3>은 <그림 1>을 보다 상세히 설명한 것이다. <그림 3>에서 보여지듯 OAIS 내부에서 ▲흡수(Ingest) ▲보존(Archival Storage) ▲데이터관리(Data Management) ▲운영(Administration) ▲보존계획(Preservation Planning) ▲접근(Access) 등의 세부기능이 포함된다. <그림 3>에서 처리되는 내용을 단계별로 설명하면 다음과 같다.
실제로 SIP, AIP, DIP의 형태들은 기능의 흐름단계를 표현하는 개념들로 각각의 CI는 동일하지만 보존기술정보에 대해서는 동일할 수도 있고, 그렇지 않을 수도 있다. 상황에 따라서 보존기술과 관련된 패키징 정보는 유동적으로 변할 수 있으나, 실제 서비스를 염두에 둔 데이터 관리모듈에서는 SIP중 기본적인 기술정보만을 중심으로 전달하게 된다.

디지털 자원 보존전략
지금까지 개괄적인 OAIS 참조모델에 대해 알아봤다. OAIS 참조모형은 디지털 아카이빙에 관련된 다양한 이해당사자들의 요구사항과 필요조건들을 종합해 가장 좋은 모델을 추출한 것이다. 실제로 디지털문서의 아카이빙이라는 구체적인 작업을 염두에 두고 있을 때 정보의 생산자와 소비자를 연결시켜주는 이런 모델은 다양한 모습으로 변형될 수 있을 것이다.
우리나라에서도 전자문서에 대한 효력을 인정하는 법안이 2005년 4월 제정됐으며, 최근에는 공인전자문서보관소 제도가 준비되고 있다. 따라서 OAIS의 모델에 대한 이해가 선행돼야 한다고 생각된다.
우리 특성에 맞는 디지털정보의 생산, 관리, 활용 및 보존에 대한 연구와 함께 우리가 새로운 방법을 찾아야 하는 시점이기 때문이다. 이제 보다 구체적으로 보존대상이 될 자료를 선정하는 방법과 보존대상 자료의 무결성을 검증하는 무결성 확인 방법에 대해 알아보겠다.
아카이빙의 대상이 되는 자료는 기업과 기관의 환경에 따라서 크게 달라질 수 있다. 기본적으로 DB형태로 저장되는 정형데이터는 물론, 일반 애플리케이션을 사용해 생성한 비정형데이터까지도 아카이빙의 대상이 될 수 있다.
대학과 출판사의 경우, 저널과 출판물이라는 보존대상에 대해서 보존전략을 채택하는 것이 비정형 데이터 보존의 사례라고 볼 수 있다. 공공기관과 영리를 추구하는 일반 사기업의 경우에 업태에 따라 보존대상의 주체가 달라질 수 있으며, 비용과 그 효과를 고려해 보존 대상 자료가 결정될 수 있다.
디지털 자료는 아나로그 형태의 자료를 디지털 형태로 변환하면서 오류가 발생할 수 있다. 따라서 보존된 매체의 물리적인 결함, 파일포맷의 확인, 디지털 형태의 데이터가 훼손이나 수정됨이 없이 무결성을 유지함을 확인하는 것이 필요하다.
데이터 무결성을 확인하기 위해서는 저장 매체의 변화나 파일 형태의 변환, 또는 아카이빙 프로세스의 변환이 발생할 경우 주기적으로 자동 수행해야 한다. <그림 4>와 같이 프로세스의 변환이 발생하는 지점에서 홀딩 포인트(Holding Point)를 마련해 확인하는 것이 가장 바람직한 방법이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.