ILM(Information Lifecycle Management)
상태바
ILM(Information Lifecycle Management)
  • 데이터넷
  • 승인 2007.04.17 00:00
  • 댓글 0
이 기사를 공유합니다

여행은 결코 쉽지 않다 … “그러나 그럴만한 가치가 있다”
비즈니스 가치에 따라 데이터 저장 … 궁극적 통합 시스템 아직 없어

ILM 툴과 프랙티스를 이용해 데이터를 관리함으로써 얻게 되는 비즈니스 가치와 왜 업체들이 계속해서 데이터 보유에 대해 산만한 접근을 계속하고 있는지를 분석했다. 과연 IT는 모든 것을 하나의 통합된 게임 플랜으로 끌어올 수 있을까? 또한 우리는 데이터 관리를 처리할 수 있게 도와주는 세 가지 파일 분류(file-classification) 제품들도 함께 검토했다.

시간이 돈이라면, 대부분의 데이터 관리자들은 부도 상태에 가깝다. 사용자는 4년 전 만들었던 영업 회의의 파워포인트 자료를 원하며, 변호사는 하루 빨리 비즈니스 문서를 넘기라고 성화다.
데이터 보유 정책을 정밀 조정해야 하는 새로운 규정들이 계속 생겨나고 있다. 그렇잖아도 바쁜 삶을 더욱 바쁘게 만들기라도 하려는 듯, 소송과 관련된 모든 전자 비즈니스 문서(이메일과 IM, 스프레드시트, 워드 및 엑셀 파일 등)를 요청하는 주문이 들어올 경우, 지난 해 발 효력을 발휘하기 시작한 민사절차에 대한 연방법(Federal Rules of Civil Procedure)에서는 이를 따르는 데 120일밖에 허용하지 않고 있다.
변호사에게 “너무 비싸다! 툴이 없다!”는 메일을 보낼 생각은 않는 게 좋다. 판사에게 이것을 모두 함께 끌어올 수 없다는 사실을 입증하는 것은 당신의 책임이기 때문이다.
이렇듯 빡빡한 시간으로 모든 관련 테이프를 웨어하우스로부터 회수에서, 이들을 새 서버로 복원하고, 관련이 있을 것 같은 데이터를 추출해서 유능한 변호사에게 모든 것을 분석하게 할 수 있겠는가?
아마 불가능할 것이다. 때문에 물론 업체들은 e-디스커버리(e-discovery) 규정이 IT에게 불러올 고통을 예상하고 입맛을 다시며 어떤 식으로든 데이터 관리에 손을 대고 있다. 포레스터에 따르면 지난 해 기록 관리 시장은 2억8천만달러였다. 내년에는 여기서 500% 가까이 성장해 13억달러라는 엄청난 규모를 형성할 것으로 전망된다.
그리고 이러한 돈의 상당 부분은 ILM(Information Lifecycle Management) 애플리케이션에게 돌아갈 것이다. 간단히 말해 ILM은 “물건마다 제 자리가 있는 법이다”라는 오랜 속담에 대한 IT식의 해답이다.
이것은 주어진 데이터 아이템의 가치가 시간이 흐르면서 변하는 것과, 그 수명 동안에 주어진 데이터 아이템용으로 각자 다른 액세스 방식이 적합하다는 것을 인식하면서 그 가치에 비례하는 장소에 데이터를 저장하도록 지시한다.

결코 쉽지 않은 일
솔직히 말하자면, 현재는 어떠한 통합 ILM 시스템도 없다. 이메일 아카이빙 툴과 그에 해당하는 파일 관리 및 데이터베이스 툴들을 함께 풀링함으로써, 그리고 데이터를 현재 가치에 상응하는 방식으로 관리할 수 있도록 데이터의 비즈니스 가치를 정의하는 포괄적인 정책을 개발함으로써(이메일 및 파일의 구조화), 어느 정도 이것을 얻을 수는 있다. 하지만 ILM의 정수를 얻기 위해서는 정교한 데이터 분류 엔진과 같이, 아직은 실현되지 못한 기술들이 필요하다.
그렇다면 마냥 기다릴 수 있겠는가? 스토리지 필요가 최소한이 아닌 한, 그리고 규제가 덜한 업계에 몸담고 있지 않은 한 그럴 수는 없을 것이다. 물론 디스크는 여전히 저렴하지만, 파일의 크기가 수천 배나 늘어난(10년 전 2KB에 불과하던 워드퍼펙트 문서가 지금은 2MB의 마이크로소프트 워드 파일이 됐다) 보유 규정으로 인해 대부분의 회사들은 파괴점에 도달하지 않을 수가 없게 됐다.
하지만 반드시 그래야 할 필요는 없다. ILM으로의 여행은 결코 쉽지는 않지만, 그럴만한 가치가 있다. 본 기사를 위한 독자 설문조사에서, 생산 ILM 이니셔티브가 있는 응답자 네 명 가운데 한 명은 주 시스템의 보다 간편한 관리를 향유하면서, 하이엔드 디스크에는 돈을 덜 쓰고 있었다.

마침내 꿈틀
현재 익사 상태에 있다면, 이메일 아카이빙 애플리케이션과 같은 포인트 솔루션을 이용해 규정 필요조건을 지키면서 얼마간의 숨 쉴 틈을 마련할 수 있다. 향후 2~3년이면 애코피아네트웍스(Acopia Networks), 브로케이드(Brocade), 네오페쓰네트웍스(NeoPath Networks), 엔지니 및 EMC(레인피니티에 인포스케이프 통합) 등과 같은 업체들이 분류 및 마이그레이션 서비스 등 새로운 세대의 파일 관리 시스템을 내놓을 것이다.
이상적으로 볼 때, 이런 업체들은 많은 이메일 아카이브 공간을 파일 시스템에도 또한 존재하는 첨부파일이 차지하고 있음을 알아차리고, IT에게 이런 아카이브들을 통합할 수 있는 수단을 제공할 것이다. 우리는 세부적이고 유연한 범주를 이용해 비구조화된 파일 데이터를 분류하고 파일을 마이그레이팅한다고 주장하거나, 별도의 데이터 마이그레이션 엔진과의 인터페이싱을 제공하는 제품들을 테스트했다. 그 결과는 <박스: NWC 보고서>에서 간단히 정리했다.
마지막으로, 구조화된 데이터를 관리하는 일은 언제나 데이터 서버 환경에 따라서만 좌우되는 게 아니라 애플리케이션 데이터베이스 스키마와 사용 효율에 따라서도 좌우된다. 따라서 사실상 애플리케이션에 따른 포인트 제품들이 어떠한 통합 솔루션보다도 훨씬 더 일을 잘 해낼 것이다. 예를 들어 프린스톤소프테크(Princeton Softech)의 옵팀(Optim)과 솔릭스테크놀로지스(Solix Technologies)의 아카이브지니(ArchiveJinni)에는 피플소프트나 오라클 파이낸셜 같은 애플리케이션용의 모듈과 정책이 있다.

시간과 돈 투자해야
ILM 프로젝트를 시작하는 데는 막대한 시간과 돈이 든다. 노동의 관점에서 보면 ILM은 무엇보다도 정책의 문제다. ILM 툴이 데이터를 찾고 이것을 적절한 스토리지로 이동시키는 프로세스를 자동화할 수 있으려면, 그에 맞는 적합한 보유 정책이 먼저 마련돼야 한다. 우리가 분석해 본 파일 분류 소프트웨어가 여기서 도움이 될 수 있지만, 이들은 키워드와 메타데이터로 한정돼 있기 때문에 미래의 제품들에게서 우리가 기대하는 것과 같은 컨텍스트별 구분을 자동으로 해주지 못한다.
정책은 정치와 마찬가지로 지역적(local)이다. 하지만 한 가지 보편적인 진실은 어떤 데이터가 기록의 가치가 있는지를 판단하는 데는 IT와 변호사, 그리고 비즈니스 주주들간의 긴밀한 협업이 필요하다는 것이다.
ILM 프로젝트를 진행하는 데는 막대한 재정적 투자도 또한 필요하다. 파일 분류 소프트웨어의 경우 평균 수준의 기업에서 5만~10만달러는 충분히 들어간다. 우리의 에디터스 초이스로 12TB의 데이터를 관리하려면 8만달러가 필요할 것이다. 이메일 아카이빙 비용은 메일박스당 10~50달러다. 하지만 비용 차감도 가능하다. 가치가 떨어지는 데이터를 적은 양 보관하기 때문에 덜 비싼 스토리지를 덜 사용할 수 있기 때문이다.
생산성 이득은 백업과 복구 창을 줄이고, 비활성 데이터를 제거함으로써 데이터베이스와 이메일 서버 속도를 높임으로써 생산성 이득을 실현할 수도 있다. 그러면 테이프를 회수해서 한달 동안 테이프 작업에 두 사람의 관리자를 전담시킬 필요없이도 며칠안에 e-디스커버리 요청을 수행할 수 있게 된다.

이메일 아카이빙을 선두로
미국의 기업들은 이제 EMC의 이메일엑스텐더(EmailXtender), 시만텍의 엔터프라이즈 볼트(Enterprise Vault), 그리고 잔택스(Zantax)의 EAS 등과 같이 나이를 기준으로 주 데이터 저장소로부터 이메일 메시지를 아카이빙시키는 이메일 아카이빙 제품을 통해 ILM의 꿈의 실현을 목전에 두고 있다. 메시지는 사용자들에게 반투명하게 사용 가능한 제 2 데이터 저장소에 놓이며, 조직의 데이터 보유 정책에서 정해진 지시에 따라 삭제가 된다.
지금 우리는 데이터 보유 규정을 준수하고, 이메일 메시지를 인덱싱하고 e-디스커버리용으로 다중 메일박스에서 검색을 허용할 수 있는 능력을 제공하기 위한 툴로서 주로 이메일 아카이빙을 생각하고 있지만, 원래 이 시스템은 이메일 관리자의 삶을 보다 편리하게 해주는 도구로 선전됐다.
익스체인지 서버로 하나의 메시지를 복구하는 데만도 전체 정보를 복구하고나, 혹은 엄청나게 느린 메일박스별 백업을 해야 했기 때문에, 관리자들은 정보 저장소의 크기를 제한하고 싶은 강한 충동을 갖고 있었다. 하지만 사용자에게 메일박스 할당량을 둘 경우 사용자 .PST 파일이 확산되고 메시지가 부적절하게 삭제되는 경우가 생긴다. 그리고 데이터 관리가 개별 사용자에게 넘어가게 되는데, 이들은 비즈니스 기록으로 보관해야 할 통신은 삭제하고 신기하게도 쓸데없는 것들만 보관하는 경향이 있기 때문에 이러한 이동은 바람직하지 못하다.
대부분의 아카이빙 소프트웨어는 아웃룩이나 노츠 클라이언트 플러그인을 필요로 하는데, 이들은 사용자용으로 ‘마이그레이팅된 메시지’아이콘을 보여주며, 아카이브로부터 메시지와 첨부파일을 자동으로 검색한다. 맥과 리눅스 기계가 있는 사용자는 아마도 모든 기능을 누리지는 못할 것이다.
이상적으로 생각하자면 ILM 업체들은 이메일과 파일 관리 툴을 통합할 것이다. 많은 사용자들이 파일 서버에서 문서를 만든 다음 첨부파일로 이 파일을 동료들에게 전송하기 때문에, 같은 파일이 파일 시스템과 메일 서버 데이터 저장소에 모두 존재하게 된다. SHA-2와 같은 충돌 회피 해싱(collision-resistant hashing) 알고리즘을 사용하면 통합 파일/이메일 ILM 시스템이 이런 중복을 가려내서 하나의 카피만 보관함으로써 디스크 공간을 절약해 줄 수 있다.
우리는 EMC와 같이 파일과 이메일 관리 제품을 둘 다 갖고 있는 업체들이 곧 통합 스위트를 내놓을 것으로 기대하고 있다. 현재로서는 스켄트릭(Scentric)의 데스티니(Destiny)가 익스체인지와 파일 데이터용으로 얼마간의 정책 기반 데이터 추출 기능을 제공하지만, 여기에는 메시지 로깅과, 메시지 방향을 아카이브로 조정해주는 기능이 빠져 있는데, 이것은 둘 다 완전 사양의 이메일 아카이빙 애플리케이션이라면 있어야 하는 기능들이다.

데이터베이스의 딜레마
데이터베이스 마이그레이션 엔진과 약간의 작업을 통해, 당신의 스토리지 관리자와 DBA는 생산, 테스트, 개발 및 스페어 데이터베이스를 각각 적합한 스토리지 티어(tier)에 할당할 수 있다. 하지만 나이가 들고 가치가 바뀜에 따라 데이터를 마이그레이팅해야 할 때가 되면, 파일 및 이메일 메시지는 언제나 같은 장소에서 타임 스탬프를 갖고 있다는 점에서 이점이 있다.
이와 대조적으로 오라클이나 SQL 서버 데이터베이스에 있는 테이블과 행(row)은 시간별로 분리되거나, 개별적인 시간 스탬프를 갖고 있을 것이며, 각각의 애플리케이션은 그 데이터를 다르게 조직화할 것이다. 따라서 구조화된 데이터를 분류하는 데는 애플리케이션에 의해 만들어진 데이터베이스 스키마와 분류 엔진 사이에 보다 긴밀한 관계가 필요하다.
이에 따라 EMC의 데이터베이스 엑스텐더, HP의 레퍼런스 인포메이션 매이저 포 데이터베이스(Reference Information Manager for Database) 및 프린스톤의 옵팀 등은 프로세스를 단순화하기 위해 SAP 같은 일반적인 애플리케이션용 에디션을 내놓았다. 솔릭스(Solix)도 마찬가지로 자사의 아카이브지니 데이터베이스-아카이빙 소프트웨어 고객들에게 제공하는 애플리케이션 데피니션(application definition)을 갖고 있다.
데이터의 수명 동안 나이가 들면 이것을 마이그레이팅하는 외에도, 대부분의 업체들은 개발이나 테스팅용으로 사용되는 작업 데이터베이스의 보다 작은 카피를 만들어 주는 모듈을 데이터베이스 ILM 스위트의 일부로 제공하고 있다. 이러한 미니데이터베이스에는 트리거와 저장 프로시저 풀세트와, 주 데이터베이스의 1/10 크기에 불과한 대표 데이터 세트가 포함될 수 있기 때문에, 프로그래머는 수 테라바이트의 디스크 공간을 소모하지 않고도 코드를 테스트할 수 있다.
이 회사 사이트에서 무료로 다운로드 받을 수 있는 오라클의 ILM 어시스턴트(assistant)는 DBA가 데이터 수명을 쉽게 정하고, 그 수명에 데이터베이스 테이블을 간단히 할당할 수 있게 해준다. 그런 다음 이것은 오라클의 테이블 파티션을 이용해 하나의 테이블스페이스에 있는 파티션에서 보다 비용이 낮은 티어에 저장된 다른 테이블스페이스에 있는 파티션으로 데이터를 이동해 줄 것이다. 오라클 파티션은 사용자 애플리케이션에 투명하기 때문에 사용자는 편안하게 모르고 있어도 된다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.