기업 데이터 관리 ‘4개 봉우리 넘어라’
상태바
기업 데이터 관리 ‘4개 봉우리 넘어라’
  • 김나연
  • 승인 2008.04.22 00:00
  • 댓글 0
이 기사를 공유합니다

데이터 거버넌스(Data Governance)
데이터품질 관리 · 데이터 통합 · 메타데이터 관리 · 마스터데이터 관리 기업 데이터 관리 ‘4개 봉우리 넘어라’ 상호 보완적·복합적으로 진행돼야 기업 환경이 복잡해지고 다양해지면서 이를 위한 IT 환경도 복잡해지고 있으며, 데이터의 복잡도 증가와 더불어 비즈니스 기회손실도 간과할 수 없는 부분이 됐다. 기업에게는 다양한 의사결정을 위한 정보가 필수적이며 이를 위해 정확하고 신뢰성 있는 정보를 적시에 공급받아야 한다. 이러한 신뢰성 있는 정보 확보에 있어서 기업 데이터 관리는 필수적이다. 따라서 업무담당자, 처리과정, 기술에 대한 최상의 조화가 필요하며, 이의 일환으로 기업은 ▲데이터품질 관리 ▲데이터 통합 ▲메타데이터 관리 ▲마스터데이터 관리 등의 4가지 필수 요소를 기반으로, 전사적 데이터 거버넌스 체계를 마련해야 한다. <편집자> 1부 _ 기업 데이터 거버넌스 시장현황 및 전망 데이터 효율적 관리가 기업 경쟁력 확보 열쇠 2부 _ 마스터 데이터 관리 기업 중요 무형자산 데이터 관리로 가치 창출 3부 _ 성공적 데이터 통합 위한 프로젝트 전략 재조명 ETL 접근 방식에서 전사적인 데이터 통합 전략으로 전환


1부 / ▶▶기업 데이터 거버넌스 시장현황 및 전망 데이터 효율적 관리가 기업 경쟁력 확보 열쇠 단위 시스템별 데이터 관리체계 뛰어넘어 전사적 관리 ‘필수’ … 데이터 거버넌스 ‘눈길’ 기업이 정보시스템을 구축해 활용하는 것은 업무의 효율화 측면도 중요하지만 기업의 데이터를 어떻게 효과적으로 보관하고 활용하는가도 이에 못지않게 중요한 문제다. 그러나 의외로 정보시스템 구축에 있어 데이터의 효율적인 분석과 설계에는 비교적 적은 관심을 기울이는 경향이 있다. 전 세계적으로도 데이터 관리의 효율성에 대해서는 최근에 와서야 이슈가 되고 있는 실정이다. 정보시스템의 효과성은 데이터 관리 수준에 의해 평가된다고 볼 수 있으며, 데이터 관리의 수준이 기업 경쟁력 확보의 주요 요소가 된다. | 김나연 기자·grace@datanet.co.kr| 오늘날 빠르게 변화하는 정보 중심의 경제 상황에서 기업들은 정확한 정보에 실시간으로 액세스 하는 것은 물론 이기종 시스템 전반의 대용량 데이터를 신속하게 통합할 수 있어야 한다. 따라서 기업의 데이터 관리는 데이터 관리정책, 표준화, 데이터의 구조, 데이터품질 관리, 모든 데이터를 처리하고 저장하는 데이터베이스, 데이터베이스의 성능관리를 비롯해 이 모든 것들을 체계적으로 관리하기 위한 관리 시스템을 구축하고 통제/관리/자문을 하는 전문화된 조직의 구성과 육성까지 모두 어우러져야만 한다. 기업이 회사 내 다양한 이기종 시스템 전반의 대용량 데이터를 더욱 효율적으로 관리하기 위해서는 데이터품질 관리, 데이터 통합, 메타데이터 관리, 마스터데이터 관리 등 4개의 산을 넘는 것으로 살펴볼 수 있다. 그러나 효과적인 데이터 관리를 위해서 주로 언급되고 있는 4가지(데이터품질 관리, 데이터 통합, 메타데이터 관리, 마스터데이터 관리) 키워드 측면의 데이터 관리는 별개의 것으로 떨어져서 단계별로 다뤄져야 하는 것이 아니라, 상호 보완적으로 시너지를 발생할 수 있는 부분으로 이해해야 한다. 앞서 언급된 4가지 영역들은 기업 데이터 관리의 주요 영역 중의 일부이며, 이들은 해당 영역에서의 고유한 기능들을 가지고는 있지만, 복잡한 기업 데이터 관리를 위해서는 상호 보완적이며 복합적으로 진행돼야 한다. 이를 위해서는 기업은 데이터 관리 전략에 근거한 단계별 구현 전략을 도출해야 한다.
용·어·해·설 메타데이터 : 메타데이터는 한마디로 데이터를 표현하는데 필요한 정보들, 즉 데이터의 형식(CHAR, Numeric, Boolean, Date 등), 데이터의 크기(자릿수), 데이터의 필드명, 데이터의 위치(시스템, 애플리케이션, DB, 테이블 등)를 지칭하는 말이다. 마스터데이터 : 마스터데이터는 기업 활동에 기본이 되는 전사 통합자원관리 시스템 기능을 지원하기 위해 구성되는 데이터의 기준과 업무의 기준이 되는 모든 정보로 각 시스템 및 데이터의 소통을 위해 사전에 정의된 기준을 말한다(상품, 자재, 고객, 공급사, 설비 등). 프로세스가 효과적으로 실행되기 위해서는 프로세스 간에 주고받는 마스터데이터가 정확성(Accuracy), 신속성(Timeliness), 신뢰성(Reliability), 활용성(Utilization)을 지니고 있어야 한다. 마스터데이터 관리 : 마스터데이터 관리는 기업의 비즈니스 네트워크를 연결하는 다양한 시스템 환경 하에서 비즈니스 수행에 필수적인 마스터데이터 정보를 통합 관리하는 것이다. 이를 통해 시스템 간 개별적으로 관리되던 마스터데이터를 통합, 정제, 동기화, 배포 등을 수행해 일관적인 비즈니스 수행을 지원할 수 있다. 많은 종류의 포인트 솔루션들이 다양한 벤더에 의해 제공되고 있지만 결론적으로 마스터데이터 관리는 다양한 기술과 방법론이 복합적으로 활용되는 총체적인 프로세스를 지원하는 솔루션이어야 한다. 이런 맥락과 함께 마스터데이터의 영역별 특화된 솔루션도 또 하나의 사일로(Silo)를 만들 수 있는 우려가 있으므로 권장되고 있지 않는 추세이며(ex: 고객통합, 제품통합 등 특화된 솔루션) 현재 시장에서 모든 종류의 마스터데이터를 관리할 수 있는 통합 솔루션을 찾는 기업이 늘고 있다. 체계적 데이터관리 필요성 ‘인식’ 데이터관리는 크게 데이터관리 체계를 확립하는 구조적인 부분과, 그 안에 얼마나 가치 있는 콘텐츠를 담을 수 있는지, 또한 그렇게 들어가 있는 데이터들을 얼마나 잘 활용하고 있는지 등의 전반적인 과정을 뜻한다. 또한 마스터데이터 관리 등에 필요한 관련 솔루션 및 시스템도 요구되며, 솔루션 외에도 데이터 관리를 운영하기 위한 회사내부 프로세스, 지침, 조직 등이 함께 수립돼야 한다. 최근에 와서 IT 거버넌스라는 말이 크게 유행하고 있다. 이는 정보기술을 기업의 자산으로 인식하고 이를 종합적으로 통제하고 관리한다는 개념이다. 특히 데이터 거버넌스는 이러한 정보기술을 구성하는 요소 중의 하나인 데이터를 좀 더 특별하게 통제하고 관리하자는 개념이다. 한국IBM 김광식 본부장은 “무엇보다 시급한 것은 관리나 통제에 앞서 정보제공과 의사결정의 근원적인 자료가 되는 데이터에 대한 품질 문제와 유지보수 운영에 대한 비용문제가 부각되고 있다”면서 “데이터는 기업의 매우 보편적인 기본자산이며, 정보시스템은 결국 데이터를 가공하고 참조하는 것일 뿐이다. 기업 내 각종데이터를 유용한 정보로 가공하고 이를 기업의 핵심자산인 지식으로 만들어 가는 정보기술에서 데이터 거버넌스의 역할은 지대할 수밖에 없다”고 설명했다. 이처럼 기업이 비즈니스를 영위하는데 전략적인 데이터의 활용이 그 어느 때 보다 중요해지면서 많은 기업과 기관들이 데이터 관리의 필요성에 대한 인식의 전환이 빠르게 이뤄지고 있다. 오경조 아이티플러스 이사는 “이 같은 인식의 전환에 이어 일부 기업과 공공기관이 진행하고 있는 차세대 시스템 구축과 맞물려 기업 데이터 관리의 필요성이 다시 한 번 대두되고 있다”고 밝혔다. ‘이번에는 제대로 된 데이터관리 체계를 갖춰보겠다’는 기업들이 차세대 프로젝트를 통해 데이터 관리 시스템을 대대적으로 수정·도입하는 추세가 확대되고 있는 것. 이해곤 IDS 수석은 “기업들의 데이터관리 필요성에 대한 인식은 높으나 그동안 시스템화(공개)에 대한 부담이 없지 않았던 것도 사실이다. 그럼에도 불구하고 데이터 관리는 이제는 더 이상 피할 수 없는 상황으로 기업의 생존 문제로 인식돼가고 있다”면서 “올해 데이터 관리는 차세대 시스템 구축 사업 진행, 데이터품질 관리 체계 구축 사업 등으로 가시화 되고 있다”고 말했다. 오경조 아이티플러스 이사는 “이제는 메타데이터 관리 및 데이터품질 관리 등의 필요성에 대해 많은 기업들이 인식하고 있다”면서 “특히 제1금융권은 이미 시장 성숙단계에 접어들었고, 최근에는 증권사·투신사 등으로 도입이 이어지고 있다”고 밝혔다. 이 밖에 공공분야에서는 EA/ITA 법안이 통과되면서 데이터품질 관리에 대한 관심이 급증하고 있다. 이와 관련해 오 이사는 “과거에는 데이터량을 누가 많이 쌓아 놓았는지가 높이 평가 받았다면, 이제는 얼마나 좋은 데이터를 쌓아서 잘 관리하고 있는지로 초점이 바뀌어가고 있다”고 설명했다. 데이터품질 향상, 기업 경쟁력 동반 상승 엔코아컨설팅 이화식 대표는 “‘정보시스템의 효율적 도입 및 운영 등에 관한 법률(ITA법)’이 시행됨에 따라 공공기관의 정보시스템 구축에 감리가 의무적으로 규정됐다”며 “ 이에 따라 정보 자산의 품질관리를 강조하는 ITA법의 특성상 데이터 모델링이나 데이터에 직접적으로 연관된 애플리케이션 아키텍처 재구성이 이슈가 되고 있다”고 설명했다. 이 대표는 “특히 그동안 데이터 품질은 협의의 데이터 값(Value) 관점의 품질만을 치중했던 경향이 있었다. 하지만 최근 최종의 데이터 값 품질을 결정짓게 하는 제반 구성요소의 구축과 운용에 DA(데이터 아키텍처) 개념을 도입해 접목을 시도하고 있다. 또한 논리 데이터 모델은 데이터 구조가 업무규칙을 표현해야 하고 이를 정보시스템의 관련자들이 공유하여 데이터 구조에 대한 서로 다른 해석을 미연에 방지해 데이터 품질을 향상시키는 역할을 해야 한다는 인식이 보편화되어 가고 있다”고 밝혔다. 한편, 기업들은 데이터의 데이터인 메타 정보는 어디에 있는지 관리하면서, 마스터데이터 관리 등을 통해 코드 값들을 통합관리 하는데 역량을 집중하고 있다. 이 모든 프로세스 안에 있는 데이터 값들이 잘 관리되도록 하면 궁극적인 ‘데이터통합’도 실현할 수 있는 것이다. 정인호 한국인포매티카 이사는 “데이터 통합은 지난 1990년대 중반 이후 선진화된 경영기법 및 프로세스 도입에 대한 필요로 기업들이 전사적자원관리시스템(ERP)을 도입하게 되는 등 많은 기업들이 그 필요성과 중요성을 인식하고 있다. 특히 2006년 미국의 서브프라임 모기지 사태는 많은 기업들이 데이터 통합의 중요성에 대해 한번 더 인식하게 된 계기가 됐다”고 밝혔다. 정 이사는 “이후 많은 기업들이 시스템 구축에 대해 투자를 하고 있으나 아직도 기존의 축적된 정보들을 활용해 의사결정을 지원하거나 효율성 증대, 생산성 향상 등은 가시적으로 잘 보이지는 않는 것이 현실이다”면서 “아무리 좋은 시스템이 구축된다고 하더라도 근본적인 데이터가 일치되지 않으면 생산되는 정보가 정확하지 않을 수밖에 없으며, 이는 올바른 의사결정에 도움이 되지 못한다”고 지적했다. 기업 데이터관리는 오늘날 IT의 흐름이 생산자 위주의 정책에서 ‘고객지향적’으로 바뀌는데 에서도 중요성이 더해지고 있다. 또, 마케팅이 주도하는 IT정책 등도 이유가 된다. 요즘은 데이터 분석을 통한 정보를 토대로 마케팅 타깃을 정한다. 고객정보도 과거와 달리 소득, 자녀수, 학교 등 구체적 정보가 조사된다. 과거에는 없었던 이런 데이터로 인해 데이터 관리의 필요성은 한층 커졌다. “기업 데이터 구조를 파악하라” 흩어진 데이터들을 파악하고 관리하기 위해서는 메타데이터 관리 시스템 도입이 필수적이다. 이에 기업에서는 메타데이터 시스템을 도입해 데이터를 어떻게 관리하겠다는 기준과 규정을 만드는 움직임이 활발하다. 또 데이터 아키텍처 부분을 중점적으로 설계하고 각 부서에서도 이를 이용할 수 있도록 하고 있다. 그러나 이것을 제대로 사용하고 이행하느냐를 기업 차원의 모니터링도 반드시 수반돼야 한다. 이 밖에도, 데이터는 변화가 일어나고 변화를 수용하기 위해서는 만들고 해체할 수 있게 해야 하고, 여기에는 기본적으로 ‘마스터데이터’가 있어야 한다. 엔케이엠홀딩스 이영수 대표는 “모든 기업에서 시스템간의 연동은 EAI를 포함해 포인트 투 포인트 방식을 사용하고 있기 때문에, 이는 연동의 복잡성을 기하급수적으로 증폭시키고 있다”며 “이를 해결하기 위해 ESB를 활용한 ‘데이터통합 허브’를 마스터데이터 관리 차원으로 사용하기도 한다”고 설명했다. Interview / 이화식 | 엔코아컨설팅 대표 데이터 거버넌스와 메타데이터 관리 Q. 데이터 거버넌스, 메타데이터 관리가 기존의 EDW 개념과의 차이는. A. 지금까지 유행처럼 번졌던 ERP, EDW, CRM, SCM 등은 모두 현업을 위한 시스템이다. 이에 비해 데이터 거버넌스나 메타데이터 관리는 ‘내실’을 기하자는 것을 말한다. 고객에게 보다 우수한 품질의 시스템을 저렴한 비용으로 적기에 제공하기 위해서는 ‘개발기술’도 필요하지만 ‘체계적인 관리’의 중요성도 이에 못지 않다는 것을 알게 됐다. 이제 정보시스템에서도 품질을 우선시하는 ‘시스템 웰빙’ 시대가 도래하고 있다. 우리가 웰빙의 가치를 인정함으로써 건강에 대한관심이 고조됐듯이 데이터 품질의 가치를 인정해야 시스템의 웰빙이 시작된다. Q. CIO들이 데이터 거버넌스 구축을 위해 당장 해야 할 일은. A. 거버넌스란 말 그대로 ‘관리와 통제’를 하자는 것이므로 거버넌스를 할 수 있는 체제부터 갖춰야 할 것이다. 이를 위해서는 첫째, CIO가 데이터 관리의 중요성에 대해 정확히 인식해야 한다. 둘째, 거버넌스를 단순히 지침이나 표준을 만들어 두는것 쯤으로 생각하면 절대 성공할 수 없다. 이를 전담할 책임 있는 조직을 만드는 것이 가장 중요하다. 셋째, 거버넌스의 시작은 적절하고 현실적인 표준화가 우선돼야 한다. 넷째, 통제형 메타데이터 관리시스템을 구비해야 한다. 메타시스템에는 ‘참조형’과 ‘통제형’ 시스템이 있는데 이는 근본적으로 다르다. 그러나 현재 진행되고 있는 대부분의 메타시스템을 들여다보면 ‘참조형’에 불과하다는 것이 문제다. 다섯째, 데이터 관리 지식(KNOWLADGE)을 확보해야 한다. H/W적인 기반을 갖추는 것이 우선적으로 필요하지만 S/W적인 요소를 간과하면 속빈 강정에 불과하다. 대부분의 개발요원들이 프로그래머 출신이기 때문에 예상외로 데이터 전문지식을 갖춘 인력이 드물다. 이들의 수준을 높혀 줄 수 있는 대책을 세우지 않고서는 결코 원하는 수준의 목표를 달성할 수 없다.
이 대표는 “데이터통합 허브를 통해 각 시스템에 산재해 있는 정보가 업데이트 될 때마다 하나의 마스터 데이터베이스에 쏘아주는 방식으로 마스터DB와 데이터통합 허브를 연계할 수 있다”면서 “향후 필요에 따라 각각의 시스템에 존재하는 고객정보와 상품정보를 통합하기 위한 도구로 활용할 수 있다”고 덧붙였다. 메타관리시스템 구축의 잘 알려진 사례인 KTF(대표 조영주)는 ‘전사메타시스템구축’ 프로젝트를 통해, 메타데이터 리파지토리(엔코아컨설팅 메타샵)를 도입하는 동시에 데이터 표준화 및 모델관리를 수행했다. 또 데이터 값에 대한 품질(아이티플러스 디큐마이너)과 애플리케이션 영향분석(아이티플러스 체인지마이너)까지 구축하는 시스템을 지난 2006년 말 오픈했다. 최근에는 KTF의 사례를 참고로 특허청이 RFP를 준비하고 있는 것으로 알려졌다. 현재 국내 메타데이터 관리 시장은 CA를 제외한 국산 솔루션 업체들이 대거 포진하고 있다. 가트너 조사 1위 메타데이터 관리 솔루션인 ‘로쉐이드’는 2바이트코드 한글지원 및 커스터마이제이션 문제로 한국에는 들어와 있지 않은 것으로 알려져 있다. 이제동 위세아이텍 이사는 “메타데이터는 기업의 다양한 데이터들을 데이터화 해 관리하는 것이다 보니, 메타를 고객이 어떻게 규정하느냐에 따라 솔루션화하기가 만만치가 않다”며 “최근 발주되는 RFP들은 모두 메타시스템의 정의 및 세부 스펙이 따로 제시되고 있다”고 말했다. 기업, ‘전사 데이터 관리’ 지향 현재 기업의 데이터 관리는 각 단위 시스템당 데이터 관리 정도 수준에 그치고 있는 것이 대부분. 그도 그럴 것이 ‘전사 데이터 관리’라는 전체 라이프 사이클 측면에서의 비즈니스 활용과 관리에 대한 인식 수준은 아직 높지 않다는 것이 전문가들의 공통된 의견이다. 기업 데이터 관리를 효과적으로 할 수 있는 방안으로 정재필 SAP코리아 엔지니어링 솔루션 팀장은 5가지 영역에서의 포괄적인 접근을 꼽았다. 그는 “기업 데이터 관리는 실제 비즈니스에서 데이터를 활용해 경쟁우위를 확보하는 것이며, 데이터를 가치 있고 보다 의미 있는 정보로 활용할 수 있도록 지원하는 것이다”라며, “아키텍처, 데이터 표준, 데이터 통제, 데이터 품질, 구현 등의 영역으로 데이터 관리를 시작해야 한다”라고 설명했다. 기업은 비즈니스 프로세스와 IT 솔루션을 포함한 데이터 ‘아키텍처’ 수립이 필수적이다. 비즈니스 전략에 의해 도출되는 아키텍처는 기업의 비즈니스를 지원하기 위한 ‘IT 디자인’으로 이해할 수 있다. 이와 더불어, 데이터는 항상 ‘데이터 표준’ 이슈를 만족시킴으로써 언제든지 시스템에 의해 데이터 추적·모니터링이 가능해야 한다. 가장 먼저 데이터 아키텍처를 수립한 다음, 데이터 표준을 만족시키는 데이터를 관리하는 행동은 궁극적으로, ‘데이터 거버넌스’를 위한 기반이 된다. 데이터 거버넌스는 데이터의 프로세스 및 표준에 대한 오너십과 규정을 말한다. 그러나 데이터 관리는 지속적인 개발 및 관심 또한 중요하다. 데이터 아키텍처를 수립하고 표준화를 이뤘다고 해서, 기업 데이터 관리가 끝나는 것은 아니다. 데이터를 비즈니스 및 프로젝트 요구사항에 부합되도록 통합하고 핵심적인 베스트 프랙티스 적용을 가속화하도록 지원하는 ‘구현’ 단계는 끊임없이 반복해서 일어나야 한다. 이 외에도 데이터를 표준에 부합되도록 유지하는 구체적인 활동은 ‘데이터 품질’을 통해 만족할 수 있다. 김광식 한국IBM 본부장은 “기업 데이터관리는 데이터 거버넌스로부터 시작되며, 그 중 데이터품질은 데이터 거버넌스이 펀더멘탈(fundamental) 같은 것이다”면서 “아무리 데이터 거버넌스를 한다고 해도, 데이터 품질이 확보되지 않으면 데이터 거버넌스는 아무 의미가 없다”고 말했다. 데이터품질 관리는 중복된 데이터 관리 및 표준화 등의 방법으로 충족해 나갈 수 있으며, 이 같은 문제를 해소하는 방법 중의 하나가 바로 마스터데이터 관리이다. 김광식 본부장은 “마스터데이터 관리를 이야기 한다면 기본적으로 데이터품질을 유지하겠다는 전제조건이 있는 것이다”고 말했다. 기업 내에는 각 부서의 필요에 의해 다양한 시스템들이 생기기 시작했다. 당연히 애플리케이션들은 데이터가 있어야 하므로 필요로 하는 데이터를 시스템별로 각각 만들어 놓게 된다. 각각의 애플리케이션이 필요로 하는 데이터를 만들면서 서로 비슷한 데이터가 만들어지게 된다. 이 대표적인 사례가 금융권의 고객DB로, 신용카드 시스템의 고객DB, 신탁 시스템의 고객DB, 외환 시스템의 외환DB 등은 제품 관점에서는 구별되지만 내용면에서는 동일한 데이터가 중복돼 있는 것이다. 따라서 고객 주소가 변경될 때 한곳의 DB만 수정하면 다른 곳의 데이터도 같이 바뀌어야 하지만, 나중에는 어떤 데이터가 정확한지 모르게 되면서 데이터 품질이 떨어지게 된다. 이는 곧 고객 서비스 품질 저하로 직결되면서, 기업 간 경쟁에 치명적인 결정타가 될 수 있다. 그러다 보니, 데이터들 중에서 ‘마스터’ 라고 하는 데이터를 추려보자는 생각을 하기 시작하게 된다. 그래서 중앙에 마스터데이터 관리 시스템도 생겨나고, 개별 애플리케이션에 있는 마스터데이터들을 옮겨와서 이 시스템에서만 입력, 삭제, 수정이 이뤄지도록 하는 중앙집중식 관리를 하는 것이다. 기업 데이터 관리 적용 사례 최근 데이터 거버넌스, 데이터 컴플라이언스라는 제목으로 프로젝트가 생겨나고 있다. 오늘날 기업에서 데이터 관리를 어떻게 적용하고 있는지 살펴보면 아래와 같이 정리해 볼 수 있다.  1) 데이터 거버넌스 적용 사례 현재로는 명확히 ‘데이터 거버넌스(Data Governance)’라는 이름으로 프로젝트가 추진되는 사례는 많지 않으나 데이터 품질관리 관련 프로젝트의 성격을 구분할 때 이 범주에 해당되는 사례들이 늘고 있다. 데이터 거버넌스 성격의 데이터 품질관리를 적용한 사례는 데이터 표준화, 메타 데이터 관리, 데이터 품질 관리 및 애플리케이션 영향분석 분야를 기업 내부의 관리 프로세스와 긴밀하게 연계해 메타 포털 형태로 통합하고 있다. 이런 프로젝트의 경우에는 데이터 품질관리 컨설팅과 데이터 아키텍처 컨설팅을 선행하거나 병행해 추진하는 것을 볼 수 있다.  2) 데이터 컴플라이언스 적용 사례 미국의 SOX 법안의 영향으로 금융권을 중심으로 데이터 컴플라이언스를 준수해야 하는 문제가 데이터 품질관리 구축을 견인하고 있다. 국내에서도 BIS(바젤II)시스템 구축 시에 데이터품질 관리를 동시에 적용하는 사례가 늘고 있다. RDM(Risk Data Mart) 데이터의 원천을 구분해 관리하고 오류가 발생할 경우 오류 데이터의 근원을 추적할 수 있도록 하고 있다.  3) 차세대 부분 적용 사례 최근 국내의 경우 금융권을 중심으로 차세대 시스템 구축이 한창이다. 이러한 프로젝트에서는 데이터 품질관리가 필수적으로 필요한 것으로 인식되고 있다. 차세대 적용 분야는 현행(원천) 데이터 품질 분석, 이행 데이터에 대한 품질 검증 등에 품질관리를 적용해 차세대 시스템의 데이터 품질을 분석해 데이터 감리 자료로 제공한다. 그리고 데이터품질 관리는 데이터 품질 문제 발생 시 원인 규명에 결정적인 기여를 함으로써 프로젝트의 데이터 측면의 위험을 감소시키는 목적으로도 활용된다. 또한 차세대 중에 도출된 업무규칙이나 데이터 규칙을 오픈한 후에도 계속 활용해 자산화하려는 시도가 늘고 있다.  4) ERP/EDW 부분 적용 사례 ERP 구축 단계에 있는 기업에서 현행 데이터에 대한 품질 분석을 적용하는 사례가 늘고 있다. 이러한 경향은 ERP를 구축하면 데이터도 문제가 없을 것이라는 고객의 기대가 어긋나고 있음을 보여주는 사례이다. 기업에서 보유하고 있는 기존의 데이터가 정비되지 않고 ERP로 이관됐을 경우 오픈 후 상당한 혼란을 초래하는 경우를 자주 볼 수 있다. EDW의 경우에는 많은 기업들이 구축을 완료해 데이터 마트(Data Mart)와 리스크 마트(Risk Mart)를 운영하고 있다. 그러나 이 경우에도 여전히 데이터 품질 측면의 많은 문제점들을 드러내고 있다. 지금까지 대부분의 데이터 품질관리는 ERP, EDW, 차세대 등 기존 프로젝트에 데이터 품질관리 분야를 부가적으로 추가하는 모습이었으나 향후에는 데이터 아키텍처, 데이터 모델링, 데이터품질 관리, 데이터 거버넌스, 데이터 통합 등을 통해 보다 데이터 중심적인 프로젝트에 독립된 분야 혹은 다른 데이터 관리 분야와 결합해 추진될 가능성이 높다. 결과적으로는 기존의 CRM과 BI와 관련해 데이터 품질관리 프로젝트를 추진하는 전술적인 수준에서 벗어나 전사적이며 전략적인 수준에서 데이터 품질관리 프로젝트가 진행될 가능성이 크다. 데이터 품질 관리의 궁극적인 목적은 비즈니스를 위한 것이다. 기업 경영층의 의사결정 과정에 필요한 정보는 데이터의 정확성과 적시성에 기반을 두어 생성된다. 비즈니스 관점에서 데이터의 핵심품질요소(CTQ: Critical to Quality)와 데이터품질지수(DQI: Data Quality Index)를 선정해 전사적인 관점에서 잘 관리하고 있어야만 의사결정에 필요한 정보를 적시에 제공할 수가 있을 것이다. 따라서 IT부서만이 아니라 현업에서도 데이터를 어떤 목적으로 활용할 것인지 비즈니스 목표를 잘 이해하는 것이 데이터 품질관리를 위한 가장 중요한 선행 과제일 것이다. 데이터 관리의 시작점, ‘데이터 통합과 품질관리’ 데이터 통합과 데이터 품질관리에 관한 관심은 어제 오늘 시작된 것은 아니다. 또한, 데이터 통합의 프레임을 만들어 내고, 품질에 대한 이슈를 정의하는 등의 스타트 포인트는 ‘메타데이터 관리’나 ‘마스터데이터 관리’를 위해서도 빠뜨릴 수 없는 부분이 됐다. 마스터데이터 관리와 메타데이터 관리를 위해서는 데이터 통합과 데이터 품질관리도 동시에 고려할 수밖에 없는 요소이다. 말 그대로 데이터 통합은 마스터데이터 저장소로 대용량 데이터를 이관하고 데이터를 추출하고 적재하는 기능을 수행하는 것이고, 데이터품질 관리는 마스터데이터 관리 프로세스와 연계돼 전사차원의 고품질 데이터를 제공하는데 핵심적인 역할을 수행한다. 레거시 시스템에서 마스터데이터 관리 시스템으로 데이터를 이관할 때, 데이터 정제와 지속적인 품질 관리는 필수적이기 때문이다. SAS코리아 김동욱 부장은 “주목할 점은 기업이 데이터 통합을 한 차원 높은 전략적인 비즈니스 이슈로 인식하기 시작했다는 점이며, 많은 조직들이 데이터 통합 프로젝트를 지원하기 위해 전사적 아키텍처를 개발하고 도입하는 방향으로 나아가고 있다는 것이다”라고 밝혔다. 김 부장은 “또한, 통합적이고 일관된 뷰를 가진 전사적 싱글 버전 데이터를 통해 기업 가치를 제고할 수 있도록 데이터 통합 전 과정에 걸쳐 데이터품질 관리를 고려하고 있다. 데이터 품질은 앞으로 데이터 거버넌스(governance)의 일부로 전사 차원에서 관리돼야 할 것이다”고 강조했다. 그동안 데이터 통합, 데이터품질 관리는 개별적인 애플리케이션에 국한돼 수행됐으나 점차 전사 차원의 마스터 데이터 관리의 필요성을 인식해 복합적으로 수행되는 모습으로 나타나고 있다. 업계 한 관계자는 “모든 IT프로젝트 안에서 데이터 통합은 언제나 포함 된다”면서 “예를 들어 ERP 프로젝트를 하더라도 마이그레이션 때문에 데이터 통합에 대한 이슈가 반드시 발생한다”고 덧붙였다. 그는 “데이터 마이그레이션, 마스터데이터 관리, 데이터 싱크로나이재이션 등의 기능들이 데이터통합이 수반되는 프로젝트들이라 할 수 있다”고 말했다. 데이터 통합의 수요가 증가하는 이유는 시장의 경쟁이 치열해질수록 비즈니스의 핵심 주제는 바로 고객이 되고, 그 고객을 사로잡기 위해서는 바로 축적된 고품질의 고객 데이터가 필요하기 때문이다. 따라서 이런 기업 내부의 시스템에 존재하는 모든 데이터에 대한 체계적인 관리는 필수 사항으로 떠오르고 있으며, 바로 데이터 통합은 기업 전산 시스템에 존재하는 데이터를 전사적인 차원에서 효과적으로 관리하는 총체적인 활동이라고 할 수 있다. 데이터 통합은 데이터의 추출과 가공, 적재, 메타데이터 관리, 데이터 품질관리 등 데이터의 전 과정을 시스템적으로 관리하는 것이다. 물론 최근까지 구축된 DW, EDW의 경우도 현재 구성돼 있는 다양한 시스템에서 필요한 데이터를 받아서 사용자에게 필요한 정보로 가공하는 시스템이다. 하지만 한 업계 관계자는 “최근의 주요 프로젝트는 익일자 기준의 데이터 통합이 아니라, 실시간 비즈니스의 요구에 따라 정확한 데이터를 실시간으로 비즈니스에 활용할 수 있도록 하는 것”이라고 설명했다. 요즘 금융권에서는 리스크 관리 시스템에서도 서로 다른 분산된 데이터로부터 리포팅과 대쉬보드의 통합된 결과를 보여주는 필요성이 증가하고 있다. 또한 정부기관에서는 지방 자치단체와 중앙 정부와의 통합된 데이터 뷰를 통해서 정확한 통계치를 기반으로 정책을 세우고자 하는 등 각 인더스트리별로 데이터 통합의 필요성이 부각되는 추세다. 데이터품질 관리는 메타데이터 관리와 연계되는 경우가 많다. 메타데이터는 데이터에 대한 정보이고 데이터 품질은 실 데이터에 관련된 부분으로 생각하면 서로 관련이 없을 것으로 보일 수 있다. 실제로 메타데이터 관리만 진행하는 프로젝트가 있고 메타데이터는 설명하지 않으면서 데이터 품질관리를 하겠다는 프로젝트가 있다. 물론 기업에서 관리하는 모든 데이터에 대한 정보를 구축하기 위해 메타데이터 관리만 하는 프로젝트는 가능하지만 메타데이터 없이 데이터 품질 프로젝트는 존재할 수 없다. 데이터품질 관리를 위한 분석 단계부터 메타데이터에 대한 정보를 수집하기 시작해 메타데이터를 중심으로 데이터품질 관리를 수행하게 된다. 데이터 품질을 관리하기 위한 기본적인 관리의 시작이 바로 메타데이터 관리인 것이다. 우선 기업 내에서 존재하는 모든 데이터에 대한 정보를 하나의 리포지토리에 등록해 관리하게 되고 각각의 테이블 별, 컬럼별로 품질 관리에 필요한 정보를 툴을 통해 동일한 리포지토리에 저장하게 된다. 품질의 대상은 물론 데이터지만 품질관리와 데이터 간의 매개체 역할을 하는 것이 메타데이터인 것이다. 일반적인 메타데이터의 관리는 각 시스템에서 메타데이터를 수집하는 추출단계(Extract), 추출된 메타데이터를 통합하는 통합단계(Consolidation), 통합된 구조를 분석하는 분석단계(Analysis) 마지막으로 분석결과를 활용하는 활용단계(Business Consumption)로 관리된다. 이런 관리단계에서 IT 또는 비즈니스 적으로 어떤 상관관계가 있고 어떤 부분이 개선할 필요가 있는지를 인지하고 개선시키는 활동은 위에서 언급한 4가지 단계의 지속적인 노력이 필요하다.





데이터품질 관리 “현업 부서와 IT의 기대를 맞춘다”
데이터 품질은 종종 IT 이슈로 인식된다. 하지만 실제적으로 데이터 품질관리 프로젝트가 IT 부서에 의해 실행되고, 유지되지만 가장 많은 효과를 얻는 부서는 현업이다. 또한 현업부서는 각 애플리케이션에서 사용되고 있는 데이터의 용도와 의미를 가장 잘 이해하고 있다. 이러한 이유로 기업 내에 데이터 품질관리 역할을 이해하고, 기대를 충족시키기 위해 현업 및 IT부서의 동의를 얻어야 한다. 대부분의 모든 데이터 품질관리 프로젝트의 목표는 현업에서 보다 효율적인 방법으로 고객과의 상호작용을 돕고, 고객 보유율과 로열티를 높이기 위해 고객을 최대한 만족시키는데 있다. 미국의 커터 컨소시엄 리서치 기관에 따르면, 대부분의 많은 기업들이 데이터 품질관리 솔루션 구축을 실패하는 이유가 다양한 부서에서 사용하는 데이터 품질에 대한 책임을 서로 전가하기 때문이라고 한다. 따라서 데이터 품질관리 프로젝트 수행 시 부서별 인원을 동원하는 것이 이런 문제를 해결 할 수 있는 열쇠가 될 수 있다. IT 부서와 현업 부서 모두에게 프로젝트의 디자인과 수행에 대한 오너십을 갖도록 하는 것이 성공을 위한 중요한 요소이다. 미국 퍼스타(Firstar) 은행에서 CRM 프로젝트를 성공적으로 수행했던 데이터 웨어하우스 책임자였던 로레타 스미스(Loretta Smith) 부사장은 “우리는 중요한 비즈니스 이슈들을 모니터 하기 위해 파트너와 긴밀하게 협력했다. 우리는 우리가 지금까지 수행했던 업무들에 대해 미리 논의했다. 우리는 프로젝트에 대해 좋은 일이건 나쁜 일이건 항상 적극적으로 참여했다”고 말한다.
“크게 생각하고, 작게 시작하라” 메타데이터 관리의 목적은 전사적 관점의 데이터 표준화를 가속화하는데 있다. 궁극적인 목적은 전사의 데이터 품질관리를 제고하는 기틀을 마련하는 것이다. 연관 시스템 및 애플리케이션이 전사 표준을 준수함으로써 개발 기간의 단축, 데이터베이스 관리 및 성능의 최적화를 도모할 수 있을 뿐만 아니라 데이터의 흐름관리, 장애 및 보안관리, 영향도 분석(Impact Analysis) 등의 이점을 가질 수 있다. 기업 데이터 관리에 대한 전반적인 방향은 기술적인 부분도 중요하지만(솔루션 도입 등) 전체 정보의 품질과 비즈니스 활용 측면에서 고려돼야 하며 거버넌스와 기업의 데이터 전략이 적극적으로 반영돼야 한다. 기술적인 부분 외의 주요 성공 요소는 다음과 같이 말할 수 있다. ·경영층의 스폰서십 ·비즈니스 임팩트에 대한 정량적인 분석 ·조직간 의사소통 및 협업 ·변화관리 ·장기적인 로드맵 설정 무엇보다도 중요한 것은 기업 데이터에 대한 전사 차원의 장기적인 로드맵을 설정하고(Think Big) 단계별로 접근하는(Start Small) 전략을 견지해야 한다는 점이다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.