기업 정보 통합 기술

“기업 수익 창출 위해
개별적 데이터를 하나로 통합하라”

실시간 단일 액세스 포인트 제공 … 하나의 인터페이스로 다중 데이터 소스 처리

하나의 통합된 면모를 갖추는 일은 할 만한 일이다. 유럽 연합만 해도 그렇다. 일부 회원국들은 교회당의 쥐만큼이나 가난하지만 통합된 EU는 2003년 10조4천억달러의 미국 GDP보다도 더 많은 11조5천억달러의 GDP를 달성한 새로운 경제 세력으로 인식되고 있다. 기업의 데이터는 국가들의 집합과 상당히 유사하다. 다양한 장소(예를 들어 ERP와 CRM 시스템 등)에 저장된 사실과 수치들은 개별적으로 소중한 것들이지만 이들이 모이면 값으로 따질 수 없는 비즈니스의 중요한 그림을 제시해 준다. 아는 것이 힘이라면 이러한 큰 그림은 회사가 힘 있는 모습으로 보일 수 있게 만들어 준다. 그리고 바로 그 공로자는 데이터 소스의 도가니에 실시간으로 단일 액세스 포인트를 제공해 주는 기업정보통합(EII: Enterprise Information Integration) 기술이다.

IT가 단일 액세스 포인트를 통해 여러 개의 소스에서의 데이터 검색을 지원함으로써 회사의 수익에 공헌할 수 있는 황금같은 기회가 여기에 있다. 이러한 통합을 수행하는 데 필요한 기술은 예전에는 연합 데이터 액세스(fedrated data access)로 불리던 EII(Enterprise Information Integration), 즉 기업정보통합 기술로, 얼마 전부터 이기종 데이터 소스로의 버추얼 뷰를 제공해주고 있다.

실시간 통합에 초점
EII 플랫폼은 RDBMS와 같은 구조적인 소스에만 적용되는 것이 아니라 XML 파일, 웹 서비스, CSV 파일, 피플소프트나 SAP 및 시벨(Siebel) 등과 같은 기업용 애플리케이션, 그리고 엑셀 스프레드시트 등 비구조적 데이터로의 연합 액세스(federated access)도 수행할 수 있다. 이들은 또한 구조적인 데이터를 계층적인 XML 문서로 변환시킬 수 있으며, 어떤 것들은 심지어 데이터베이스 질의 결과를 HTML로 렌더링할 수도 있다.
그렇다면 왜 대신 데이터 웨어하우스를 사용하지 않는 것일까? 데이터 웨어하우스는 실제로 EII 제품과 유사하긴 하지만 매우 다른 역할을 수행한다. EII가 실시간으로 데이터와 작동하는 반면에 데이터 웨어하우스는 기록 및 분석 애플리케이션용으로 만들어졌다. 데이터 웨어하우스는 데이터 복제를 필요로 하며, 데이터 복제는 데이터가 기업 소스로부터 풀링되고 웨어하우스로 푸싱될 때 데이터의 복제, 청소 및 구분을 지원하는 일군의 애플리케이션과 프로세스를 필요로 한다. 이와 대조적으로 EII 제품은 로 데이터를 그 자리에 두고서 여기서 창을 연다.
하지만 그렇다고 웨어하우스를 없애버리라는 말은 아니다. 일부 EII 플랫폼들이 데이터를 복제할 수 있기는 하지만 이것은 원래 이들의 용도가 아니다. 그리고 EII 제품이 데이터 웨어하우스를 만들고 유지하는 데 필요한 많은 일들을 할 수 있긴 하지만 대형 웨어하우스를 대체하지는 못하는데, 그 이유는 EII는 실시간 통합에 초점을 두고 있으며 포괄적인 ETL(extract/transform/load) 기능은 없기 때문이다.
EII와 같은 폭으로 자주 언급되는 용어로 가상 데이터베이스(virtual database)가 있는데, 여기 함축된 의미는 주문, 고객 및 인벤토리와 같은 여러 소스의 데이터베이스 테이블들이 EII 플랫폼에 의해 표시되는 가상 데이터베이스를 통해 마술처럼 액세스가 가능해진다는 것이다. 보다 정확히 얘기하자면 가상 데이터베이스는 물리적 데이터베이스와 같은 컨테이너들로서, 테이블이나 뷰와 같은 데이터 구조물들을 그루핑하고, 애플리케이션과 개발자 액세스를 위한 인터페이스를 제공한다. 가상 데이터베이스는 분명히 멋진 개념이긴 하지만 이것이 EII의 전부는 아니다.

원하는 것을 줘라
EII 수용을 확산시키는 수많은 이점들이 있는데, 이들 중 일부는 비즈니스와 연관된 것들이고 나머지 것들은 IT에만 해당되는 것들이다.
언제나 비즈니스 사용자들은 고객과 다른 기업 데이터를 360도로 볼 수 있는 즉각적이고 지속적인 액세스를 원한다. 웹 기반의 부품제조회사이자 24/7 비즈니스 애플리케이션 랩인 NWC에서 우리는 부품 주문의 통합 뷰를 원하지만, 이를 얻기 위해서는 구조적인 데이터와 비구조적인 데이터 모두 세 가지 서로 다른 소스들로부터 데이터를 풀링해야 한다.
IT의 관점에서 보면, 비즈니스 사용자들에게 유비쿼터스의 실시간 데이터 액세스라는 강력한 생산성 향상을 주는 데 있어 가장 큰 장애물은 애플리케이션 개발, 클라이언트 접속 툴의 배치, 그리고 네트워크 트래픽의 증가다.
비즈니스의 필요에 따라 자체 구축 방안을 정당화할 수 있다고 가정해 보자. 포괄적인 데이터 액세스를 제공하기 위한 애플리케이션의 맞춤 개발이 불가능한 것은 아니지만(전세계에서 행해지고 있다) 자체 구축 방안은 비효율적이며 진행 중 관리 및 유지보수 비용이 만만치 않게 들어간다. EII 플랫폼은 데이터 소스로의 접속성을 제공하는 데 필요한 클라이언트 소프트웨어의 양을 줄여주며, 배치 비용을 낮추면서 동시에 유지보수를 한결 간편하게 해준다.
게다가 EII 도입을 통해 로컬 세그먼트에서의 네트워크 트래픽은 대폭 줄어들 수 있는데, 그 이유는 크기가 큰 데이터 세트는 클라이언트가 아니라 서버에서 요구되는 정보로만 걸러지기 때문이다. 예를 들어 EII가 없을 경우 오라클 RDBMS와 마이크로소프트 SQL 서버에서 데이터를 함께 가져온다는 목표를 달성하기 위해서는 두 데이터베이스 모두에서 데이터를 검색하고 네트워크를 통해 결과를 풀링한 다음 이들을 클라이언트에서 합쳐야 한다. 그리고 그 결과는 하나의 스트림으로 데스크톱에 전달되는 게 아니라 10개나 20개 블록으로 보내질 것이다. 따라서 적절한 데이터가 적절한 장소로 하게 하는 데는 많은 네트워크 트래픽이 필요하다.
적절한 EII 플랫폼이 있을 경우 이러한 정보 통합은 서버에서 이루어지며, 관련 있는 데이터만 네트워크를 통과해 클라이언트 데스크톱으로 전달될 것이다. 전체 데이터 스트림은 데이터 소스가 있는 서버에서 EII 플랫폼으로 여전히 이동하긴 하겠지만, 보통 파이프가 더 두터운 데이터 센터가 트래픽 흐름을 보다 쉽게 처리하기 마련이다.
여기서 적절한 EII 플랫폼이란 말에 유의해야 한다. 이것은 중요하다. 현재 EII 방안은 두 가지가 있지만, 그 중 하나만이 핵심 사양 세트내에서 이러한 비용 기반의 최적화를 제공하기 때문이다. 자동 최적화 기능이 없는 제품들은 보통 XML 중심적이며, 백엔드 소스로부터의 검색 최적화보다는 프리젠테이션에 보다 관심을 두고 있다. 때문에 XML 중심의 EII 플랫폼은 XML을 최우선 인터페이스로 표준화시킨 조직에는 완벽하게 맞겠지만, 대역폭과 레거시 접속이 문제가 되는 조직용으로는 적합지가 못하다.

통합 메커니즘 제공
위스콘신 주 그린베이에 있는 NWC 랩에서 7가지 EII 플랫폼을 테스트한 결과, 서로 다른 데이터 소스의 집합과 프리젠테이션이 실제로 지원되고 있었으며, 단 그 여정에는 좌절과 불행이 함께 할 수 있다는 사실을 알게 됐다.
테스트한 제품들의 미덕은 이렇게 본질적으로 서로 다른 데이터 풀이 관계형 데이터 세트에만 한정되지 않는다는 점이다. 기업 등급의 EII 스위트는 XML과 같은 계층적 데이터와, 데이터베이스 시스템에 저장돼 있으면서 직접적인 액세스를 위한 깊은 스키마 지식을 필요로 하는 기업 등급의 애플리케이션 데이터로의 액세스를 제공한다. 따라서 이것은 항상 업체측에서 제공하는 API를 통해 액세스가 된다. 보다 고급 EII 제품들은 메시지 대기열 연합(IBM MQ TIBCO RV) 뿐만 아니라, FTP나 SMB와 같은 비 웹 프로토콜을 통해 액세스되는 데이터 소스들을 제공한다.
일단 데이터가 연합이 되면 EII 플랫폼은 개발자와 써드파티 애플리케이션을 위한 액세스 메커니즘을 제공해야 한다. 액세스 모드에는 ODBC/JDBC뿐만 아니라 HTTP 및 SOAP를 통한 XML까지 포함이 된다. 이러한 특정 EII 기능은 제품간에 큰 차이가 있으며, 제품을 선택할 때 우선적으로 고려해야 할 요소이기도 하다. EII 이행은 XML 세계를 완전히 포괄해가는 하나의 전략적 경로를 만들어가는 데 도움이 될 수는 있지만, 많은 애플리케이션들이 ODBS나 JDBC 접속을 필요로 하고 있다. 이런 제품들에 대해 장기적인 지원이 요구된다면 XML 중심 EII 제품들의 경로를 조심스럽게 모색해 보라.

부차적이긴 하지만 점차 널리 쓰이고 있는 EII의 용도는 클라이언트가 아닌 서버에서 데이터를 변환할 수 있는 메커니즘을 제공하기 위해서다. 데이터가 변형되는 가장 일반적인 형태는 XML이다. 하지만 EII 제품들은 관계형 데이터를 그냥 간단히 XML로 변환시키는 것외에 훨씬 더 많은 일들을 할 수 있다. 즉 많은 제품들이 역 작업도 할 수 있어서 계층적인 데이터 소스를 보고 툴과 맞춤 개발 애플리케이션에 통합시키는 메커니즘을 제공하고 있다.

지원 비용도 절감
비용 기반의 질의 최적화(Cost Based Query Optimization)는 관계 대수의 못생긴 사촌이다. 이 난해한 기술은 가장 똑똑한 데이터베이스 관리자나 되어야 이해를 할 수 있을 정도다. 일부 EII 플랫폼들은 초보적인 데이터베이스 관리 기능성을 제공해서 데이터베이스 관리자들이 하는 일을 무엇이든 데이터베이스 전문가들이 할 수 있게 해줄 것이다.
캐싱이 EII 제품에서 가장 개발이 덜 된 사양임을 알 수 있긴 했지만, 대부분의 EII 스위트에 있는 제한적인 캐싱 기능들이라 하더라도 성능 향상을 가져다 줄 것이다. 이것은 매일, 혹은 매 시간 대형 데이터 세트에서 대용량의 질의를 수행하는 비즈니스 인텔리전스 및 분석 제품들에게는 확실한 이점이 된다.
비즈니스적인 관점에서 보면 EII는 애플리케이션 개발자들이 비즈니스 사용자의 생산성을 향상시킬 수 있는 중요한 복합 애플리케이션을 만들 수 있게 해준다. EII는 또한 엑셀 파워 유저가 하나의 인터페이스를 이용해 몇 가지 데이터 소스로 액세스할 수 있게 해주며, 이는 지원 비용을 줄여줄 것이다.

제어의 집중화
EII의 부수적인 이점은 규정 준수와 데이터 보안에 있어서의 역할이다. 예를 들어 SOX(Sarbanes-Oxley)는 특정 상황의 조직 내에서 데이터 액세스에 매력적인(정책 이행을 책임지는 사람이 아니라면) 영향력을 갖고 있다.
우리가 얘기해 본 한 포춘紙 500대 회사는 SOX를 따르기 위해 일부 조직에서 데이터베이스 액세스에 가해야 할 변화의 규모를 언급한 바 있다. 특정 데이터베이스에 저장된 재정 데이터 때문에 정밀하게 제어되는 액세스와, 저장된 데이터로의 적절한 로깅 변화(보다 중요한 것)가 우선이 돼야 한다. 이러한 회사 내부 데이터베이스로의 액세스는 엄격히 제한이 되며, 하드코딩된 사용자 이름/패스워드로 인해 수백 개의 애플리케이션이 변경돼야 할 것이다. 또한 감사자들은 누가 언제 어떤 데이터를 바꿨는지를 파악할 수 있어야 하며, 이는 곧 보다 상세한 로그가 필요하다는 의미다. 이런 변경을 이행하는 데 소요되는 노동 시간은 어마어마하다.
IEE는 전략적으로나 전술적으로나 그러한 준수 문제에 대한 해결책으로 본질적으로 적합하다. EII는 보통 게이트웨이 시나리오에서 배치되기 때문에 중세 조각상처럼 사용자와 데이터 사이에 서서 데이터 센터 왕국에 있는 여러 지하 창고에 숨겨진 보물들을 보호해준다.
일부 EII 제품들은 기본적인 로깅 및 액세스 제어 외에도 행 혹은 열 레벨의 보안 등과 같이 RDBMS 업체가 직접적으로 지원하지 않는 보안 메커니즘들도 추가할 수 있다.

표준화의 이점
단일 프로그램 인터페이스를 통한 다중 데이터 소스를 제시한다는 것은 매력적인 개념이며, 이는 웹 서비스(SOAP)와 SOA(Service-Oriented Architecture) 모델의 폭발적 성장으로 입증되고 있다. EII 플랫폼은 SOAP, XML over HTTP, HTML, JDBC 및 ODBC 등과 같은 다양한 언어와 프로토콜들을 이용해 이런 메커니즘을 제공한다. 이런 연합 데이터 소스로의 액세스 방안은 무수히 많긴 하지만, 단일 인터페이스로 표준화하는 이점으로는 교육, 유지보수 및 배치 등에서의 비용 절감뿐만 아니라 보다 빠른 타임 투 마켓과 접속 문제 장애관리 소요시간이 줄어든다는 점 등도 꼽을 수 있다.
잠깐 계산을 해보면, 연봉 4만3천달러의 기술 지원 근로자가 네 가지 서로 다른 ODBC 드라이버를 하나의 데스크톱 배포판에 설치, 테스트 및 인증하는 데 20시간이 걸리고 네 개의 기업 데스크톱 이미지가 있다면, 개발자와 엔드유저, 혹은 이들이 활용하는 애플리케이션들이 그 데이터베이스들로의 액세스를 갖도록 환경을 셋업하는 데만 1천600달러 비용의 80시간이 필요하다는 결론이 나온다.
EII 스위트를 이행하면 이 시나리오는 하나의 ODBC 접속이 다섯 시간으로, 네 개 데스크톱은 20시간으로 총 400달러 비용으로 바뀌며, 이는 배치 비용만 75%가 절감된다는 얘기다. 물론 그래도 많은 돈은 아니지만 유지보수와 장애관리에까지 이러한 비용 절감을 연장시켜 계산해 보면 액수는 수직으로 상승한다. 뿐만 아니라 드라이버에 대한 클라이언트 비용도 염두에 둬야 하는데, 이는 특히 EAI와 비즈니스 인텔리전스 영역에 있는 소프트웨어의 경우 더욱 그러하다. 이런 종류의 제품들은 보통 어댑터당 가격이 매겨지는데, 이는 곧 세 개의 시스템으로 액세스가 필요한 비즈니스 인텔리전스 제품이 하나의 데이터 소스만으로 액세스가 필요한 것보다 거의 확실하게 비용이 더 든다는 것을 의미한다.

시장 반응 상승 중
중요한 것은 EII의 이행이 결코 쉽게 할 수 있는 일이 아니라는 점이다. 우선 너 자신을 알아야 한다. 즉 보다 정확히 말해 기업의 정보가 조직 전체에 얼마나 많은 곳에 저장돼 있는지를 알아야 한다. 기업의 전체 데이터 소스를 범주화함으로써 EII 시스템이 이들의 존재를 인식하도록 구성할 수 없을 경우 제품은 큰 도움이 되지 못한다.
나아가 테스트에서 나타난 바와 같이 제품의 성능이 문제가 될 수 있기 때문에 대량 사용자를 위해서는 클러스터드 환경이 필요할 것이다. 그리고 높은 성능의 EII 제품들은 가격이 만만치가 않다. 우리 리뷰 우승자는 순수한 테스트 환경용이 14만달러였으며, 숨겨진 비용과 애드온들 때문에 숨이 막힐 수도 있다. 따라서 가격이 떨어지기 전까지는 EII 툴은 아주 부유한 조직을 제외한 거의 대부분의 조직에서는 순수하게 전략적인 솔루션으로 고려될 것이다.
가격은 거의 동일하게 어댑터당/CPU당 모델로 책정이 되기 때문에 EII를 전술적 솔루션으로 사용하면 시간이 경과함에 따라 기대할 수 있는 절감 효과 이상으로 비용이 올라갈 수 있다. 가트너리서치는 2008년까지 이기종 데이터 연합의 90% 이상이 적은 트랜잭션 양과 제한된 수의 데이터 소스가 있는 복합 애플리케이션용이 될 것으로 전망하고 있다.
하지만 우리는 전반적인 비용 절감 효과와 배치의 복잡성을 줄여준다는 점에서 EII 애플리케이션이 데이터 센터에서 환영을 받으리라 믿고 있으며, 내년에는 이 제품 부문을 보다 면밀하게 주시할 작정이다.

Executive Summary

기업 정보 통합

대부분의 기업들은 주문 정보를 한 시스템에, 고객 데이터를 다른 시스템에, 그리고 인벤토리 통계는 또 다른 시스템에 보관하고 있다. 사용자들에게 이 모든 데이터의 뷰를 하나로 제공하려면 세 가지 소스를 모두 연결해서 데이터를 함께 접목시켜주는 시스템이 필요하다.
이러한 시스템을 바로 EII(Enteprise Information Integration), 즉 기업정보통합이라고 부르며, 이들의 약속은 매우 매력적이다. 우선 단점부터 보자면 복잡성과 비용이 예상된다. 하지만 현재 데이터 연합 작업에 소모되는 자원을 고려해 볼 때(메타그룹에서는 IT 조직에서 자그만치 예산의 60%를 애플리케이션 통합에 쏟고 있다고 추산했다), 투자 가치는 충분하다는 생각이다.
본지에서는 신콤시스템즈(Cincom Systems), 컴포지트소프트웨어(Composite Software), IBM, 아이피두(Ipedo), 메타매트릭스(MetaMatrix), 스냅브리지소프트웨어(Snapbridge Software) 및 엑서웨어(XAware) 등 업체들에게 NWC 비즈니스 애플리케이션 랩에 있는 서로 다른 데이터 소스들로의 액세스를 표준화해줄 것을 요청했다. 데이터 흐름이 원활하게 되는 데는 얼마간의 시간이 필요했지만, 일단 그렇게 하고 나자 컴포지트의 CIS가 결승선을 가장 먼저 끊었다. 아이비엠의 DB2 인포메이션 인티그레이터 8.1이 바로 그 뒤를 이었으며, 메타매트릭스는 3위를 차지했다.