클라우드·오픈소스로 점차 확대되는 DBMS 시장 (1)
상태바
클라우드·오픈소스로 점차 확대되는 DBMS 시장 (1)
  • 윤현기 기자
  • 승인 2020.08.13 10:14
  • 댓글 0
이 기사를 공유합니다

3티어 아키텍처로 대응 힘든 워크로드 위한 오픈소스 DBMS 시장 성장

[데이터넷] 기업의 핵심 시스템 소프트웨어인 데이터베이스관리시스템(DBMS) 시장이 클라우드, 오픈소스를 만나 한층 확대되고 있다. 오랫동안 특정 벤더가 독식해오던 시장 구조가 이제는 클라우드형과 구축형, 상용제품과 오픈소스, 외산과 국산 등 다양한 경쟁 시장으로 탈바꿈하고 있는 추세다. 점차 경쟁이 가열되고 있는 국내 DBMS 시장 상황을 살펴봤다. <편집자>

DBMS는 운영체제(OS)와 더불어 기업 시스템의 핵심 소프트웨어로 분류된다. 핵심이라 함은 기업 운영이나 비즈니스에 반드시 필요한 요소라는 것을 의미한다. 실제로 DBMS는 기업이 보유한 중요 DB를 관리하고, 다른 애플리케이션들이 DB를 공유하면서 사용할 수 있는 환경을 제공해주는 매우 중요한 역할을 맡고 있다.

4차 산업 시대로 접어들면서 데이터는 이제 원유와도 비교되는 귀중한 기업 자산으로 손꼽히고 있다. 그러나 이 데이터가 과거와 달리 종류와 수가 너무 많아졌다. 이에 기업들은 폭증하는 데이터를 효율적으로 관리하고, 그 안에서 필요한 인사이트를 얻는 것을 어려워하고 있는 실정이다.

그렇다면 이 모든 데이터를 DBMS로 관리하면 될까? 최근 여기저기서 들리는 데이터 레이크(Data Lake)를 위해 DBMS가 필요한 것일까? 기계에서 발생하는 센서 데이터, 그리고 고객들의 온라인 행동 이력이 담긴 로그 데이터 등의 관리는 어떻게 해야 할까? 이 모든 질문에 대한 해답을 찾으려면 우선 데이터를 특성에 따라 구분하는 과정부터 밟아야 한다.

비즈니스 데이터 관리에 특화
무수히 많은 데이터들을 간단하게 두 부류로 나눠보자. 하나는 비즈니스 데이터로 사업을 수행함에 있어 없어서는 안 될 중요 데이터다. 예를 들면 금융사의 경우에는 금융거래 원장이, 유통기업일 경우에는 제품 판매 데이터가, 고객센터의 경우에는 콜(Call) 기록 등이 비즈니스 데이터에 해당된다. 이들은 각 기업이 비즈니스를 수행하는 과정에서 생성되는 데이터로, 단 하나라도 없어지거나 바뀌었을 경우 기업 비즈니스에 중대한 영향을 끼친다.

가령 고객이 은행 계좌에 들어있던 돈을 인출했는데 거래 원장에 해당 내역이 남아있지 않다면 은행은 해당 금액만큼 손실을 입게 된다. 또, 유통기업이 보유하고 있는 제품을 판매한 이력이 있는데 해당 제품을 보유하고 있을 경우 이전 거래에 잘못된 제품이 유통됐다고 생각할 수밖에 없다. 이는 다른 어느 분야에서도 마찬가지며, 결과적으로 기업의 평판도가 떨어지는 문제가 생긴다.

다른 하나는 빅데이터다. 빅데이터는 각각의 데이터가 중요하기보다 데이터들을 모아서 통계를 내거나 어떤 패턴을 찾기 위해 활용된다. 많은 데이트 중에서 뚜렷한 흐름을 찾기 위한 것에 목적이 있기에 센서 데이터나 로그 데이터 몇 개가 없어졌다 해서 치명적인 오류가 발생하지는 않는다.

이에 비즈니스 데이터는 언제나 정합성이 유지될 수 있어야 하며, 빅데이터는 많은 데이터들을 저장하고 분석에 활용할 수 있으면 된다.

정합성 유지를 위해 활용되는 것이 DBMS다. DBMS는 다수 사용자가 동일 데이터에 대해 어떤 행위(읽기/쓰기/지우기 등)를 하더라도 데이터의 정합성을 유지시켜준다. 뿐만 아니라 실수로 데이터가 삭제 혹은 소실됐다 하더라도 백업본이 있으면 완전한 복구를 보장해 기업 비즈니스가 중단되는 일이 없도록 한다. DBMS는 비즈니스 데이터의 정합성 유지와 복구 보장이라는 중대한 역할을 하기에 핵심 소프트웨어로 분류된다.

동시 실행 역량에 갈려
데이터 정합성을 유지시켜주고, 백업된 데이터 복구가 보장된다면 모든 DBMS는 같다고 볼 수 있을까? 앞서 언급했듯이 DBMS는 기업의 비즈니스 데이터를 관리하면서도 한편으로는 다른 애플리케이션들이 DB를 공유하면서 사용할 수 있는 환경을 제공하는 역할을 한다. 그렇기에 얼마나 많은 사용자가 DB에 동시에 접근해 활용할 수 있는지 또한 DBMS의 성능을 가르는 중요한 척도가 된다.

만약 두 명이 하나의 파일을 편집하고 저장한다 할 때 큰 문제가 되지 않는다. 그러나 파일 편집자가 5명, 10명, 20명으로 늘어나면 시스템에 큰 부하가 걸릴 수밖에 없다. 어떤 시스템에는 파일이 제대로 저장이 됐지만, 다른 시스템에는 저장 시간 차이와 그 사이에 발생한 편집 때문에 다르게 저장될 수도 있기 때문이다. 이처럼 동시 실행에 있어서 데이터의 정합성을 유지한다는 것은 상당히 어려운 일이다.

오라클(Oracle)이 오랫동안 DBMS 시장의 강자로 군림해왔던 이유가 여기에 있다. 10여 명 정도가 동시에 DB를 다루더라도 데이터의 정합성을 유지하는 것은 어느 DBMS나 할 수 있지만, 100여 명 이상이 페타바이트(PB)급의 DB를 다루면서 데이터 정합성을 유지하는 것은 결코 쉬운 일이 아니다.

장성우 한국오라클 전무는 “PB급 대용량 데이터의 정합성을 유지하는 것과 백업된 데이터를 손실 없이 빠르게 복구하는 것은 사실상 DBMS의 기본기이자 핵심이지만, 그동안 이를 제대로 수행하는 DBMS는 오라클을 제외하면 흔치 않은 것이 사실이다. 그로 인해 DBMS 시장에서 오랫동안 오라클이 강자로 자리매김하고 있는 것”이라고 설명했다.

마이에스큐엘, 포스트그레스큐엘, 마리아DB 등 오픈소스들이 RDBMS 시장 판도를 흔들기 시작했다.
MySQL, 포스트그레스큐엘, 마리아DB 등 오픈소스들이 RDBMS 시장 판도를 흔들기 시작했다.

오픈소스로 확대되는 DBMS
오라클의 강력한 시장 장악력은 현재에 이르러서도 여전히 ‘DBMS는 오라클’이라는 수식어가 통용되도록 하고 있다. 하지만 시간이 흘러 DBMS 시장이 점차 세분화되면서 오라클이 독식하던 체제가 변화를 보이고 있다.

그 이유는 크게 두 가지로 진단해볼 수 있다. 우선 기업들이 오라클과 같은 상용 DBMS를 오래 사용하면서 느끼는 비용 부담이 커졌다는 데 있다. 그렇다고 이를 대체할 수 있는 다른 솔루션을 찾아보더라도 이미 시스템 전체가 해당 제품에 종속(Lock-in)돼 있어 그 또한 쉽지 않았던 것이 사실이다.

또 다른 이유로는 모놀리식(Monolithic) 아키텍처에 대한 대응이다. 전통적인 IT 시스템 아키텍처는 과거 메인프레임 시절부터 3티어(Tier) 아키텍처로까지 변화했지만, 데이터 저장소는 여전히 단일 공간에 머물러 있는 상황이다.

반면, 고객이 선호하는 애플리케이션의 모습은 점점 달라지고 있다. 딱 정해진 것만 사용하지 않으며, 모바일을 비롯해 다양한 채널을 통해서 불특정한 최고점(Peak) 상태를 갖는 워크로드들도 많이 생겨나기 시작했다. 즉 고객들은 빠른 응답속도를 원하면서 요구사항도 다양해졌고, 고객들의 접근 채널 자체도 모바일과 사물인터넷(IoT) 등으로 변화하면서 기존 3티어 아키텍처로 대응하기에는 어렵다는 인식이 확산됐다. 좀 더 큰 틀에서 확장성에 대한 고민이 시작된 것이다.

이에 기업들은 전통적인 상용 DBMS 확장성의 한계가 분명하다고 보고, 새로운 대안을 찾기 시작했다. 바로 오픈소스다.

오픈소스·클라우드 DB 시장 성장
오픈소스는 이름에서부터 알 수 있듯이 무료로 이용 가능하다. 그러나 무료라고 해서 이를 기업이 잘 쓸 수 있다는 것은 아니다. 오픈소스를 사용하는 경우가 늘고 있지만, 이는 해당 기업이 오픈소스로 시스템을 구성하고 운영할 수 있는 역량이 될 경우에 가능한 시나리오다. 국내에서도 대기업은 인재풀을 확보해 오픈소스를 활용할 수 있지만, 중소기업은 그렇게 하기 어렵다.

고객 정보나 주문 정보 등 중요한 비즈니스 데이터만 DBMS에 저장할 때는 오픈소스가 적합하지 않다는 인식은 아직도 많은 이들의 뇌리에 자리 잡고 있을 정도다. 불과 몇 년 전만 하더라도 DBMS 시장은 오라클, 테라데이타(Teradata)와 같은 데이터 웨어하우스(DW) 어플라이언스가 주류를 이뤘으며, 이는 그만큼 DBMS의 성능과 안정성을 필요로 한다는 방증이기도 했다.

그러나 이제는 어플라이언스 형태에서 벗어나 소프트웨어로만 이뤄진 DBMS들이 출시되고 있으며, 오픈소스 역시 그러한 바람을 강화시키고 있다. 대표 주자는 하둡(Hadoop)이다. 비정형 데이터들을 수용해 분석하기 위한 방안으로 하둡 생태계가 떠올랐으며, 이에 HBase와 아파치 카산드라 등이 많은 주목을 받기도 했다.

이후 클라우드 시장이 성장하면서 오픈소스는 클라우드 생태계로도 합류했다. 이를 잘 받아들인 곳이 아마존웹서비스(AWS)다. AWS는 오픈소스 기반이면서도 엔터프라이즈급의 가용성과 성능을 원하는 고객에게 ‘아마존 오로라(Amazon Aurora)’를 비롯해 다양한 종류의 DB 서비스를 제공하고 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.