[2020 결산/DBMS] 오픈소스 기반 ‘DBMS’ 성장 가속

값비싼 비용·신규 아키텍처 지원 부족 등으로 RDBMS 영향력 점차 줄어

[데이터넷] 오랫동안 굳건하게 DBMS 시장을 장악해 온 오라클의 아성이 조금씩 흔들리고 있다. 여전히 ‘DBMS는 오라클’이라는 수식어가 통용되고 있지만, 점차 오픈소스 기반의 DBMS 사용률이 늘어나고 있기 때문이다.

그 이유로는 기업들이 오라클과 같은 상용 DBMS를 오래 사용하면서 느끼는 비용 부담이 커졌다는 데 있다. 대체할 수 있는 다른 솔루션을 찾아보더라도 이미 시스템 전체가 해당 제품에 종속돼 있어 그 또한 쉽지 않았던 것이 사실이다.

또 다른 이유로는 모놀리식(Monolithic) 아키텍처에 대한 대응이다. 전통적인 IT 시스템 아키텍처는 과거 메인프레임 시절부터 3티어(Tier) 아키텍처로까지 변화했지만, 데이터 저장소는 여전히 단일 공간에 머물러 있는 상황이다.

반면, 고객이 선호하는 애플리케이션의 모습은 점점 달라지고 있다. 딱 정해진 것만 사용하지 않으며, 모바일을 비롯해 다양한 채널을 통해서 불특정한 최고점(Peak) 상태를 갖는 워크로드들도 많이 생겨나기 시작했다. 즉 고객들은 빠른 응답속도를 원하면서 요구사항도 다양해졌고, 고객들의 접근 채널 자체도 모바일과 사물인터넷(IoT) 등으로 변화하면서 기존 3티어 아키텍처로 대응하기에는 어렵다는 인식이 확산됐다. 좀 더 큰 틀에서 확장성에 대한 고민이 시작된 것이다.

이에 기업들은 전통적인 상용 DBMS 확장성의 한계가 분명하다고 보고, 새로운 대안을 찾기 시작했다. 바로 오픈소스다.

오픈소스 DBMS 성장
오픈소스는 소스가 공개돼 있어 누구나 이용 가능하다. 그렇다고 해서 이를 기업이 잘 쓸 수 있다는 것은 아니다. 오픈소스를 사용하는 경우가 늘고 있지만, 이는 해당 기업이 오픈소스로 시스템을 구성하고 운영할 수 있는 역량이 될 경우에 가능한 시나리오다. 국내에서도 대기업은 인재 풀을 확보해 오픈소스를 활용할 수 있지만, 중소기업은 그렇게 하기 어렵다.

고객 정보나 주문 정보 등 중요한 비즈니스 데이터만 DBMS에 저장할 때 오픈소스가 적합하지 않다는 인식은 아직도 많은 이들의 뇌리에 자리 잡고 있을 정도다. 불과 몇 년 전만 하더라도 DBMS 시장은 오라클, 테라데이타(Teradata)와 같은 데이터 웨어하우스(DW) 어플라이언스가 주류를 이뤘으며, 이는 그만큼 DBMS의 성능과 안정성을 필요로 한다는 방증이기도 했다.

그러나 이제는 어플라이언스 형태에서 벗어나 소프트웨어로만 이뤄진 DBMS들이 출시되고 있으며, 오픈소스 역시 그러한 바람을 강화시키고 있다. 대표 주자는 하둡(Hadoop)이다. 비정형 데이터들을 수용해 분석하기 위한 방안으로 하둡 생태계가 떠올랐으며, 이에 HBase와 아파치 카산드라 등이 많은 주목을 받기도 했다.

이후 클라우드 시장이 성장하면서 오픈소스는 클라우드 생태계로도 합류했다. 이를 잘 받아들인 곳이 아마존웹서비스(AWS)다. AWS는 오픈소스 기반이면서도 엔터프라이즈급의 가용성과 성능을 원하는 고객에게 ‘아마존 오로라(Amazon Aurora)’를 비롯해 다양한 종류의 DB 서비스를 제공하고 있다.

오픈소스 선전 확산
오라클을 필두로 상용 DBMS가 주력이던 국내 시장에도 오픈소스 바람이 강하게 불고 있다. 해외 기업들이 오픈소스 DBMS를 사용하는 사례가 널리 알려졌을 뿐만 아니라 국내에서도 커뮤니티 버전을 활용해본 기업들이 전사 오픈소스 확대 적용을 검토하고 있기 때문이다.

오픈소스 DBMS 마리아DB(MariaDB)도 이러한 추세를 좇아 국내 시장 확대에 나섰다. 고객이 처한 어떠한 환경에서도 다양한 DB 워크로드를 사용할 수 있도록 지원하는 것에 초점을 맞추고 있는 마리아DB는 단일한 바이너리를 통해 전통적인 트랜잭션 워크로드(OLTP)와 분석 워크로드(OLAP)를 함께 처리할 수 있다는 점을 강조한다.

또한 대규모 엔터프라이즈에서 PB급 데이터를 활용하도 완벽한 대응이 가능하다는 점도 내세운다. 이는 자유로운 스케일 업/아웃이 가능한 플랫폼 아키텍처로 인해 원하는 만큼 확장이 가능하기 때문으로, 최근 인수한 클러스트릭스DB의 역량이 가미된 부분이기도 하다.

이미 삼성, LG, SK, 포스코 등 대기업에서도 마리아DB를 사용 중인 만큼 1차적으로 검증은 마쳤으며, 오라클DB 등 상용 DB에서 오픈소스로 전환하려는 수요를 흡수한다는 방침이다.

올해에는 클라우드 서비스형 데이터베이스(DBaaS) 제품인 마리아DB 스카이SQL(SkySQL)을 출시, 늘어나는 클라우드 수요에도 대응한다. 스카이SQL은 통합 트랜잭션, 분석, 하이브리드 데이터베이스 업무를 위한 클라우드 기반 고가용성 서비스로, 세계 최고 수준의 DB 개발 및 운영자들의 전문 지식과 경험으로 고객들에게 안정적이고 맞춤화된 서비스를 제공한다.

멀티 클라우드 클러스터 지원
그동안 DBMS는 RDBMS가 주류였으나, 대규모의 데이터를 유연하게 처리할 수 있는 강점을 가진 비관계형(non-relational) DBMS NoSQL도 차츰 부상하기 시작했다.

기본적으로 업무를 분석하고 설계할 때 모델링을 필요로 하며, RDBMS는 2차원 테이블을 연계해 질의(Query)를 던져 원하는 결과를 뽑아내는 형태다. 그러나 NoSQL은 테이블, 컬럼과 같은 스키마 없이 분산 환경에서 단순 검색 및 추가 작업을 위한 키 값을 최적화하고, 질의 대신 API를 통해 원하는 결과를 얻을 수 있다.

NoSQL의 대표적인 제품이 몽고DB(MongoDB)다. 몽고DB는 국내에서 사용자 지원을 확대하며 국내 시장 영향력을 높여나가고 있다.

최근 몽고DB는 ‘몽고DB 4.4’와 ‘아틀라스(Atlas)’의 기능 업데이트를 진행했다. 주요 내용으로는 ▲집계(Aggregation) 향상 ▲리파인어블 샤드 키(Refinable shard keys) ▲헤지드 리드(Hedged reads) ▲미러링 리드(Mirrored reads) 등이다.

몽고DB 아틀라스가 멀티 클라우드 클러스터를 지원함에 따라 분산된 몽고DB 데이터베이스를 AWS, 구글 클라우드, 마이크로소프트 애저에 동시에 배치할 수 있게 됐다. 몽고DB의 고객은 클라우드 간에 데이터 복제 및 마이그레이션을 관리하기 위한 운영 복잡성 없이 여러 클라우드 제공업체에 걸쳐 애플리케이션을 구축할 수 있다. 현재 몽고DB 아틀라스는 AWS, 마이크로소프트 애저, 구글 클라우드의 전 세계 79개 리전에서 이용 가능하며, 전 세계 1만8800명의 고객이 사용하고 있다.

마이크로서비스 위한 현대적인 환경 제공
AWS는 인프라(IaaS)를 넘어 다양한 플랫폼(PaaS)과 서비스(SaaS)도 제공하면서 클라우드 체제를 더욱 공고히 하고 있다. 이는 DB라고 예외가 될 수 없다. 기본적으로 서비스가 되려면 그것을 기반으로 하는 DB가 반드시 필요하기 때문이다.

AWS는 아마존 오로라를 비롯해 MySQL, PostgreSQL, 마리아DB, MS SQL 서버, 오라클 등 6종의 관계형 데이터베이스 서비스(RDS)뿐만 아니라 다이나모DB(DynamoDB), 도큐먼트DB(DocumentDB), 엘라스틱캐시(ElastiCache), 넵튠(Neptune), 타임스트림(Timestream), QLDB, 매니지드 카산드라(Managed Cassandra) 등 다양한 DB 서비스도 제공하고 있다.

이를 토대로 AWS는 국내 대기업부터 스타트업에 이르기까지 많은 고객들을 유치하고 있으며, 대표적인 사례가 롯데다. 롯데는 개별적으로 운영하던 6개의 온라인 서비스를 ‘롯데 온’으로 통합해 고객에게 높은 가치의 상품과 서비스를 빠르게 제공하고자 했다.

롯데는 많은 상품 서비스가 제공되고, 데이터양이 증가하게 되자 MSA 개발 방법론과 NoSQL 도입을 검토했고, 대용량 트래픽을 수용하면서 빠르고 일관된 응답속도를 필요로 하는 대고객 서비스는 1티어로, 다양한 목적의 쿼리와 평균적인 응답속도를 필요로 하는 내부 서비스 및 배치는 2티어로 나눴다. 이처럼 각 기능에 맞는 데이터 서비스를 제공하기 위해 적합한 데이터 저장소를 고른 끝에 1티어에는 다이나모DB를, 2티어에는 오로라를 선택했다.

이를 토대로 롯데는 데이터 기반 업무를 혁신하고, 상품 경쟁력을 강화하는 한편, 라이프 온·오프라인 통합 시너지 창출도 낼 수 있었다는 후문이다.

국산 오픈소스 DBMS 선전 확대
최근 정부 및 공공부문의 클라우드 전환 움직임이 빨라지면서 외산 DBMS 대신 국산 및 오픈소스 DBMS를 도입하려는 수요가 늘어나고 있다. 이에 오픈소스 DBMS 기업 큐브리드는 공공부문 레퍼런스 확대에 박차를 가하고 있다.

큐브리드는 국가정보자원관리원, 국방부 통합 데이터센터 등 굵직한 고객사를 보유하고 있을뿐더러, 최근에는 한국교육학술정보원(KERIS)이 코로나19로 인해 시행된 온라인 학습 서비스까지 지원함으로써 그 성능과 안정성을 인정받은 상태다. 네이버클라우드, NHN, KT, 가비아 등 주요 클라우드 서비스 제공업체(CSP)들과도 긴밀한 협력 체계를 마련함으로써 공공 클라우드 지원을 위한 준비도 끝마쳤다.

이런 여세를 몰아 큐브리드는 시장을 더욱 확대하고자 독립 소프트웨어 벤더(ISV) 파트너 비즈니스 강화를 추진하고 있다. ISV는 연간 단위 정액제 서비스를 통해 애플리케이션 개발/포팅에 필요한 DB 설계 및 스키마 리뷰, 질의 리뷰, 성능 튜닝, 데이터 마이그레이션과 같은 개발지원 서비스를 제공받으며, 최종 사용자 판매 이후에는 ISV가 직접 1차 지원을 제공하고, 큐브리드는 2차 유지관리 서비스를 제공하는 형식을 유지해 에코시스템을 더욱 확대한다는 방침이다.

통합 데이터 플랫폼 전문 기업 인젠트도 DBMS 시장에 뛰어들었다. 인젠트는 오픈소스에 관심이 있어도 기존 시스템 전환의 어려움 및 기술지원 부재로 인해 오픈소스를 선택하지 못하는 기업들을 지원하고자 ‘엑스퍼DB’를 시장에 공급하고 있다.

엑스퍼DB는 이미 해외에서 엔터프라이즈용으로 이용되는 오픈소스 DBMS인 PostgreSQL을 기반으로 DBMS 구축 및 운영에 필요한 솔루션과 서비스, 기술지원까지 하나로 엮은 단일한 플랫폼이라는 것이 강점이다. 현재 퍼블릭 클라우드 환경에서 오토 스케일링 기능이 제공되며, 연내 프라이빗 클라우드 환경에서도 오토 스케일링 기능을 지원하는 것을 목표로 연구개발에 매진하고 있다.

엑스퍼DB는 시장에 출시된 지 얼마 되지 않았지만, 이미 대형 고객을 확보하며 그 영향력을 빠르게 넓혀나가고 있다. 이커머스 유통기업 SSG닷컴이 사용하던 외산 DBMS를 걷어내고, 온프레미스 환경과 퍼블릭 클라우드 환경을 동시에 이용할 수 있는 ‘하이브리드 클라우드’ 환경을 구축한 것이 대표적인 사례다.

글로벌 시장 점유율 확대 도모
외산 DBMS의 대안으로 많은 주목을 받았던 티맥스데이터의 ‘티베로(Tibero)’도 클라우드와 오픈소스 시장 확대에 따라 또 한 번 진화를 거듭하고 있다. 티베로는 무중단 DB 운영을 위한 필수 기술인 액티브 클러스터 기능(TAC)을 퍼블릭 클라우드 환경에서 제공하기 위해 다양한 CSP들과 서비스를 준비하고 있다. 클라우드 환경에서 TAC 기능이 제공될 경우, 기존 오라클 RAC를 사용하던 수많은 고객 시스템을 클라우드 환경으로 손쉽게 전환할 수 있을 것으로 내다보고 있다.

국내에 위치한 연구 인력도 강점이다. 티맥스의 전문 연구 인력 및 기술지원 조직은 필요한 기능 개발 및 이슈 처리를 소스단에서 직접 지원하며, 오픈소스 DBMS 및 글로벌 기업 대비 체계적이고 신속한 기술지원 서비스를 제공하기 때문이라는 설명이다.

티베로는 이미 KT, 네이버클라우드, AWS, MS 애저(Azure) 등의 CSP에 상품으로 등록돼 판매 중이며, 최근에는 KERIS e-학습터, 캐롯손해보험 기간계, K-Car 캐피탈 기간계 등에 적용된 티베로는 클라우드 환경 위에 성공적으로 구축됐다.

특히 현대기아차 사례는 10여 년간 축적해온 꾸준한 제품 개발 및 고품질의 유지보수 서비스가 이룬 성과이기에 의미가 깊다는 것이 회사 측의 설명이다. 티맥스는 지난 2009년 처음 현대기아차에 티베로를 공급하기 시작했으며, 수년간의 성능 검증을 거쳐 2013년 현대기아차의 표준 DBMS 제품으로 등재됐다. 첫 도입 이후 10년 만에 2019년 주요 업무의 메인 DBMS로 선정돼 0~1등급 핵심 업무의 표준 IT 시스템으로 도입되는 성과를 거뒀다.

IIoT 위한 최적 데이터 플랫폼
RDBMS는 비즈니스 데이터를 저장하고 관리하기 위한 방안으로 적합하지만, 빅데이터를 관리하는 데 비용적인 측면으로나 효율성 측면에서도 적합하지 않다.

그러나 갈수록 센서 데이터를 비롯한 IoT 데이터가 스마트팩토리 운영에 필요한 인사이트를 제공하는 것으로 여겨지면서 이들을 효과적으로 수집하고 처리할 수 있는 방안들이 필요하게 됐다. 초기에는 하둡을 이용하는 방안들이 고안됐지만, 하둡은 비정형 텍스트 데이터를 배치로 처리하고, 거기에서 나온 결과물을 빨리 활용하는 것에 목적이 있었기 때문에 작지만 폭발적으로 유입되는 데이터를 저장하고 처리하는 것에는 적합하지 않았다. 그 결과 고안된 것이 시계열 DBMS다.

마크베이스가 제공하는 시계열 DBMS ‘마크베이스’는 일정 시간을 주기로 생성되는 시계열 데이터 처리를 위한 특수 목적용 DBMS로, 글로벌 트렌드로 자리 잡은 스마트 공장, 스마트시티, 스마트그리드 등 ‘스마트 X’ 분야의 핵심 기술로 주목받고 있다.

마크베이스는 센서 데이터 처리 성능 측면에서 세계 최정상에 올라있다. 2019년 11월 글로벌 공인 인증기관인 TPC에서 실시한 TPCx-IoT 분야 테스트에서 글로벌 기업들을 제치고 1위에 오르며 국제 표준으로 등재된 바 있다. 또, 최근 AMD와 함께 진행한 2차례 테스트를 통해 자사의 종전 기록을 연달아 갱신함으로써 기술 우위를 재확인하기도 했다.

마크베이스의 가장 큰 특징은 IoT 센서 데이터를 고속으로 처리하는 것으로, 일반 서버급 환경에서도 초당 수백만 건의 데이터를 저장과 동시에 분석할 수 있다는 점이다. 이러한 성능 덕에 스마트제조, 스마트시티, 스마트물류, 기상예측, 에너지/전력 관리, 빌딩관리, 환경관리, 수자원관리 등 IoT 분야의 효과적 관리 및 분석, 예측을 위한 모든 분야에서 선전이 이어지고 있다.

윤현기 기자 다른기사 보기