빅데이터 분석 수요 감당할 대용량 스토리지 ‘각광’
상태바
빅데이터 분석 수요 감당할 대용량 스토리지 ‘각광’
  • 윤현기 기자
  • 승인 2018.01.13 08:31
  • 댓글 0
이 기사를 공유합니다

대량 데이터 수집·빠른 분석 환경 지원 솔루션으로 시장 공략…손쉽게 확장 가능

2018년 이후 가장 수요가 높을 것으로 예측되는 기술로는 인공지능(AI), 디지털 보안, 사물인터넷(IoT) 등이 꼽힌다. 특히 인공지능은 디지털 보안과 사물인터넷과 관련한 문제 해결에 핵심적인 역할을 수행할 전망으로 다양한 분야에 접목되면서 인공지능에 대한 투자가 빠르게 늘고 있다. 뿐만 아니라 소프트웨어 정의, 클라우드, 5G 등 IT 인프라의 정의를 새롭게 써내려가고 있는 상황으로 2018년은 4차 산업혁명을 위한 기반 인프라가 본격적으로 조성되는 한해가 될 전망이다. 특히 가트너는 기업의 80%가 2021년까지 혁신을 위한 경쟁에서 도태되거나 자체적 혁신에 실패함으로써 시장 점유율의 약 10%를 잃을 것으로 예상하는 등 기업의 디지털 트렌스포이션은 선택이 아닌 필수가 됐다. 기업의 디지털 경제 시대 생존법이자 성장동력으로 주목받는 새로운 기술과 트렌드를 짚어본다.

데이터를 분석한다는 것은 결코 쉬운 일이 아니다. 그동안 데이터 분석은 데이터 전문가 또는 IT부서의 역할이었으며, 현업에서 데이터 분석이 필요할 경우, 이들에게 의뢰해서 결과 리포트를 공유 받는 것이 고작이었다.

그러나 빅데이터 개념이 등장하고, 분석해야 할 대상도 영상, 음성 등 데이터베이스(DB)에 저장되는 정형 데이터만이 아닌 비정형 데이터들로까지 확장되면서 데이터를 수집해 저장하는 것만 해도 벅찬 일이 돼버렸다. 특히 비정형 데이터들은 용량도 클뿐더러 구조화돼 있지 않아 검색이나 분석 등도 쉽지 않다.

이에 점차 빠른 속도로 늘어나는 데이터들을 수집해 저장하고 관리하기 위한 데이터 레이크(Data Lake) 역할을 해주는 오브젝트 스토리지가 클라우드·빅데이터 시장에서 떠오르고 있다.

▲ 델EMC 오브젝트 스토리지 ‘ECS’

오브젝트 스토리지, 클라우드·빅데이터 시장서 부상
오브젝트 스토리지는 해마다 급격하게 늘어나는 비정형 데이터를 안전하게 저장하고 관리하기 위해 등장한 방식으로, 스토리지 운영에 있어서 근본적으로 다른 접근 방식을 제공한다. 파일 스토리지가 데이터를 파일 규칙에 따라 관리하고, 블록 스토리지가 특정 영역과 구간을 나눠 데이터를 블록 단위로 관리하는 것과 달리, 오브젝트 스토리지는 파일에 대한 구체적인 정보를 포함한 메타데이터를 자동으로 생성/보관/관리한다는 것이 특징이다.

오브젝트 스토리지를 이용하면 데이터를 어디에 어떻게 저장할지를 고민하지 않아도 된다. 데이터는 스토리지 어딘가에 위치하게 되고, 해당 데이터를 사용하는 애플리케이션이 바로 찾아서 보여주기 때문이다. 또한 각 데이터들의 메타데이터를 태그처럼 활용해 쉽게 검색이 가능하다.

그러나 오브젝트 스토리지가 비정형 데이터 관리에 최적화돼있다 하더라도 기본적으로 증가하는 데이터를 수용하기 위해서는 그만큼의 저장 공간을 필요로 한다. 아무리 스토리지 비용이 저렴해졌다 하더라도 폭증 수준의 데이터를 수용하기에는 비용과 공간 문제가 발생하게 된다.

비용 절감뿐 아니라 데이터 가용성도 높여
기본적으로 오브젝트 스토리지는 블록 단위로 저장하는 SAN이나 파일 단위로 저장하는 NAS와 달리 별도의 통신 방식 없이 HTTP 또는 레스트풀(Restful) API를 통해 데이터에 접근하며, 대용량 저장을 위한 스케일-아웃(Scale-Out) 구조로 손쉬운 확장이 가능하다. 이에 더해 이레이저 코드(Erasure Code) 기술로 데이터 용량 절감을 구현, 적은 용량으로도 많은 데이터를 수용할 수 있도록 한다.

이레이저 코드는 정보 분산 알고리즘으로, 스토리지에 저장된 데이터를 쪼개 논리 디스크에 분산 저장시키는 기술이다. 이 때 쪼개진 데이터는 복제된 더미(Dummy)도 포함하고 있어 때문에 일부가 소실되더라도 원 데이터를 이용하는 것에는 문제가 없다. 또한 데이터 자체를 복제해서 보관하는 것이 아닌 분할 보관하기 때문에 실제적으로 소요되는 물리 디스크도 적게 든다는 장점이 있다. 이는 곧 비용 절감 뿐만 아니라 데이터 가용성을 높이는 역할까지 수행한다.

비록 오브젝트 스토리지가 클라우드 기업들에서 활용되기 때문에 최신 기술이라 여길 수 있지만, 실제로 등장한 지는 이미 10여 년이 넘었다. 국내에서도 2000년대 중반부터 제품 판매가 이뤄졌지만, 당시에는 DB를 비롯한 정형 데이터를 저장·분석하기 위한 수요가 많았기에 상대적으로 주목받지 못했다. 이후 IT 기술의 발전과 더불어 빅데이터·클라우드 시대를 맞이하면서 점차 쓰임새가 많아지기 시작했다.

또한 오브젝트 스토리지는 생체인식 및 사물인터넷(IoT)과 같은 신기술이 엔터프라이즈 시스템 및 클라우드 인프라 환경에 미칠 영향을 고려해야 하는 클라우드 아키텍트들에게도 많은 관심을 얻고 있다.

현재 클라우드 운영자들은 개별 서버의 구성 및 처리량보다는 데이터센터의 큰 그림에 초점을 맞추고 있다. 이에 해당 기업들은 데이터센터 및 클라우드 운영에 앞서 기업 시스템에 대한 로드맵을 수립해야 하면서 차세대 애플리케이션 서비스와 IT 인프라를 위해 가용성과 효율이 높은 오브젝트 스토리지를 고려하고 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.