실시간 처리·BI·AI로 확장되는 빅데이터 솔루션
상태바
실시간 처리·BI·AI로 확장되는 빅데이터 솔루션
  • 데이터넷
  • 승인 2018.10.03 13:00
  • 댓글 0
이 기사를 공유합니다

사전 검증된 인증 솔루션 플랫폼 활용…안정적인 서비스·투자 보호 달성
▲ 임경훈 히타치 밴타라 코리아 시니어 컨설턴트(henry.lim@hitachivantara.com)

메인프레임, 유닉스(Unix), 서버-클라이언트, x86, 서버 가상화 및 클라우드. 사람들의 옷차림이 시대별 유행에 따라 변화하듯 IT도 시대별 유행을 따른다. 신념이라 여겨질 만큼 굳건했던 기술들은 새롭게 등장한 다른 기술들에 자리를 내주며, 이러한 IT의 변화를 따라잡지 못하는 기업은 시장에서 살아남기 어렵게 됐다.

새로운 IT 기술은 그동안 풀리지 않았던 문제들을 해결해주며, 시장에서는 신기술을 효과적으로 활용할 수 있는 전문가에 대한 수요가 증가하고, 주류 인력 풀을 형성해 새로운 솔루션이 시장에 지속적으로 공급되는 선순환 구조를 형성한다. IT 업계는 급속한 기술 발전으로 과거의 난제를 해결하는 혁신을 주도하고 있다. <편집자>

클라우드, 빅데이터 및 인공지능(AI) 기술은 과거의 기술들이 풀지 못한 숙제들을 한층 진보한 하드웨어 및 소프트웨어의 결합을 통해 해결해 낸 기술적 쾌거로, IT 업계 관계자들에게 많은 주목을 받고 있다. 이러한 신기술은 방대한 양의 데이터를 실시간으로 처리하고 한 곳에 모아 분석 및 보고할 수 있는 플랫폼을 제공해 빅데이터 환경의 개방성, 유연성 및 안정성을 향상시킨다.

기업 빅데이터 기반 혁신 위한 새로운 플랫폼 필요

과거에 기업들이 자사의 데이터센터에 부분적으로 적용해 온 클라우드 기술은 지금 전체 기술들을 하나로 통합한 보다 성숙한 플랫폼으로 자리 잡고 있다. 모든 기업들은 IT 리소스 전체에 클라우드를 적용함으로써 혁신 및 폭발적인 성장을 달성할 수 있는 기반을 마련했다는데 동의한다. IT 산업에서는 ‘더 적은 비용’으로 ‘더 많은 일’을 ‘더 견고하게’ 할 수 있는 기술을 추구하므로, 기업들이 솔루션에 최적화된 플랫폼을 도입해 안정적으로 운영하는 일이 더욱 중요해지고 있다.

기업들의 초창기 빅데이터 분석 프로젝트의 대다수는 기존에 분석하지 못했던 데이터에서 인사이트를 얻기 위해 오픈소스 소프트웨어를 통해 플랫폼화한 저렴한 일반재 하드웨어 기반에서 수행됐다. 하지만 각기 다른 하드웨어 구성, 잦은 장애, 소프트웨어 구성 오류, 확장 불가, 업그레이드 및 유지보수의 어려움 등 많은 이슈들이 발생했으며, 이로 인해 처음 도입한 상태 그대로 수년 간 운영되는 것이 현실이다.

그뿐만 아니라 빅데이터 플랫폼을 도입한 마케팅 혹은 실무 부서의 경우 IT 관련 이슈에 대한 지식 및 관리 능력이 부족하고, 오픈소스 소프트웨어는 엔터프라이즈급 기능이 부족해 시각화 및 자동화 등을 수행할 수 없다. 임원진들의 관심도가 높은 분석 결과를 원활하게 제공하기 위해서는 분석 시스템의 장애 발생 가능성을 최소화해야 하기 때문에, 결국 빅데이터 분석 시스템에 아무런 변화를 적용하지 않는 것을 최선으로 여길 수밖에 없었다.

실제로 아파치 스파크(Apache Spark)의 인메모리를 기반으로 빠른 맵리듀스(MapReduce) 및 다양한 라이브러리를 활용하는 것이 주류가 된 지 수년이 지났음에도 불구하고, 여전히 디스크 기반의 일반 아파치 하둡(Apache Hadoop)으로 빅데이터 분석 체계를 유지하는 사례가 존재한다.

실시간 데이터 처리·BI·AI로 확장되는 빅데이터 솔루션

초기 하둡 기반의 분석에 초점을 맞추고 있던 빅데이터 솔루션들은 효율적인 데이터 처리를 중심으로 실시간 분석, 비즈니스 인텔리전스(BI) 및 인공지능(AI) 영역으로 확장되고 있다. 이런 확장을 위해선 다음과 같은 요구사항을 충족시켜야 한다.

● 실시간 분석: 기업들의 기존 빅데이터 분석과 같이 다양한 데이터를 축적한 후 분석을 수행하는 것이 아니라, 스트리밍 데이터를 정해진 시간 안에 처리 완료할 수 있어야 한다.
● BI: 비 IT 관련자라도 손쉽게 데이터를 다루고 인사이트를 추출할 수 있어야 하며 풍부한 시각화를 제공해야 한다.
● AI: R, Python, WEKA, Spark MLlib 등의 다양한 오픈소스 머신러닝 라이브러리를 지원해 머신러닝 모델 기반의 분석 및 예측을 수행하며, 필요한 경우 GPU를 통한 딥러닝까지 제공해야 한다.

이러한 조건들은 공통적으로 아래의 사항들을 요구한다.

- 견고한 운영 및 자동화 기능을 갖춘 엔터프라이즈급 솔루션
- 오픈소스 및 타 기술들과 유연한 연계가 가능한 소프트웨어
- 성능, 안정성, 확장성을 두루 갖춘 검증된 하드웨어
- 현재의 변화는 물론 미래의 변화까지 대비한 플랫폼

인증 솔루션 플랫폼, 다양한 엔터프라이즈급 빅데이터 솔루션과 연계

이러한 요구조건을 만족시키고자 최근 많은 고객들은 ‘인증 솔루션 플랫폼(Certified Solution Platform)’을 도입하고 있다. 이 플랫폼이 탄생하게 된 배경을 보면 온전히 고객의 요구에 의한 것임을 확인할 수 있다.

우선 하드웨어 제조사와 소프트웨어 제조사가 협력을 통해 특정 솔루션에 가장 최적화된 서버, 스토리지, 네트워크를 하나의 제품으로 통합한다. 또한 사전 설계한 하드웨어를 안정성 검증이 이뤄진 레퍼런스 아키텍처 기반으로 플랫폼화한다.

이를 통해 소프트웨어 제조사는 하드웨어와의 호환성 문제를 사전에 탐지해 제거할 수 있으며, 낮은 장애율, 유연한 구성, 확장 및 업그레이드와 같은 고민을 떨쳐낼 수 있게 된다. 게다가 최적의 성능을 제공하기 위한 불필요한 튜닝 작업이 없어진다. 고객들은 공인된 플랫폼이 제공하는 장점을 활용해 솔루션 구동 시 유연성, 안정적인 서비스 및 투자 보호를 모두 달성할 수 있게 된다.

효성인포메이션시스템은 이러한 요구 조건을 충족하는 빅데이터 환경을 위한 인증 솔루션 플랫폼으로서 컨버지드 인프라 솔루션 ‘히타치 UCP(Unified Compute Platform) RS’를 제공하고 있다. 일반적인 서버 인프라와 달리 히타치 밴타라(Hitachi Vantara)의 서버, 스토리지 및 네트워크를 통합 공급하며, ‘VM웨어 클라우드 파운데이션(VMware Cloud Foundation)’과 완벽하게 통합된 소프트웨어 정의 데이터센터(SDDC) 랙스케일 플랫폼으로, 민첩한 대규모 데이터 인프라 구축을 간소화했다.

최근 데이터 분석 기능이 강화된 히타치 UCP RS는 인텔 스카이레이크 기반의 올플래시 서버 및 VM웨어 vSAN를 탑재해 성능 및 효율성을 향상시켰다.

모든 하드웨어는 각각의 발주마다 공장 출하 전 전담 엔지니어가 직접 하드웨어와 소프트웨어를 공인된 형태로 구성한 후, 충분한 테스트를 통해 하드웨어 오류를 사전에 제거한 후 출하하게 된다. 특히 메모리가 대량으로 들어가는 빅데이터 솔루션 특성상 운영 시 발생 가능성이 높은 장애를 줄여준다. 고객은 장비 수령 후 즉시 가동시키면 되므로, 프로젝트 기간을 단축시키는 효과도 얻을 수 있다.

히타치 UCP RS는 히타치 밴타라의 빅데이터 통합 및 분석 솔루션 펜타호(Pentaho)뿐만 아니라 클라우데라 엔터프라이즈 데이터 허브(Cloudera Enterprise Data Hub) 및 몽고DB(MongoDB) 엔터프라이즈를 공인된 솔루션 플랫폼으로 탑재하고 있다. 향후 다른 엔터프라이즈급 빅데이터 솔루션들 또한 지원할 예정이다.

▲ 히타치 UCP RS의 공인된 빅데이터 플랫폼 모델

빅데이터 환경 구축에 최적화된 컨버지드 인프라 솔루션

히타치 밴타라는 수십 년 간 스토리지 시장에서 최상의 안정성, 뛰어난 성능 및 시대를 앞서가는 선도적인 기술로 인정받고 있다. 이러한 기술력을 x86 서버에 접목한 결과가 바로 히타치 UCP(Unified Compute Platform)로, 주요 기업들이 원하는 솔루션 구성에 따라 다음의 3가지 모델로 제공하고 있다.

● 히타치 UCP CI(Converged Infrastructure)
고성능 서버 및 엔터프라이즈급 하이엔드 스토리지를 결합해 서버 가상화뿐만 아니라 SAP 하나(HANA), 오라클(Oracle) DB, PBA(Pentaho Business Analytics)와 같은 미션 크리티컬 업무에까지 최적화된 플랫폼이다. 특히 2U 서버에 4개의 GPU가 탑재되는 DS225G 모델을 포함한다.

● 히타치 UCP HC(Hyper-Converged Infrastructure)
복수 서버의 내장 디스크 전체를 분산 파일시스템으로 묶음으로써, 별도의 외장 스토리지 없이 가상화 환경을 제공하는 VM웨어 vSAN 기반 하이퍼컨버지드 플랫폼이다. 소규모 프라이빗 클라우드를 위해 최소 2대의 작은 규모로 시작해 무중단으로 1대씩 서버 및 디스크 공간을 개별적으로 늘려나갈 수 있다. 기존의 IT 인프라에서는 불가능 했던 ‘사용량 기반 지불(Pay as you grow)’ 및 ‘타임-투-마켓(Time to Market)’에 최적화돼 있다.

● 히타치 UCP RS(Rack Scale Infrastructure)
랙 단위로 증설 가능한 대용량 IT 인프라 서비스 플랫폼으로, 두 가지 세부 모델로 나뉜다. VM웨어 클라우드 파운데이션 기반 프라이빗 클라우드를 위한 UCP RS는 소프트웨어 정의 기술을 서버, 스토리지 영역에서 네트워크 및 보안 영역까지 확장해 완벽한 소프트웨어 정의 데이터센터(SDDC)를 제공한다. 또 다른 모델은 UCP RS 하드웨어 구성을 기반으로 빅데이터, BI, AI 등 대용량 데이터 처리 솔루션에 특화된 공인(Certified) 플랫폼이다.

▲ SDDC를 위한 UCP 포트폴리오

효성인포메이션시스템은 고객들이 히타치 UCP 포트폴리오를 통해 빅데이터 및 IoT 등의 첨단 기술이 제공하는 기회를 활용해 수익을 향상할 수 있도록 지원하기 위한 뛰어난 전문 컨설팅 인력 및 기술지원을 제공한다. 효성인포메이션시스템의 소프트웨어 정의 데이터센터 및 클라우드 전담 사업부서의 전문 인력들은 고객들의 IT 환경에 맞춰 빅데이터 인프라 설계부터 구축 및 운영에 이르는 전 과정을 안정적으로 지원한다.

또한 최근 SDDC 기반의 클라우드 데모센터를 구축 완료해, 해당 데모센터에서 여러 벤더의 제품 기반 인프라로 구현이 어려웠던 종합적 관점의 클라우드 인프라를 시연하고 다양한 데이터 분석 및 관리 솔루션을 체험해 볼 수 있도록 지원하고 있다. 이를 통해 기업들은 자사의 빅데이터 환경을 지속적으로 확장하고, 다양한 분석을 적용해 데이터 가치를 극대화할 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.