“데이터 프렙으로 빅데이터 실질 활용률 높인다”
상태바
“데이터 프렙으로 빅데이터 실질 활용률 높인다”
  • 오현식 기자
  • 승인 2016.05.24 15:18
  • 댓글 0
이 기사를 공유합니다

이혁구 팍사타코리아 지사장 “세로운 빅데이터 영역 개척”

팍사타(Paxata)가 한국지사를 설립하고, 국내 시장 공략에 나섰다. 팍사타는 ‘데이터 프렙’이라는 새로운 빅데이터 영역을 개척하고 있는 기업이다. 데이터 프렙을 통해 국내 빅데이터 시장에서의 새로운 활력소를 만들겠다는 이혁구 팍사타코리아 지사장을 만났다.

팍사타가 주력하는 데이터 프렙(Data Preparation)은 빅데이터 분석을 위한 준비 작업이라고 할 수 있다. 머신러닝, 시만틱, 자연어 처리(NLP) 기술 등과 하둡, 스파크 등 빅데이터 기술을 결합, 분석가가 몇 번의 클릭만으로 분석에 활용할 수 있는 데이터를 추출, 정제하는 것을 의미한다.

“정형 데이터 국한, ETL 한계 극복”
이혁구 팍사타코리아 사장은 “데이터 프렙은 ETL과 유사하다고 볼 수 있지만, 기존 ETL은 빅데이터를 다루기에는 한계가 존재한다”고 지적했다.

▲ 이혁구 팍사타코리아 사장

샘플링을 기반으로 하는 특성상 데이터의 일부만 다뤄 데이터 품질 수준이 낮을 뿐 아니라 룰 세팅의 번거로움도 존재한다는 설명이다. 무엇보다 ETL은 정형 데이터에 국한돼 있어 비정형, 반정형을 아우르는 빅데이터에 적합하지 않다는 점도 지적된다.

반면 팍사타는 하둡, 스파크 등의 빅데이터 기술에 자연어 처리(NLP : Natural Language Processing), 시만틱 분석(Semantic Ananlysis), 머신러닝 등의 최신 기술을 더함으로써 정형 데이터는 물론, 반정형, 비정형 데이터 모두를 보다 효과적으로 활용할 수 있도록 지원한다.

이 사장은 “지금까지 IT는 데이터 모델링부터 추출, 변환, 적재, 최적화에 모두 다른 툴이 사용됐을 뿐 아니라 요건이 변화할 경우에는 모델링부터 다시 시작해야 해 지연이 발생하고, 적시에 데이터가 공급되지 않음으로써 데이터 홍수에도 불구하고 필요 데이터 부족 현상에 시달려야 했다”며 “데이터 통합, 품질, 병합, 보강, 거버넌스와 협업 등 전 과정을 단일 플랫폼에서 제공하는 팍사타 데이터 프렙은 현업 사용자가 코딩이나 스크리팅의 필요 없이 현업 사용자가 손쉽게 활용할 수 있는 데이터 환경을 구현해 데이터 중심 비즈니스의 실현을 돕고, 혁신을 가속화할 수 있게 한다”고 강조했다.

“글로벌 선도기업에서 효과 입증”
이 사장은 “데이터 프렙은 팍사타가 새롭게 주창한 개념이지만, 뱅크오브아메리카, 시티은행, JP모건 등 글로벌 3대 금융기업을 포함, 딜로이트, 시스코, 인텔, 야후, 델몬트, PWC 등 굴지의 글로벌 기업에게 공급, 혁신성과 효능을 입증하고 있다”고 말했다.

팍사타에 따르면, JP모건은 디지털 트랜스포메이션을 위한 데이터 허브로, PWC에서는 감사에 팍사타를 활용하고 있다. 또 야후에서는 비즈니스 데이터 분석에 시스코에서는 사물인터넷(IoT) 관련 데이터 수집과 정제에 팍사타를 이용하고 있다. 이외에도 미국 정부가 테러 대응, 사기 방지 등을 위해 팍사타를 도입해 활용하는 등 산업군을 가리지 않고, 빅데이터를 필요로 하는 대부분의 분야에서 도입되고 있다.

이혁구 사장은 “북미, 유럽을 중심으로 인기를 모은 팍사타는 아시아태평양 지역과 전세계 시장으로 확대하기 위해 한국에 주목하고 있다. 아태지역 중에서는 최초의 지사 개설이 한국에서 이뤄졌다는 점은 이를 증명하는 사례로, 이미 한글지원 등 로컬라이제이션 작업이 모두 완료돼 본격적인 시장 공략을 위한 준비도 완료한 상황”이라며 “소수의 데이터 과학자가 아닌 현업 사용자가 빅데이터를 활용하는 데이터 중심 비즈니스 환경 구현을 지원하는 팍사타를 통해 국내 기업의 혁신 속도가 한층 가속화되길 기대한다”고 덧붙였다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.