아파치 타조(Apache Tajo)의 0.11.0이 공식 릴리즈됐다. 이번 0.11.0 버전은 데이터 포맷과 저장소 지원을 확대해 타조에서 데이터를 더욱 쉽게 통합하고 연계 분석할 수 있도록 한 점이 특징이다.
타조 프로젝트 의장인 최현식 그루터 박사는 “기존 DB 사용자에게 익숙한 테이블 스페이스 개념을 도입하고 JDBC 저장소를 추가해 하둡은 물론 아마존웹서비스(AWS)와 구글 등의 클라우드 저장소, NoSQL, 오라클 등의 기존 관계형 데이터베이스 시스템(RDBMS)에 흩어져 있는 데이터들을 타조로 쉽게 통합할 수 있게 됐다”고 말했다.
특히 반정형 또는 비정형 데이터를 유연하게 처리할 수 있는 기능이 강화돼 JSON 형식의 원본 데이터를 별도의 변환 작업 없이 바로 SQL로 분석할 수 있게 하고, 중첩 구조로 이뤄진 복잡한 데이터 포맷까지 지원할 수 있게 했다. 또 테이블 구조(스키마)를 미리 정의하지 않고도 질의 실행 시점에 자유롭게 지정 가능하도록 해 데이터 관리와 분석의 용이성을 높였다. 이외에도 ORC 파일 형식 지원이 추가돼 ORC 파일 형식을 많이 이용하던 기존 하이브(Hive) 등 다른 빅데이터 분석 솔루션과의 연계도 더욱 편리하게 됐다.
타조 관련 비즈니스를 주력으로 한고 있는 그루터(대표 권영길)는 0.11.0 버전 발표와 함께 다양한 타조 활용 사례를 공개했다. DSP 광고플랫폼 회사인 와이더플래닛은 기존 데이터 환경에 타조를 적용해 약 3배의 성능향상을 얻었으며, 뮤직 서비스 멜론도 하이브로 진행하던 기존 분석 작업들을 타조로 전환해 1.5배 이상의 성능 향상을 체감했다.
아파치 재단에 따르면, 전력 사용량을 분석하여 기업과 가정에 서비스를 제공하는 에너지 전문 회사인 인코어드 테크놀러지스, 인기 MMORPG 게임인 TERA 를 개발한 블루홀 등도 타조를 통해 빅데이터 분석 역량을 높이고 있다. 그루터는 이외에도 엔터프라이즈 DW 를 사용하고 있는 여러 기업들이 기존 시스템을 확장하거나 보완하기 위해 타조 도입을 진행하고 있는 상황이라고 전했다.
권영길 대표는 “타조는 이미 다양한 프로덕션 환경에서 안정적인 성능을 보장하고 있어 기술 성숙도 측면에서 엔터프라이즈 솔루션으로 성장했다”며 “이번 0.11.0 릴리즈를 계기로 타조의 엔터프라이즈 적용이 더욱 탄력을 받을 것”이라고 밝혔다.