디토닉 “시공간 데이터 활용 위한 최적 환경 제공”
상태바
디토닉 “시공간 데이터 활용 위한 최적 환경 제공”
  • 윤현기 기자
  • 승인 2022.08.03 09:51
  • 댓글 0
이 기사를 공유합니다

분산·병렬처리·인덱싱 등 대용량 시공간 데이터 분석 위한 기술역량 지속 보강
이민우 디토닉 기술연구소 ST-AIR 팀장
이민우 디토닉 기술연구소 ST-AIR 팀장

[데이터넷] 빅데이터 전문 기업 디토닉이 자율주행, 스마트시티 등 시공간 데이터를 활용하는 분야가 점차 늘어남에 따라 ‘지오하이커’ 솔루션 고도화에 매진한다. 분산 환경에서의 병렬처리 성능을 높이고, 검색 효율성을 높이고자 다양한 인덱싱 기법들을 연구하는 등 더 빠른 시공간 데이터 분석·활용이 가능하게끔 하겠다는 입장이다.

시공간 데이터는 시간과 공간 속성을 담고 있는 데이터를 의미하며, 별도의 데이터 종류로 구분되는 것은 아니다. GPS가 탑재된 사물인터넷(IoT) 장비에서 위치와 시간 정보를 함께 수집하는 사례가 대표적이며, 우리가 스마트폰으로 촬영하는 동영상에도 각 프레임별 촬영된 위치와 시간 정보 파악이 가능하다.

이러한 시공간 데이터는 새롭게 등장한 개념이 아니다. 토비아 라크 베를린 훔볼트대학교 교수의 표현을 빌리면 세상에 존재하는 모든 데이터의 약 80%가 이에 해당하며, 나머지 20% 데이터들도 시간과 공간 정보가 함께 수집되지 않은 것에 불과하다.

이민우 디토닉 기술연구소 ST-AIR 팀장은 “그간 데이터에서 시공간 데이터를 함께 수집하지 않은 이유는 그 방법이 없었거나 굳이 필요하지 않아 제외했기 때문”이라며 “그러나 점차 IoT 장비 증가 등을 비롯해 수집되는 데이터가 늘어남에 따라 빠르고 효율적으로 처리하는 방안들이 필요하다”고 말했다.

신산업 분야 적용 확대
4차 산업 연구가 본격화되면서 시공간 데이터의 쓰임새가 늘어나고 있다. 자율주행차를 비롯해 스마트시티, 스마트팩토리, 디지털 트윈 등 이용되는 분야도 다양하다. 특히 시간과 공간이라는 속성을 중요시하는 이동과 관련된 곳에서는 시공간 데이터 활용에 적극적이다.

코로나 팬데믹 초기에 확진자 동선을 추적했던 사례는 시공간 데이터를 잘 활용한 사례다. 방역당국은 시공간 데이터 분석을 통해 초기 전염 경로를 빠르게 파악하고, 이를 후속 방역 정책 수립에 참고하는데 활용했다.

많은 연구가 진행 중인 자율주행차 분야에서도 시공간 데이터를 활용한다. 이동 경로 데이터를 비롯해 차량 내 각종 데이터들을 수집하면서 차량이 안전하게 이동하고 있는지, 오류가 발생한 것은 아닌지 등을 판단하고 시스템에 반영한다.

또 스마트시티에서는 차량 흐름 등을 파악해 상습 정체 구간이나 사고 다발 지역 등을 파악하고 이를 개선하는 교통정책을 마련할 수 있으며, 스마트팩토리에서는 다양한 장비들 중 문제가 발생한 것을 빠르게 찾아 조치할 수 있다.

이민우 팀장은 “시공간 데이터를 적용할 수 있는 분야는 자율주행, 스마트시티뿐만 아니라 지역 기상 예측, 고속도로 휴게소 상품 매출 분석 등 무궁무진하다”며 “디토닉은 시공간 데이터 활용을 쉽게 하도록 솔루션 고도화에 주력하고 있다”고 설명했다.

시공간 데이터에 최적화된 분석 환경 제공
시공간 데이터는 IoT의 발전에 따라 점차 그 양이 급격하게 증가하고 있다. 실제로 IoT 장비 등에서는 지속 수집되고 있으며, 장비 개수와 기간에 따라 그 양이 급격하게 증가하는 경향을 보인다. 따라서 전통적인 관계형 데이터베이스 등에서는 저장·관리가 어려우며, 하둡과 같은 빅데이터 환경이 적합하다.

대량 수집된 데이터를 분석하는 것 역시 쉬운 일이 아니다. 불어나는 데이터들을 수용하기 위해 비용면에서 효율적인 스케일아웃 방식의 확장을 채택하는 경우가 많으며, 그로 인해 여러 시스템에 분산된 데이터들을 효과적으로 처리할 방안을 고려해야 한다.

디토닉의 ‘지오하이커’는 이처럼 분산된 환경에 저장된 시공간 데이터 처리 목적에 최적화된 솔루션이다. 시간과 공간 속성에 맞춘 최상의 인덱싱 알고리즘을 적용한 일종의 가속 엔진이자 하둡 생태계에 최적화된 솔루션으로, 플러그인 방식을 채택해 확장성과 범용성도 뛰어나다.

무엇보다 사용자가 시공간 데이터를 분석할 수 있는 환경을 제공하고 원하는 데이터를 빠르게 확인할 수 있도록 하는 것에 초점을 맞추고 있다. 이에 더해 다양한 연산들을 갖추고 있어 사용자가 필요한 연산을 직접 만들 필요 없이 분석에만 집중할 수 있도록 돕는다.

최근 디토닉은 자사 솔루션 고도화를 위해 분산, 병렬처리, 인덱싱 측면에서 많은 투자를 단행하고 있다. 단일 서버에서 다루기 힘든 데이터를 여러 서버에서 다루고(분산), 데이터마다 동일한 연산을 적용할 때 다량의 데이터에서 빠르게 연산을 진행하며(병렬처리), SQL 쿼리처럼 메모리나 디스크에 위치한 데이터를 빠르게 검색해(인덱싱) 사용자가 원하는 결과물을 빠르게 받아보도록 하겠다는 방침이다.

이민우 팀장은 “디토닉은 점차 늘어나는 대용량 시공간 데이터를 효과적으로 처리하는 기술개발에 전념하고 있다”며 “지오하이커에서 모든 시공간 데이터를 그 어떤 솔루션보다 똑똑하게 다룰 수 있는 환경을 제공하는 것이 목표”라고 강조했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.