김민수 교수 연구팀, 그래프 데이터 스트리밍 처리 기술 개발
상태바
김민수 교수 연구팀, 그래프 데이터 스트리밍 처리 기술 개발
  • 오현식 기자
  • 승인 2016.07.08 13:31
  • 댓글 0
이 기사를 공유합니다

컴퓨터 한 대로 빅데이터 처리 … 인공지능 등 적용 기대

한국연구재단(이사장 정민근)은 미래창조과학부 기초연구사업(개인연구)의 지원을 받은 김민수 교수(대구경북과학기술원) 연구팀이 인간 두뇌 신경망의 1/400 크기에 해당되는 대용량 그래프 데이터를 컴퓨터 한 대로 처리할 수 있는 ‘지스트림(GStream) 2.0 기술을 개발했다고 밝혔다.

지스트림은 GPU를 이용해 그래프(Graph) 데이터를 스트리밍(Stream) 방식으로 처리하는 김민수 교수 연구팀의 독자적인 기술의 명칭이다. 연구팀이 개발한 스트림 2.0은 뇌과학, 인공지능, IoT(사물인터넷), 웹, 소셜 네트워크 등 다양한 분야에서 사용하는 그래프 형태의 빅데이터를 두 개의 GPU와 두 개의 PCI-e SSD가 장착된 컴퓨터 한 대로 초당 최대 20억 개의 처리속도(2GTEPS)로 2560억개의 간선(edge)들을 처리할 수 있는 성능을 발휘한다.

연구팀은 대용량 그래프 데이터를 여러 대의 컴퓨터 메모리에 나눠 저장하는 방식에서 벗어나 컴퓨터 한 대의 PCI-e SSD에 저장하고, SSD로부터 GPU 메모리에 비동기적 방식으로 스트리밍하면서 동시에 GPU의 수천 개 계산 코어들을 이용해 데이터를 분석하는 새로운 접근 방법을 시도해 기존의 통신 비용 및 메모리 사용량 문제점들을 해결, 두 개의 GPU와 두 개의 PCI-e SSD를 장착한 컴퓨터 한 대만으로 320억개 간선 규모의 데이터를 500초만에 처리했으며 최대 2560억 개 간선 규모의 대용량 데이터를 처리하는 성능을 발휘한 것이다. 즉 슈퍼컴퓨터를 이용한 기술보다 지스트림 2.0 기술이 그래프 데이터의 처리 용량과 속도를 발휘하는 것이다.

김민수 교수는 “이번 연구성과는 신경망 형태의 빅데이터를 GPU와 SSD 기반으로 고속 처리할 수 있는 소프트웨어 기술을 확보했다”며 “뇌과학 및 인공지능 분야에서 사용되는 신경망 형태의 데이터 처리, 사물인터넷(IoT) 데이터 기반의 사이버보안 등에 널리 활용할 수 있으며, 특히 초대규모 심층 인공신경망을 구현할 수 있는 기반 기술로 사용될 수 있을 것이다”라고 연구의 의의를 설명했다.

한편 이번 연구 성과는 지난 6월 28일 미국 샌프란시스코에서 열린 데이터베이스 분야 세계적 학술대회인 2016 ACM 시그모드(SIGMOD)에서 발표됐다.  


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.