마인즈랩, 깃허브에 ‘코로나19 동선 추적 데이터셋’ 오픈소스로 공개
상태바
마인즈랩, 깃허브에 ‘코로나19 동선 추적 데이터셋’ 오픈소스로 공개
  • 윤현기 기자
  • 승인 2020.03.19 10:27
  • 댓글 0
이 기사를 공유합니다

기존 데이터셋 대비 높은 데이터 품질 특징…美 커뮤니티 레딧 개발/딥러닝 부문 1위
코로나19 데이터셋 구현 화면
코로나19 데이터셋 구현 화면

[데이터넷] 인공지능 전문기업 마인즈랩은 코로나19 환자 경로 시각화와 관련, 국내 최대 규모의 데이터셋을 오픈소스로 공개했다고 19일 밝혔다.

마인즈랩에서 공개한 ‘코로나19 동선 추적 데이터셋’은 확진자의 경로, 연령, 성별, 진단 날짜 등 기초적인 환자 경로 데이터는 물론 22가지의 주요 전염병, 16개의 백신, 의료시설 등을 포함한 의료 통계 데이터와 다양한 변수에 따른 시각화된 데이터로 AI 모델 개발 등 기계학습에 필요한 데이터 집합이다.

마인즈랩의 데이터셋은 기존 코로나19 관련 오픈 데이터셋에 비해 데이터의 양과 품질 그리고 데이터 시각화 부분에서 차별화를 둬 미국의 커뮤니티 사이트 레딧(Reddit)의 개발/딥러닝 부문 1위에 오르는 등 해외 네티즌들 사이에서도 큰 관심을 끌고 있다.

이중건 마인즈랩 브레인팀 선임 연구원은 “공익적 가치를 고려해 누구나 쉽게 사용할 수 있도록 소셜 코딩 플랫폼인 깃허브(Github)에 오픈소스로 공개했다”며, “빠르게 확산하고 있는 코로나19를 막기 위해 질병의 최전선에서 사투를 벌이는 의료진과 관계자들에게 마인즈랩이 구축한 데이터셋이 큰 도움이 되기를 바란다”고 말했다.

최홍섭 마인즈랩 연구 개발 조직 부문 대표는 “이번 데이터셋 공개는 마인즈랩 연구 개발 조직의 연구역량이 세계적 수준에 이르고 있음을 보여주는 획기적 성과”라며, “이번 데이터셋 구축을 기반으로 코로나19뿐만 아니라 다른 감염병에도 적용할 수 있어 추후 위기 사태에서도 모델링해 활용도가 높아질 수 있을 것”이라고 전망했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.