“AI 데이터 크라우드소싱, 미래 먹거리로 부상”
상태바
“AI 데이터 크라우드소싱, 미래 먹거리로 부상”
  • 강석오 기자
  • 승인 2020.08.25 09:39
  • 댓글 0
이 기사를 공유합니다

인공지능 중심 4차 산업 시대, 고품질 데이터 확보가 핵심
데이터 공급기업과 작업자 연결시키는 크라우드소싱 플랫폼 주목
▲ 에이아이스튜디오 마이크라우드로 작업 중인 데이터라벨러
▲ 에이아이스튜디오 마이크라우드로 작업 중인 데이터라벨러

[데이터넷] 미래 산업의 원유라 불리는 데이터 산업이 급성장하고 있다. 인공지능(AI), 자율주행, 블록체인 등 첨단 기술을 이끌어 갈 핵심 자원이 ‘데이터’라는 점에서 4차 산업혁명 시대의 메인 키워드로 평가받고 있기 때문이다.

실제로 하나의 AI를 만들어내는 과정에는 수만 개 이상의 가공된 데이터를 학습시키는 단계가 필수다. 이에 AI산업의 발전 흐름에 발맞춰 데이터 시장을 주도하기 위한 국가별 데이터 경쟁은 치열하다.

빅데이터 산업을 선도하는 미국의 경우, 민간을 중심으로 작년 기준 200조원 규모의 데이터 거래 시장이 활성화돼 있다. 중국은 2030년까지 데이터 산업을 필두로 AI 분야의 세계 최고를 차지하겠다며 바이두, 알리바바 등 기업들 지원을 아끼지 않고 있다. 러시아, 일본, 프랑스 등도 데이터 관련 법과 정책을 정비하는 등 패권을 잡기 위한 준비를 서두르고 있다.

국내 데이터 시장의 성장세도 만만치 않다. 우리나라 데이터 시장 규모는 2019년 기준으로 약 16조8693억원으로 전년보다 8.4% 증가한 것으로 나타났다. 특히 해당 산업 종사자의 경우 작년 기준 약 34만 명에 달해 다른 산업보다 고용 증가율이 높은 수준이다.

이에 정부는 데이터 산업이 일으킨 고용 창출 효과를 극대화하기 위해 디지털 뉴딜, 데이터 바우처 지원 사업 등 관련 산업 육성을 위한 정책 지원에 적극 나서고 있다.

데이터 산업의 근간은 정리되지 않은 수많은 데이터를 학습 가능한 상태로 가공하는 작업인 ‘데이터 라벨링’이라 할 수 있다. 데이터 라벨링은 데이터 속 오브젝트에 이름표(라벨)를 달아주는 작업으로, 일견 단순해 보이지만 대개 AI 학습 데이터 구축의 80~90%는 라벨링에 소요될 정도로 매우 노동집약적인 과정이다.

최근에는 이를 보다 효율적으로 운영하기 위해 크라우드소싱 플랫폼이 등장했다. 크라우드소싱 플랫폼은 간단히 말해 데이터 가공 작업을 위해 데이터 공급 기업과 작업자를 연결해주는 통로로, 공급 기업은 플랫폼을 통해 작업자를 모집해 데이터를 완성시키고, 작업자는 주어진 프로젝트에 참여해 일정 수익을 얻는 구조로 운영된다.

해외에서는 이미 많은 기업들이 크라우드소싱 플랫폼을 개발해 운영 중이다. 대표적으로 삼성, 핀터레스트, 에어비엔비, 도요타 등을 고객사로 두고 있는 ‘스케일AI’가 있으며, 이 기업은 최근 실시한 시리즈 C펀딩 라운드에서 1억달러의 자금을 투자 받으며 화제가 되기도 했다. 2008년 설립된 ‘사마소스(Samasource)’는 데이터 가공 플랫폼을 운영하며 주로 취업 취약계층의 경제적 활동과 자립을 지원하고 눈길을 끌고 있다.

데이터 크라우드소싱 플랫폼·기술 경쟁 치열

국내는 다수의 스타트업을 중심으로 크라우드소싱 플랫폼이 생겨나고 있다. AI 전문 기업 에이아이스튜디오(대표 노성운)가 새로 선보인 ‘마이크라우드(MyCrowd.ai)’는 누구나 참여 가능한 개방형 크라우드소싱 방식을 취해 데이터 공급 기업과 작업자를 연결시킨다.

특히 마이크라우드는 에이아이스튜디오가 자체 개발한 오토 세그멘테이션 기능인 ‘매직핀(Magic Pin)’ 서비스를 도입했다. 이 기능은 사진, 영상과 같은 비정형 데이터에서 오브젝트와 배경을 자동으로 구분해주는 기능으로, 일반 작업 속도보다 10배 이상 빨라 효율적인 작업이 가능하다. 장애인, 고령자 등 취업 취약계층도 손쉽게 작업에 참여할 수 있어 국내 크라우드소싱 플랫폼 시장에 새로운 활력을 불어넣을 것으로 기대된다.

뿐만 아니라 데이터 바우처 지원 사업에 선정된 데이터 공급 기업의 경우, 마이크라우드가 제공하는 어노테이션 툴(Annotation Tool)을 활용해 직접 데이터를 가공하거나 크라우드소싱으로 모집된 작업자에게 별도로 가공 작업을 요청할 수도 있다. 이 외에도 데이터 수요 기업에게는 데이터의 유형에 따라 공급 기업을 매칭시켜주는 프로세스를 제공하는 등 공급 및 수요 기업 모두 만족할 수 있도록 하는 다양한 서비스를 강화해 나가고 있다.

에이아이스튜디오 노성운 대표는 “데이터는 AI 개발에 필수로 국내외 AI 관련 기업들은 계속해서 데이터 가공 분야에 관심을 가질 수밖에 없을 것”며 “에이아이스튜디오는 국내를 대표하는 AI 데이터 플랫폼으로 이 시장을 주도해 AI 데이터 생태계를 활성화시키고, 플랫폼 기업을 물론 AI 개발사까지 함께 성장할 수 있는 토대 마련에 최선을 다할 것”이라고 전했다.

에이모, 슈퍼브에이아이, 크라우드웍스 등도 크라우드소싱 플랫폼을 운영하고 있는 등 디지털 뉴딜 정책 등을 기점으로 많은 스타트업들이 데이터 가공 산업에 적극 뛰어들고 있다.

AI 학습 데이터 라벨링 서비스 기업 에이모(대표 오승택)는 웹 기반 AI 학습 데이터 라벨링 협업 플랫폼 ‘에이모 엔터프라이즈(AIMMO Enterprise)’ 베타 서비스를 최근 오픈했다. 별도의 프로그램 설치나 개발자의 도움 없이도 바로 준비된 툴을 누구나 이용할 수 있도록 직관적인 UI로 구성돼 AI 기업과 데이터 라벨링 프로젝트 관리자들이 최적의 업무 환경을 구현할 수 있게 됐다.

그간 내부적으로 AI 데이터 라벨링을 진행하며 쌓은 노하우를 집약한 ‘에이모 엔터프라이즈’ 서비스 오픈을 통해 AI 모델링에 필요한 학습 데이터 가공의 정확도와 효율성 향상에 크게 기여할 수 있을 것으로 기대된다.

에이모 관계자는 “AI 학습 데이터 라벨링을 자체적으로 진행하고자 하는 기업이 늘고 있는 만큼 국내와 해외 AI 기업들에게 에이모 엔터프라이즈를 통해 쉽고 빠르고 정확한 AI 학습 데이터 라벨링 경험을 제공할 수 있길 바란다”고 전했다.

슈퍼브에이아이(대표 김현수)는 최근 AI 머신러닝 데이터 플랫폼 ‘스위트(Suite)’ 정식버전을 출시했다. 스위트는 데이터를 구축, 분석, 관리를 하기 위한 올인원 플랫폼이자 AI 개발 과정에서의 협업을 도와주는 생산성 도구로, ‘스위트 1.0’에는 버튼 하나로 데이터 라벨링을 진행할 수 있는 ‘오토라벨링(Auto Labeling)’을 비롯해 통계 분석 툴, 파이썬 SDK, CLI 등의 개발자 도구 연동 등의 기능이 탑재됐다.

오토라벨링은 수동 작업 대비 약 10배의 속도를 향상시켜 생산성을 극대화하는 기술이다. AI가 1차로 단순 반복 작업인 데이터 라벨링을 진행하고, 사람은 AI가 검수를 요청한 부분만 확인하면 돼 개발자 도움없이 누구나 플랫폼으로 오토라벨링을 진행할 수 있다는 게 가장 큰 장점이다.

슈퍼브에이아이 김현수 대표는 “데이터는 AI 개발에서 가장 필수적이면서도 동시에 진입 장벽이 되고 있는 분야”라며 “스위트 베타 버전 출시 이후 AI 개발사와 데이터 라벨링 전문 기업 등 관련 업계에서 많은 호응을 얻으며 국내외 약 50개 기업을 고객사로 확보했으며, 정식 버전 출시를 통해 더 활발한 사업 전개를 예상하고 있다”고 말했다.

이어 “오픈소스의 성지로 불리는 깃허브처럼 슈퍼브에이아이가 AI 데이터계의 깃허브가 될 수 있도록 최선을 다하겠다”고 덧붙였다.

크라우드소싱 기반 AI 데이터 수집·가공 플랫폼 기업 크라우드웍스(대표 박민우)는 산업통상자원부가 추진하는 사업화연계 기술개발사업의 ‘AI 기술 고도화를 위한 온라인 크라우드소싱 기반 데이터 생산용 SaaS 플랫폼’ 과제를 진행하고 있다.

크라우드웍스는 크라우드소싱 플랫폼을 운영한 노하우와 기술력을 바탕으로 데이터 생산용 SaaS 플랫폼을 개발하며, 이를 통해 인적자원 관리시스템, 템플릿 개발, 검수 자동화기술 등을 통합적으로 운영한다.

이 플랫폼은 향후 AI 데이터 전처리 시스템 분야의 솔루션으로 진화하며, 국내 AI 산업의 경쟁력을 좌우하는 핵심 동력으로 발전시킬 예정이다. 특히, 크라우드웍스는 온라인 크라우드소싱 기반 데이터 생산용 SaaS 플랫폼 개발이 완료된 후에는 국내의 주요 일거리 제공 플랫폼으로 성장시킬 계획이다.

박민우 크라우드웍스 대표는 “산업통상자원부가 진행 중인 사업화연계 기술개발사업을 통해 국내 AI 산업이 한 단계 발전할 것으로 기대된다”며 “크라우드웍스 플랫폼을 통해 생산된 AI 학습용 데이터가 국내 AI 경쟁력을 높이는데 기여하길 바란다”고 말했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.