“우리는 무엇을 오픈소스할 것인가”
상태바
“우리는 무엇을 오픈소스할 것인가”
  • 박형배 오픈소스진흥협회장
  • 승인 2016.01.06 09:56
  • 댓글 0
이 기사를 공유합니다

박형배 오픈소스진흥협회장 “미래 핵심자산 변화에 대한 정확한 판단 중요”

오픈소스(open source)는 제작자의 권리를 지키면서 지적 자산을 누구나 열람할 수 있도록 개방하는 방식 또는 그 방식을 따르는 지식자산을 뜻한다. 

위키피디아에 따르면 소스코드를 공개한다고 해서 모두 오픈소스인 것은 아니다. 정부나 거대 다국적기업 또는 연구소 등에게 소스를 공개했다고 해도 전체 비율로 봤을 때 극소수이기 때문에 오픈소스가 아니라고 판단한다. 누구나 열람할 수 있지 않기 때문이다.

오픈소스는 카피레프트(copyleft)를 표방하고 있어 초기에는 자본주의의 적으로 간주됐다. 하지만 자본주의를 움직이고 있는 IBM, 페이스북, 오라클, 구글 등 내로라하는 글로벌 기업들이 주요 지식자산들을 공유하겠다고 앞다퉈 발표하고 있는 상황이다.

글로벌 기업들, 앞다퉈 주요 지식자산 공유 나서
오픈소스가 기업 이미지를 급상승시키는 마케팅 효과를 고려하더라도 핵심 지식자산을 공개한다는 것은 쉽지 않은 전략이다. 공유를 통한 지식자산의 발전 가속화 등 많은 이유가 있겠지만 희망찬 새해가 밝았으니 평소에 하지 않는 이야기를 조심스레 꺼내본다.

지난해 말 IBM은 자체 개발한 머신러닝 소프트웨어 ‘시스템ML’을 오픈소스 프로젝트 관리 단체인 아파치 소프트웨어 재단에 기증했다. 머신러닝이란 컴퓨터가 알고리즘을 기반으로 학습하게 해서 새로운 데이터가 들어왔을 때 이 데이터의 결과를 예측하는 기술을 의미한다. 검색어 자동 완성, 페이스북 사진 분류, 범죄 또는 사고 발생 예측 등을 대표적으로 꼽을 수 있다.

많은 사람들이 머신러닝은 컴퓨터가 데이터를 분석할 수 있게 하는 알고리즘을 만드는 것이 핵심이라고 생각한다. 어쩌면 그럴지도 모른다. 그러나 머신러닝의 핵심은 기술이 아닌 데이터 자체에 있다. 알고리즘으로서의 머신러닝은 지도 없는 내비게이션과 같다고 할 수 있다.

경쟁력과 미래 핵심자산 변화에 대한 정확한 판단 중요
IBM은 머신러닝 기술을 오픈소스해 누구든지 사용하게 해서 그들이 생성하는 데이터를 누적해 분석해야 궁극적인 머신러닝을 완성할 수 있다는 것을 너무도 잘 알고 있을 것이다. 이렇게 보면, 알고리즘이 아닌 데이터로서의 머신러닝이야 말로 진정한 IBM의 자산이다.

따라서 IBM은 덜 중요한 알고리즘으로서의 머신러닝인 ‘시스템ML’을 오픈소스하고, 더 중요한 데이터로서의 머신러닝을 얻겠다는 전략을 가지고 있다고 분석하는 것이 옳다고 내심 생각하고 있다.

IBM의 사례를 볼 때 기업이 오픈소스를 하려면 스스로의 경쟁력이 무엇이고, 미래의 핵심자산이 어떻게 변할 것인가를 판단한 이후에야 가능하다. 우리의 오픈소스가 수용에 그치는 것은 어쩌면 이 질문에 답할 수 없는 스스로의 자화상일지도 모른다.

2016년은 우리가 가진 어떤 지식자산을 공유해야 새로운 지식자산을 얻을 수 있는지 답을 만들어가는 첫 해가 되길 기원한다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.