기업 인공지능 활용, 어떤 전략이 필요한가

AI 기술 이해 따른 현실적인 목표 수립 요구…양질 데이터 확보도 관건

▲ 권우영 와이즈넛 미래기술융합실 부장 (wykwon@wisenut.co.kr)

인공지능(AI)이 기업 비즈니스에 도움을 줄 수 있다는 것이 확인되면서 많은 기업들이 AI를 도입하기 위해 노력하고 있다. 그러나 AI는 영화에서와 같이 만능이 될 수 없으며, 그 특성을 정확하게 이해하지 못할 경우 원하는 만큼의 성능을 얻을 수도 없다. 무엇보다 양질의 데이터 확보가 필수적이며, 인공지능에 대한 이해가 높은 인력을 확보하고 기업 의사결정 프로세스도 혁신할 필요가 있다. <편집자>

최근 인공지능(AI)에 대한 기업들의 관심이 급증하며 비즈니스에 도입하려는 움직임 역시 본격적으로 진행되고 있다. 가트너가 올해 전 세계 3000여명의 CIO를 대상으로 조사한 바에 따르면 46%가 AI를 도입할 예정으로, 이중 4% 정도는 이미 AI를 도입했다고 응답했다.

2000년대 초반에는 AI에 대한 기대감과 함께 실제 비즈니스에 얼마나 도움이 될지에 대한 우려가 공존했었다. 그러나 최근 AI를 적용한 성공사례들을 통해 직원들이 AI를 활용함으로써 보다 높은 가치의 생산 활동을 할 수 있음을 확인하게 됐고, 이를 계기로 기업들의 AI에 대한 직접적인 관심이 높아지고 있다.

기업 시장서 주목받는 AI ‘챗봇’

이미 글로벌 IT업체들은 활발히 인공지능 사업에 뛰어들고 있다. IBM은 자사의 AI 솔루션인 왓슨을 미국 MD엔더슨 암센터에 도입하는 사업을 시작으로 의료영상을 분석하는 사업을 확장하는 중이다. 또한 아마존, 애플, MS 등은 인공지능 개인비서 서비스를 스마트폰 및 AI스피커에 탑재하면서 많은 사용자를 확보한 상태다.

영상인식, 의사결정 지원 등 여러 분야에서 인공지능의 비즈니스 적용이 활발히 진행되고 있지만, 사실 시장에서 가장 주목받고 있는 것은 ‘챗봇(Chat bot)’이다. 대화형 인터페이스를 통해 사용자가 원하는 정보 및 콘텐츠를 제공하는 챗봇은 AI를 비즈니스에 도입하는 가장 현실적이고 빠른 방안으로써 분야를 막론하고 많은 기업들이 주목하고 있다. 이미 글로벌 시장에서는 1억 달러 이상의 규모로 확대됐으며 매년 28%씩 가파르게 성장하고 있다.

국내에서는 금융, 쇼핑, 유통, 의료, 공공기관에 이르기까지 다양한 인공지능 챗봇 사례가 만들어지고 있으며, 와이즈넛 역시 고객 응대가 필요한 거의 모든 분야에 인공지능 챗봇을 공급하면서 도입사례를 늘려나가고 있다. 실제 와이즈넛의 챗봇을 도입한 콜센터의 경우를 보면 다수의 단순 질의응답 업무를 챗봇이 대신하고, 상담사는 챗봇이 처리하기 어려운 복잡한 내용의 상담에 집중하게 함으로서 비용 절감과 생산성 향상으로 이어지게 됐다. 이처럼 AI 기술의 도입의 효과를 다양한 비즈니스 적용 측면에서 확인할 수 있다.

대부분 ‘약인공지능’에 초점

그렇다면 이토록 많은 기업이 관심을 보이는 인공지능은 무엇인가? 인공지능은 사람이 가진 지적능력의 일부나 전체를 인공적으로 구현한 것을 의미한다. 인공지능을 어떻게 만들어내느냐에 따라 두 가지 접근 방법으로 나뉘는데, 인간과 같은 지능을 구현하는 것을 목적으로 하는 강인공지능(Strong AI)과 특정한 분야에서 사람의 역할을 대체할 수 있도록 하는 약인공지능(Weak AI)이 그것이다.

영화 ‘바이센테니얼 맨’, ‘아이-로봇’, ‘Her’, ‘트랜센던스’ 등에 등장하는 강인공지능은 모두 사람과 동등하거나 더 높은 능력을 갖는 지능을 갖춘 존재로 묘사된다. 일부 학자들은 30년 내 강인공지능이 출현할 것으로 예측하지만 의견이 분분하며, 가능성에 대한 의문을 제기하는 부류도 존재한다.

현실에서의 인공지능 결과물은 대부분 약인공지능 분야에 집중돼 있다. 영상판독, 자율주행자동차, 인공지능 스피커, 재난재해 분석 및 예측 등 24시간 내내 동작하면서 빠른 판단이 필요한 분야나 방대한 데이터를 다루는 분야에서는 사람을 대체해 가시적인 성과를 보이고 있다. 세간의 화제였던 알파고 및 알파제로의 경우도 강인공지능을 지향한다고는 하지만 바둑, 체스, 장기 등을 잘 할 수 있는 제한된 분야의 인공지능으로 볼 수 있다.

약인공지능을 만드는데 있어서의 주요한 특징은 적용하는 분야에 따라서 각기 조금씩 다른 방법론과 알고리즘이 필요하다는 것이다. 예를 들어 바둑을 잘 두는 알파고의 결과물을 그대로 시리와 같은 개인비서에 적용할 수 없다는 점이다. 각각의 결과물은 정해진 분야에 적합하게 설계되고 만들어졌으며, 다른 분야에 적용하고자 할 때는 정도의 차이는 있지만 설계와 구현에서 수정이 필요하다. 때로는 완전히 새로 만들어야 하는 경우도 빈번하다.

자연스럽게 비즈니스에 적용할 수 있는 인공지능도 분야에 따라 다른 접근방법과 구현이 필요하다. 인공지능에 대한 필요성의 공통점은 인공지능을 통해 여러 현안을 해결하거나, 업무의 생산성을 크게 향상할 수 있을 것이라는 기대감이 있는 반면 인공지능, 도입 시 투자비용과 시행착오에 따른 비용 부분은 상대적으로 덜 고려되는 점은 개선돼야 할 부분이다.

최근 인공지능의 발전은 과거에 해결하지 못하던 많은 문제를 성공적으로 해결한 것은 분명하며 많은 가능성을 가지고 있다. 하지만 그 특징과 한계에 대해서는 분명히 인식할 필요가 있다.

AI 활용하려면 충분한 학습 필요

인공지능, 기계학습, 딥 러닝 등의 키워드가 화두가 되고 있는데 간혹 구분 없이 사용되는 경우가 있다. 먼저 인공지능은 가장 상위의 개념으로서 인간의 지능을 기계로 구현한다는 것을 의미한다. 기계학습은 이용해 데이터를 분석하고, 분석을 통해 학습하며, 학습한 내용을 기반으로 판단이나 예측을 하는 알고리즘 의미한다.

과거의 인공지능은 사람이 특정 분야의 전문지식을 활용해 규칙을 만들고 이 규칙을 이용해 사람을 대신하는 판단을 내리는 프로그램을 만드는 방식으로 진행됐는데 최근의 기계학습 기반 인공지능 방법은 이 규칙을 기계가 스스로 학습하는 특징을 보인다.

딥 러닝은 기계학습 방법 중의 하나로써 막대한 양의 데이터로부터 학습을 할 수 있다. 딥 러닝은 과거 인공신경망에서 발전된 형태의 기계학습 방법으로, 막대한 양의 데이터가 있을 경우 높은 성능을 낼 수 있는 특징을 가지고 있다.

현재 각광받고 있는 인공지능 방법은 기계학습, 특히 딥 러닝을 이용한 방법이지만 만능은 아니다. 현재 산업에서 사용되는 기계학습 방법 중 대부분은 지도학습(supervised learning)을 기반으로 한다. 지도학습이란 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계학습(Machine Learning)의 한 방법으로, 훈련 데이터에 사람이 정답을 알려주는 방식으로 지도를 한다.

가령 개와 고양이를 구분하는 지도학습을 수행하기 위해서는 고양이가 나온 수만 장의 사진에서 이 사진이 고양이에 대한 사진이라는 정답을 알려준다. 또 다른 개가 나온 수만 장의 사진에 이 사진이 개에 대한 사진이라는 정답을 알려준다. 이러한 정답이 알려진 사진들을 학습해 사진의 어떤 특징을 잘 분석했을 때 개와 고양이를 분류할 수 있는지를 학습한다.

그 후 컴퓨터는 정답이 없는 사진을 보여줬을 때 이 사진이 개에 대한 사진인지, 고양이에 대한 사진인지를 판단할 수 있다. 이 같은 지도학습은 챗봇이나 개인비서 서비스에서 사용자가 말한 질문의 의도가 무엇인지를 판단하는데 사용되기도 하고, 온라인 광고에서 이용자의 정보를 기반으로 이용자가 광고를 클릭할지 말지를 결정할 수 있도록 한다.

지도학습을 위해서는 정답이 태깅된 방대한 양의 훈련데이터가 필요하다. 특히 딥 러닝 방법은 필요로 하는 데이터의 양이 다른 방법에 비해 월등히 많은데, 딥 러닝이 다른 기계학습 방법에 비해 높은 성능을 보이는 이유는 막대한 양의 데이터를 처리할 수 있는 능력에 있다.

비즈니스 적용 위해 양질 데이터 확보해야

비지도학습(Unsupervised Learning)은 정답이 없는 훈련 데이터만을 이용해 학습을 진행하는 방식으로써, 데이터로부터 패턴을 발견하거나 숨겨진 구조를 찾아내는데 활용된다. 각각 데이터의 유사성을 측정해 통계적 특징이 서로 다른 군집으로 나눈다. 쉽게 말하자면 데이터를 잔뜩 주고 컴퓨터에게 ‘비슷한 데이터끼리 묶어보라’라는 명령을 주는 것이다. 이후 비슷하게 묶인 데이터들을 사람이 분석해서 의미 있는 결과를 찾아내야 한다.

그렇다면 인공지능을 비즈니스에 성공적으로 적용하기 위해 필요한 중요한 요소는 무엇일까?

첫 번째는 양질의 데이터를 많이 확보하는 것이다. 알파고의 경우 초기에만 3000만 건 이상의 기보를 학습했다. 이는 사람이 바둑을 둔다고 가정했을 때 1000년에 해당하는 시간이다. 바이두의 경우 음성인식에 사용된 데이터가 10만 시간에 해당한다. 이는 10년 치의 음성 데이터다. 안면인식의 경우 1500만 개의 이미지를 사용해 학습을 수행하였다. 더욱 놀라운 사실은 이 방대한 양의 데이터가 모두 지도학습을 위해 정답을 붙이는 과정을 거쳤다는 것이다.

산업계에서 기계학습 기반의 인공지능을 성공적으로 도입하기 위해서는 양질의 많은 데이터 확보가 필수적이다. 간혹 보유 데이터가 없이 인공지능을 도입하려는 수요가 있는데, 이는 최근 인공지능을 이해하지 못해 발생하는 현상으로 볼 수 있다.

또한 단순히 데이터가 많다고 해서 기계학습을 적용할 수 있는 것이 아니다. 산업계에 적용되는 대부분의 기계학습 방법이 지도학습인 만큼, 데이터의 유의미한 정보를 붙여줘야만 한다. 기업이 보유한 상당수의 데이터는 기계학습을 위해 가공되지 않은 데이터인 경우가 많기 때문에 직접적인 활용이 어려운 실정이다.

즉 기계학습기반의 인공지능 도입을 위해서는 충분한 양의 데이터를 확보해야 하며, 어느 정도의 데이터가 확보된 경우라 할지라도 기계학습을 위해 데이터의 분석 및 가공을 위해 많은 인력과 시간을 필요로 한다는 것이다.

비즈니스 특색에 맞게 개발·적용돼야

두 번째는 인공지능에 대한 이해가 높은 인력의 확보와 기업의 의사결정 프로세스의 혁신이다. 모든 산업 분야에 별다른 노력 없이 손쉽게 적용 가능한 AI는 현시점에서 꿈에 가깝다. 약인공지능으로 표현되는 현재의 인공지능 기술은 비즈니스의 특색에 맞게 적용돼야 한다. 최근 인공지능 알고리즘 및 플랫폼이 오픈소스화 되면서 인공지능에 대한 진입장벽이 상당히 낮아진 상태다. 구글의 텐서플로우, 마이크로소프트의 CNTK, IBM의 시스템ML 등 대부분의 글로벌 IT업체가 인공지능 알고리즘과 플랫폼을 공개하고 있다. 인공지능을 도입하고자 하는 기업은 오픈소스화 된 알고리즘을 자유롭게 도입해서 쓸 수 있다. 하지만 공개된 오픈소스를 무작위로 도입해서는 목표한 사업의 성공을 기대하기란 어렵다.

이유는 추진하는 사업의 특성을 파악하고 거기에 맞는 오픈소스를 적용할 필요가 있으며, 필요할 경우 추가적으로 알고리즘을 개발해야 하기 때문이다. 이를 위해서는 인공지능에 대한 이해가 높은 개발자 및 기획자가 필요하다.

또한 기업의 의사결정 프로세스도 인공지능의 도입을 방해할 수 있다. 예를 들어 일반적으로 제품이나 서비스의 개발과정에서 개발될 대상을 명확히 파악하고 개발 과정을 세분화하는 것은 일반적인 프로세스로써 중요한 단계지만, 기계학습 기반 인공지능의 경우에는 상황이 다르다. 왜냐하면 AI 기술에는 일반적인 규칙이 없기 때문이다.

기계학습 기반 기술의 특징은 내부 구조가 블랙박스처럼 간주된다. AI 기술이 데이터로부터 학습되긴 하지만, 그 내부를 사람이 이해하는 것은 불가능하다. 단지 AI가 만들어내는 결과로부터 내부를 추정하는 것만이 가능하다. 마치 인간의 뇌를 해부한다고 해서 그 사람이 어떤 사람이고, 어떤 식으로 판단을 하는지 알 수 없는 점과 유사하다.

따라서 AI가 적용되는 상품 혹은 서비스마다 적절한 적용 방법이 필요하고, 이런 적용 방법을 찾는 것은 기계학습 방법에 대한 이해로부터 오는 직관과 경험에 의존하는 특징이 있다. 이런 특성 때문에 AI 사업 초기에는 계획 수립단계에서 결과를 정확히 예측하는 것이 어려울 뿐만 아니라 진행하면서 시행착오 역시 거쳐야 한다. 만약 AI 도입 과정에서 이 같은 과정이 반영되지 않는다면 제대로 된 성과를 내기 어려운 것이 AI 사업의 특성이다.

원하는 성능 내기 어려워

글로벌 IT 기업들은 경쟁적으로 AI 기술들을 오픈소스화 하고, 논문을 통해 알고리즘을 공개하고 있다. 일부에서는 인공지능 알고리즘의 소스코드가 공개돼 있기 때문에 누구나 조금의 노력만 투자한다면 인공지능 서비스를 만들 수 있다고 말한다. 하지만 조금만 더 생각해 보면 이상한 점을 발견할 수 있다.

영리기업들이 자사의 핵심기술을 공개한다는 것은 이치에 맞지 않는다. 이는 기업 입장에서 AI 알고리즘과 소스코드들보다 훨씬 중요한 것들이 있다는 것을 의미한다. 앞서 언급한 것처럼 인공지능의 개발에서 양질의 데이터는 다른 어떤 것보다 중요하다. 실제로 데이터를 확보한 AI 기업들은 인공지능 소스코드를 공개해도 자사의 핵심요소인 데이터를 공개하지 않고 있다.

이들 기업은 소스코드의 공개를 통해 학계나 타 기업의 인력을 통해 외부의 기술공급과 발전을 기대할 수 있다. 사실 공개한 인공지능 알고리즘을 가장 잘 이해하고 있는 인력을 이미 공개한 기업이 보유하고 있으며, 이 사실이 기술의 공개로 역전될 가능성이 없다는 점도 중요한 요소이다. 또한 인공지능 알고리즘은 그 자체보다 이를 적용하는 개발자의 능력에 크게 의존하기 때문이다. 결과적으로 오픈소스화 된 인공지능 기술은 누구나 가져다 쓸 수 있지만, 쓸 만한 성능을 내는 것은 누구나 할 수 없다.

정확한 AI 기술 이해로 현실적인 목표 수립 필요

비즈니스에서 인공지능의 도입을 성공적으로 이끄는 길은 멀리 있지 않다. 먼저 인공지능 기술에 대한 정확한 이해를 통해 실현 가능한 수준의 목표를 세우고 점진적으로 실현해 나가는 것이며, 다음으로는 인공지능에 대한 깊은 이해를 갖춘 인력의 확보가 뒤따라야 한다.

기업 내부의 역량 확보도 중요하지만, 이는 많은 시간이 소요될 수 있기 때문에 사업화를 위해 시장에서 검증된 와이즈넛과 같은 인공지능 전문 업체를 통한 것도 좋은 방안이다.

끝으로 충분한 양질의 데이터 확보와 이를 위한 자원의 투입이다. 데이터가 없는 경우의 머신러닝 기반 인공지능은 사상누각이나 다름없다. 만약 데이터가 부족하다면 데이터 확보를 위한 노력을 해나가거나, 기존의 규칙기반 방법론의 적용을 고려해야 한다.

데이터넷 다른기사 보기