IBM, 기업용 AI에 ‘프로젝트 디베이터’ NLP 기술 적용
상태바
IBM, 기업용 AI에 ‘프로젝트 디베이터’ NLP 기술 적용
  • 윤현기 기자
  • 승인 2020.03.11 14:47
  • 댓글 0
이 기사를 공유합니다

가장 까다로운 언어 요소 파악·분석 가능…보다 통찰력 있는 정보 활용 가능해져

[데이터넷] IBM은 복잡한 주제로 인간과 토론할 수 있는 인공지능(AI) 시스템 ‘프로젝트 디베이터(Project Debater)’의 핵심 자연어 처리(NLP: Natural Language Processing) 기술을 상용화해 기업용 인공지능인 IBM 왓슨에 통합한다고 11일 밝혔다.

IBM은 고객이 비즈니스에서 자연어를 보다 잘 활용할 수 있도록 올 한 해 동안 프로젝트 디베이터 기술들을 IBM 왓슨에 통합하는 작업을 진행한다.

프로젝트 디베이터 기술 중 하나인 ‘어드밴스드 센티멘트 애널리시스(Advanced Sentiment Analysis)’ 기술은 관용어나 구어적 표현을 식별하고 분석할 수 있다. ‘그다지 쓸모 있지 않다(hardly helpful)’ 또는 ‘몹시 난처하다(hot under the collar)’와 같은 표현은 알고리즘으로 파악하기 어렵기 때문에 AI 시스템에게는 넘기 힘든 산과 같았다.

왓슨 API로 제공되는 기술을 통해 기업은 이런 구어적 표현이 포함된 언어 데이터까지 분석이 가능해졌고, 이런 표현들이 사용되는 비즈니스 운영 전반에 대해 보다 전체적인 이해가 가능해졌다.

‘써머라이제이션(Summarization)’ 기술은 다양한 출처로부터 문자 데이터를 가져와 특정 주제에 관한 말과 글을 요약해 사용자에게 제공한다. 올해 그래미 시상식에서 이 기술의 초기 버전을 활용해 1800만 개가 넘는 기사, 블로그 및 약력을 분석해 수백 명의 그래미 아티스트 및 유명 인사에 대한 간단한 정보를 제공했다.

‘어드밴스드 토픽 클러스터링(Advanced Topic Clustering)’ 기술은 프로젝트 디베이터에서 얻은 인사이트로부터 사용자가 수집되는 데이터를 무리지어(cluster) 관련 정보의 유의미한 ‘토픽’을 생성한 다음 분석할 수 있게 한다. 올해 후반에 ‘IBM 왓슨 디스커버리(Watson Discovery)’에 통합될 이 기술은 분야별 전문가가 특정 비즈니스 또는 업종(예: 보험, 의료, 제조)의 언어를 반영하도록 토픽을 맞춤화하고 정밀 튜닝하는 것을 가능하게 한다.

IBM은 오래 전부터 컴퓨터 시스템이 정서, 방언, 억양 등을 포함한 인간의 언어를 더 빠르고 정확하게 학습, 분석, 이해하게 해주는 기술을 개발하면서 자연어 처리 분야를 선도해 왔다. IBM은 주로 IBM 리서치 연구소에서 개발한 자연어 처리 기술을 IBM 왓슨 제품을 통해 상용화하고 있는데, 문서 해독을 위한 ‘IBM 왓슨 디스커버리(Watson Discovery)’, 가상 에이전트인 ‘IBM 왓슨 어시스턴트(Watson Assistant)’, 고급 정서 분석용 ‘IBM 왓슨 내추럴 랭귀지 언더스탠딩(Watson Natural Language Understanding)’등이 여기에 포함된다.

롭 토마스 IBM 데이터 및 AI 총괄 사장은 “언어는 정보를 위한 도구일 뿐만 아니라 사상과 의견을 표현하는 수단”이라며 “이것이 우리가 프로젝트 디베이터에서 기술을 추출해 IBM 왓슨에 통합시킨 이유다. 이 기술들을 통해 기업들은 인간의 언어에서 더 많은 것을 파악, 분석, 이해할 수 있게 되고, 데이터에 담긴 지식을 활용하는 방법에 있어서도 진일보하게 됐다”고 말했다.

한편, IBM은 PDF, 계약서 등 각종 비즈니스 문서를 이해하는 기술도 AI 모델에 추가할 예정이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.