분산 음성인식이란?
상태바
분산 음성인식이란?
  • 배영우 한국IBM 소프트웨어연구소 차장
  • 승인 2001.11.21 00:00
  • 댓글 0
이 기사를 공유합니다

음성인식 기술은 문자나 터치방식에 의한 1차적인 편리성에서 벗어나 고차원적인 수준에 도전, 우리의 실생활과 다양하게 접목되고 있다.

이처럼 다양한 분야에서의 음성인식 기술과 실생활의 접목으로 말 한마디면 모든 것이 통하는 세상의 도래가 멀지 않은 가운데 디지털 소리혁명이 펼쳐지고 있다. <편집자>

필자는 요즘 새로 산 포켓PC를 가지고 여러 가지 다양한 용도에 관해 궁리를 해보았다. 역시 많이 사용해 손에 익혀야 능숙하게 필기체 인식도 시킬 수 있고 소프트 키보드도 사용해 입력을 수월하게 할 수 있는 듯하다.

무엇보다 PDA에 일정 관리라던가 메모장 등의 기능을 자주 써야 수첩 대용으로도 활용하는데 습관이 되고 좀 더 일상 활동에 적극적으로 이용할 수 있고, 이것을 응용해 현재의 한계를 극복하고 기능을 더 확장하는 방법은 없는 지에 관한 아이디어도 생길 것이다.

이러한 측면에서 음성 인식이란 기능을 이용하는 사용자로서 지난 호에서 살펴보았듯이 장치의 한계성으로 인해 갖는 여러 가지 상황을 극복하는 방법에 대해 궁리를 해보았다.

분산 음성인식이란?

PDA도 PC에서의 경우와 같이 급속도로 발전해 계산능력과 저장능력 및 메모리의 크기가 많이 향상되기는 했으나 이동 중의 사용이라는 특수한 목적으로 앞으로도 기능에 제한이 있으리라는 것은 분명할 것으로 보인다. 이러한 점 때문에 컴퓨터 환경과 더불어 급속도로 발전하고 있는 무선 네트워크 환경에 관심이 가고 사람들이 많이 기대를 하게 되는 것이 아닌가 하는 생각이 든다.

빠른 속도와 안정성을 보장하는 무선 네트워크 환경이라면 PDA와 같은 모바일 컴퓨터가 그 자체의 컴퓨팅 파워만을 이용해 모든 기능을 수행하는 것이 아니라 서버나 데스크탑 PC와 같은 고성능의 컴퓨터와 연결되어 역할을 분담하는 것이 가능하지 않을까 하는 것이다.

이러한 측면에서 현재까지 눈부시게 발전된 컴퓨팅과 무선 네트워크 통신의 결합은 우리에게 새로운 방식의 컴퓨팅 환경을 가능하게 해준다. 그리고 이것은 음성인식 기능을 이용하는 모바일 컴퓨팅 환경의 사용자에게 큰 이익을 가져다 줄 수 있는 가능성을 내포하고 있다고 하겠다.

지금 바로 언급한 컴퓨터와 무선 네트워크 통신을 이용해 PDA가 가지는 한계성을 극복하고 음성인식 기능을 구현하자는 것이 바로 분산 음성인식(Distributed Speech Recognition)인 것이다.

분산 음성인식과 무선 네트워크 기술 접목

분산 음성인식은 음성인식을 위한 다단계 프로세스 중에서 일부는 모바일 컴퓨터 장치에서 하고, 나머지 작업은 컴퓨팅 파워가 좋은 서버에서 수행하게 한 다음 그 결과를 다시 모바일 컴퓨터가 받아 사용자에게 결과를 전달하는 일련의 작업인 것이다.

여기서 중요한 점은 사용자는 컴퓨터가 음성인식을 위해 어떠한 작업을 수행하는 지를 인지할 필요 없이 마치 모바일 컴퓨터에서 모든 작업이 이뤄져 음성이 인식된 결과를 받아 보게 된다는 것이다.

현재의 무선 네트워크 기술 중에서 블루투스(Bluetooth)를 간단히 살펴보자.

이 기술을 사용하는 장치는 단지 0.1W의 전원이 있으면 되고, 컴퓨팅과 통신을 동시에 지원하도록 설계됐기 때문에 높은 품질의 음성과 데이터가 동시에 전달되는 속도를 721Kbps까지 낼 수 있다.

또한 히든 컴퓨팅(Hidden computing) 사용 모델이 적용되도록 한 구조 때문에 사용자의 눈에 띄지 않는 컴퓨터와 사용자의 모바일 기기와 자동으로 연결이 되어 작업을 수행하는 것이 가능하게 한다.

따라서 이러한 블루투스의 기술 특성이 여러 무선 네트워크 기술 중에서 좀 더 분산 음성인식에 적합하다고 할 수 있겠다. 물론 구현하기에 따라서 다른 무선 네트워크 기술도 충분히 실현 가능하다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.