7.음성 포털은 들을 수 있지만 이해하지는 못한다
상태바
7.음성 포털은 들을 수 있지만 이해하지는 못한다
  • m business
  • 승인 2001.05.07 00:00
  • 댓글 0
이 기사를 공유합니다

음성 인식 기술
음성 인식 회사는 최대 90%의 정확성을 약속한다. 나는 이 말을 믿기가 어려워 직접 테스트해보기로 결정했다. 99년 도요타 캠리(Toyota Camry)에 시동을 걸고 캘리포니아 산타로사 근처로 차를 몰았다. 65마일로 운전하며 핸즈프리 장치와 베리즌의 퀄컴 휴대폰으로 서비스에 전화를 걸었다. 점수가 어떻게 나왔냐고? 도로의 소음 속에서 애니타와 텔미의 서비스는 엉뚱한 대답을 했고 비보컬은 요청을 무시했다. 적어도 북부 캘리포니아의 무선 기준을 고려할 때 연결 상태는 나쁘지 않았다. 놀라울 만큼 명확하게 서비스를 들을 수 있었다. 그러나 이들 서비스는 내 말을 이해할 수 없었다.

스피치웍스 음성 인식 장치가 지원하는 헤이애니타의 음성 서비스에 애리조나주 플래그스태프의 날씨를 물었을 때 이 서비스는 내가 들어본 적도 없는 어떤 버지니아주 마을의 날씨를 알려주었다. 산타로사에 있는 수퍼마켓에 대해 물었을 때, 뉴언스 음성 인식 장치가 지원하는 텔미의 음성 서비스는 7∼11 위치가 수없이 포함된 긴 목록을 읽기 시작했다. 마찬가지로 뉴언스에서 지원하는 비보컬의 음성 서비스에 캘리포니아 유키아의 날씨 정보와 캘리포니아 복권 결과를 요청했을 때 이 서비스는 “죄송하지만 이해하지 못했습니다”라고 말했다.

내 발음이 그렇게 나쁜가?
스프린트 PCS 터치포인트 휴대폰을 가지고 사무실로 돌아와서 조용한 책상에 앉아 다시 서비스에 전화를 걸었다. 이번에는 3번 중 2번 꼴로 내 말을 이해했다. 다른 1번의 경우에는 계속해서 말을 반복해야 했다. 이들 서비스의 성능은 거의 비슷한 수준이었다.

현재 내 휴대폰의 메모리에는 3개의 주요 서비스에 대한 전화 번호가 입력되어 있다. 과연 테스트하는 경우를 제외하고 내가 이러한 서비스를 사용하는 경우가 있을까? 시끄럽고 거친 고속도로에서 70마일로 운전하면서 텔미에 전화를 걸어 ‘주식 시세’고 말한다. 텔미 서비스가 회사 이름을 묻는다. 나는 ‘시스코’라고 대답한다. 텔미가 ‘죄송하지만 이해하지 못했습니다’라고 대답한다. 다시 휴대폰에 ‘시스코!’라고 소리친다. 결국 텔미는 발음이 비슷한 회사들을 보여주겠다고 말한다. 시스코 주식 시세를 알기 위해 전화를 건지 2분이 지났지만 결국 필요한 정보를 얻지 못하고 전화를 끊어버린다. @


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.