ETRI, 9개 언어 음성인식기 개발…실시간 문자 변환까지
상태바
ETRI, 9개 언어 음성인식기 개발…실시간 문자 변환까지
  • 윤현기 기자
  • 승인 2017.04.18 15:23
  • 댓글 0
이 기사를 공유합니다

변환 수준 최대 95%…통역·인공지능 비서·콜센터 서비스 등 활용 가능
▲ ETRI가 한국어, 영어뿐만 아니라 일본어, 중국어 등 9개 언어 음성을 인식하고, 실시간 문자로 변환해주는 기술 개발에 성공했다.

한국전자통신연구원(이하 ETRI)은 한국어, 영어뿐만 아니라 일본어, 중국어 등 9개 언어 음성을 인식하고, 실시간 문자로 변환해주는 기술 개발에 성공했다고 18일 밝혔다.

지원되는 언어는 한국어, 영어(북미식), 일본어, 중국어(북경 표준어), 프랑스어, 스페인어(유럽식), 독일어, 러시아어, 아랍어(MSA) 등 9개 언어다.

ETRI 측은 음성인식을 통한 변환 수준이 언어별 최대 95% 수준으로, 구글(Google) 등 세계적인 업체와 비교 시 한국어에서는 성능 우위를 점하고 다른 언어에서는 대등한 수준이라는 설명이다.

ETRI 측은 인식기 개발이 일상 대화체의 연속 발화가 가능해 향후 통역은 물론, 인공지능 비서, 방송 자막, 콜센터 서비스 등에 활용이 가능할 것으로 보고 있다. 특히 음성인식 기술이 급격히 확산되고 있는 스마트폰을 비롯해 스마트 스피커, 스마트 홈 허브 기능을 가지는 셋톱박스, 냉장고, TV 등의 스마트 가전에 유용할 것으로 내다봤다.

ETRI는 기술 개발을 위해 딥 러닝 기술과 대용량 데이터 자동 정제기술, 다국어 발음 생성기술 등을 활용했다. 또한 이번 개발을 통해 다국어 음성언어처리 핵심기술도 확보, 추후 동남아, 힌디어 등 타 언어로 쉽게 확대가 가능할 것으로 보고 있다.

현재 국내에는 ETRI와 같이 다국어 음성 데이터(DB)와 말뭉치로 불리는 음성 텍스트의 다국어 데이터(DB)를 보유한 곳이 없어 이를 기반으로 개발된 다국어 음성인식기를 필요로 하는 기업에 큰 도움이 될 것으로 기대된다.

ETRI는 향후 음성인식 기술을 필요로 하는 국내 이동통신업체를 비롯해 주요 포털, 음성인식엔진 기술을 상용화하고 있는 기업체에 기술 이전할 예정이다.

김상훈 ETRI 음성지능연구그룹 프로젝트 리더는 “향후 기술 고도화를 통해 경쟁력을 높이고, 지원 언어를 확대해 국내 업체들의 글로벌 시장 진출에 있어 든든한 버팀목이 되겠다”고 밝혔다.

ETRI는 해당 기술을 내년 평창 동계올림픽 자동 통·번역 서비스 부문 공식 후원사인 한글과컴퓨터와 함께 ‘지니톡’ 자동통역 서비스에 적용해 시범서비스 중이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.