에이아이더, AI 음성복제 솔루션 ‘와이즈클로닝 봇’ 출시
상태바
에이아이더, AI 음성복제 솔루션 ‘와이즈클로닝 봇’ 출시
  • 윤현기 기자
  • 승인 2019.04.29 11:31
  • 댓글 0
이 기사를 공유합니다

단 10분 내 사람 목소리 분석·복제 가능…모든 언어 적용 가능해 해외 시장 확대 용이

에이아이더(대표 김수화)는 인공지능 음성 복제 솔루션인 ‘와이즈클로닝 봇(Wise Cloning-Bot)’을 출시했다고 29일 밝혔다.

와이즈클로닝 봇은 인공지능을 통해 사람의 음성을 복제하는 서비스를 제공한다. 개인의 음색과 억양을 학습하는 인공지능 알고리즘을 통해 음성이 재현된다. 시그널을 통해 음성의 인식과 재현이 이뤄지기 때문에 언어에 대한 제약이 없다.

텍스트를 사람의 목소리로 바꿔주는 음성 복제의 기존 방식은 아파트 관리사무소와 지하철 등에서 흔히 듣던 기계음 안내 방송이 일반적이었다. 무엇보다 사람의 목소리를 단 시간 안에 분석하고 복제해 그 사람의 음성을 복제하는 것은 쉽지 않다.

회사 측은 와이즈클로닝 봇의 AI 기술이 자연스러운 음성 복제의 길을 열었다고 강조했다. 와이즈클로닝 봇은 집대성 된 음성 정보를 전이학습하며, 특정 사람의 목소리 특성의 파라미터를 딥러닝 기술로 추출하고 패턴화해 인식 및 합성한다. 텍스트는 와이즈클로닝 봇을 통해 인식된 목소리로 변환돼 들려진다.

일반적인 음성 복제에 필요한 분석과 합성의 시간은 4시간 정도이지만, 에이아이더는 음성 분석과 합성의 시간을 10분으로 단축하면서 시장의 주목을 받고 있다. 10분 내 음성 분석·합성의 복제는 음성 복제 기술을 다양한 시장에 적용 가능케 할 것으로 예상된다.

에이아이더는 광고이미지와 모델의 적합도를 음성 복제 기술을 통해 사전에 시뮬레이션 및 체크하는 사업을 진행 중이다. 음성복제 기술로 광고에 나오는 대사를 사전에 모델 후보별로 시뮬레이션 하는 것이 가능하다. 광고 모델 음성을 10분 정도 학습하면 모델이 말하는 것과 동일한 음성을 얻을 수 있다.

엄마의 목소리로 아이에게 책을 읽어 주는 서비스, 기일에 부모님의 목소리로 이야기 듣기 등 적용 가능 영역은 무궁무진하다. 음성복제 기술은 특정 언어에만 국한되지 않고 모든 언어에 적용이 가능하기 때문에 해외로까지의 시장 확대가 용이한 기술이기도 하다.

에이아이더 김수화 대표는 “아직 사람의 감정을 완벽히 표현하지는 못 하지만, 앞으로 감정의 요소까지 딥러닝해 음성을 복제할 수 있게 될 것”이라며 “음성 합성·복제 서비스를 AI 스피커와 같이 실생활과 다양한 비즈니스 영역에서 쉽게 접할 수 있는 시기가 곧 다가 올 것이다”고 밝혔다.

한편, 에이아이더는 데이터 기반 디지털 혁신 전문 기업인 엠로의 자회사로, 기업 인공지능 도입에 필요한 컨설팅과 맞춤형 솔루션을 제공하고 있다. 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.