반응형
구글, 말하는 사람의 성질을 유지한 채 변환할 수 있는 음성번역 기술 'Translatotron'
<기사에 의하면>
미국 Google은 15일(미국 시간), 텍스트화를 하지 않고 음성간의 직접 번역을 실현하는 번역 시스템 'Translatotron'을 발표했다.
음성번역에서는, 통상, 음성을 텍스트화하는 자동음성인식, 텍스트를 번역처 언어로 번역하는 기계번역, 번역 텍스트의 음성을 생성하는 텍스트 음성합성(TTS)이라고 하는 태스크 3개를 분할하고, 일련의 시스템으로서 동작시킨 (캐스케이드 변환)것으로 번역을 실현한다.
시스템은 태스크 분할을 피하는 것으로, 구래의 음성번역 시스템과 비교하고, 보다 빠른 추론 속도나, 음성인식과 번역간의 복합 에러 회피, 이름이나 고유명사 등 번역할 필요가 없는 단어의 취급 개선, 원래 말하는 사람 목소리를 유지한 번역 음성 생성을 가능하게 하는 이점이 있다고 한다.
반응형
'구글' 카테고리의 다른 글
구글이 영상에서 실시간으로 움직이는 인물을 지워 없애는 기술을 개발, 동영상 공개중 (0) | 2019.05.24 |
---|---|
구글, 화웨이에 대하여 스마트폰대상 소프트 제공을 정지 (0) | 2019.05.20 |
약 17000명 『포켓몬 GO』 『Ingress』 플레이어, 이벤트로 쓰레기 145톤을 모은다! (0) | 2019.05.06 |
유튜브 오리지널 작품, 비프리미엄 회원이라도 광고를 달아 무료 시청 가능 (0) | 2019.05.06 |
【구글】 10년전 사이트는 검색 결과에서 제외 (0) | 2019.05.03 |