這項科學技術是北京時間3月28日的早間新聞,谷歌研究人員正在尋找機器合成聲音更自然的方法。 谷歌大腦和機器識別小組成員周二在博客上公布了如何使語音更具表現力。
周二早些時候,谷歌發布了從云拷貝到語音服務的測試版,提供了與谷歌助手一樣的語音合成服務。 雖然該服務使用的是deepmind的wavenet技術,但該技術也可以用于生成非常自然的聲音。
谷歌此次發表的從復制到語音服務的相關研究方法,可以通過需要語音控制和語音計算的設備、APP、數字化服務帶來更自然的語音。
谷歌研究人員最近發表了兩篇論文,提出了新的發音方法,并介紹了如何模仿語音語調和語調。 這兩篇論文的技術都基于tacotron 2。 這是去年12月出現的人工智能系統,利用神經互聯網進行訓練,模仿人類的聲音。
過去的tacotron大部分都能模擬人類的聲音,但無法模仿語言中的聲調和自然語調。 tacotron的共同發明者王玉軒這次參加了論文研究。 通過將人類的語音片段嵌入計算機的語音風格中,他們實現了對合成語音進行重音等效果。
另一篇論文的研究是在沒有監控訓練的情況下識別語音模式,模仿某種語音風格。
在同行業其他公司中,蘋果siri去年獲得了更具表現力的呼聲。 去年4月,亞馬遜alexa為語音APP開發者提供了ssml標簽,為助手的語音添加了停頓、輕言、小小感嘆詞等更加豐富的表達方式。
相關查詢
溫馨提示:尊敬的[]站點管理員,將本頁鏈接加入您的網站友情鏈接,下次可以快速來到這里更新您的站點信息哦!每天更新您的[“谷歌新研究:讓機器合成語音更加自然”]站點信息,可以排到首頁最前端的位置,讓更多人看到您站點的信息哦。
