今天小編分享的互聯網經驗:微軟推出語音合成模型 NaturalSpeech2,歡迎閲讀。
品玩 7 月 27 日訊,據微軟官方消息,微軟推出一款名為 NaturalSpeech2 的語音模型,可帶來高質量的語音合成產品。
微軟表示,NaturalSpeech2 可以生成具有不同身份的人聲語音,擁有不同的韻律和風格,還具備唱歌能力。
實驗結果表明,NaturalSpeech2 在零樣本條件下生成的語音與語音提示和真實語音的韻律近乎一致,并且在 LibriTTS 和 VCTK 測試集上的自然度(以 CMOS 為度量)與真人語音難以區分。