Open jojonki opened 5 years ago
Comprehensive evaluation of statistical speech waveform synthesis Thomas Merritt, Bartosz Putrycz, Adam Nadolski, Tianjun Ye, Daniel Korzekwa, Wiktor Dolecki, Thomas Drugman, Viacheslav Klimkov, Alexis Moinet, Andrew Breen, Rafal Kuklinski, Nikko Strom, Roberto Barra-Chicote SLT 2018. https://arxiv.org/abs/1811.06296
ベースライン
MUSHRA(MUltiple Stimuli with Hidden Reference and Anchor)評価
音声エラーの分析
MUSHRA評価
サマリはTable 2に,Fig 2, 4にも結果
Group A, Bは似たような傾向で,頑健さと再現性があるといえそう(統計検定アリ)
SPSSより,SSWSとハイブリッドが好まれる傾向がある
スピーチドメイン別結果
200発話に対する各エラー数をTable 4
SSWSの改善点
SSWSの改悪点
Table 5にはSSWSのaudio glitchをドメイン別にエラー分析
Podcastでも解説しました.https://anchor.fm/lnlp-ninja/episodes/ep20-Comprehensive-evaluation-of-statistical-speech-waveform-synthesis-e31pp2
Comprehensive evaluation of statistical speech waveform synthesis Thomas Merritt, Bartosz Putrycz, Adam Nadolski, Tianjun Ye, Daniel Korzekwa, Wiktor Dolecki, Thomas Drugman, Viacheslav Klimkov, Alexis Moinet, Andrew Breen, Rafal Kuklinski, Nikko Strom, Roberto Barra-Chicote
SLT 2018. https://arxiv.org/abs/1811.06296
概要
イントロ
AmazonのSSWS
評価
ベースライン
MUSHRA(MUltiple Stimuli with Hidden Reference and Anchor)評価
音声エラーの分析
実験結果
MUSHRA評価
サマリはTable 2に,Fig 2, 4にも結果
Group A, Bは似たような傾向で,頑健さと再現性があるといえそう(統計検定アリ)
SPSSより,SSWSとハイブリッドが好まれる傾向がある
スピーチドメイン別結果
音声エラーの分析
200発話に対する各エラー数をTable 4
SSWSの改善点
SSWSの改悪点
Table 5にはSSWSのaudio glitchをドメイン別にエラー分析
まとめ
コメント
用語