Open rild opened 7 years ago
一晩で Attention ネットワークの学習を終えることができる
品質は完璧ではないので、ハイパーパラメータの調整や、DL のテクニックを使って品質の改善ができるかも
今後の展望 emotional/non-linguistic/personalized speech synthesis singing voice synthesis music synthesis etc.
attention の学習に時間がかかる → Guided Attention Loss を計算する?ことで高速化
RNN:
a vanilla encode-decoder model cannot encode too long se- quence into a fixed-length vector effectively
https://arxiv.org/abs/1710.08969
ダウンロードした