X-LANCE / UniCATS-CTX-txt2vec

[AAAI 2024] CTX-txt2vec, the acoustic model in UniCATS
https://cpdu.github.io/unicats
57 stars 8 forks source link

feats.scp 区别 #7

Open gandolfxu opened 7 months ago

gandolfxu commented 7 months ago

feats/normed_fbank/eval_all/feats.scp 和 $syn_dir/feats.scp的 特征有什么区别?

如何获取normed_fbank对应的特征?

cantabile-kwok commented 7 months ago

normed_fbank/下面的feats.scp为80维的mel谱特征,而$syn_dir/feats.scp为CTX-txt2vec合成出来的特征,这是2维的VQ序列。

获取normed fbank可参考CTX-vec2wav下面的说明