bringtree / question_embedding

这个仓库的issues里记录了许多奇奇怪怪的东西(100+)。
1 stars 1 forks source link

kaldi 数据准备 #174

Open bringtree opened 5 years ago

bringtree commented 5 years ago

来源:https://blog.csdn.net/chinatelecom08/article/details/81252343

使用compute-mfcc-feats提取特征,生成对应的特征文件feats.ark; 使用copy-feats来拷贝特征文件,并创建特征的scp文件,生成feat.scp feat.ark ; 使用compute-cmvn-stats计算CMVN归一化,得到cmvn.scp cmvn.ark ; 使用apply-cmvn得到了applycmvn.ark文件; 使用splice-feats来继续变换特征 ,拼接相邻帧的特征; 使用transform-feats来进行特征转换,为了解码调用 ; 最后通过得到的transform.ark进行解码的操作,得到解码后的lattice文件 。

  1. 具体流程指令: 首先列出具体文件,这里我就按照自己的文件给出了,如果用别的,改相应文件就行了
  2. wav.scp(里面是保存了wav的绝对路径)
  3. final.mdl(训练模型得到的模型文件)
  4. final.mat(用来特征转换)
  5. HCLG.fst(fst文件,用于解码) 使用compute-mfcc-feats生成对应的特征文件feats.ark: compute-mfcc-feats --use-energy=false scp:wav.scp ark:feats.ark 使用copy-feats来拷贝特征文件,并创建特征的scp文件,生成feat.scp feat.ark copy-feats ark:feats.ark ark,scp:feat.ark,feat.scp 使用compute-cmvn-stats计算CMVN归一化,得到cmvn.scp cmvn.ark compute-cmvn-stats scp:feat.scp ark,scp:cmvn.ark,cmvn.scp 使用apply-cmvn,得到了applycmvn.ark文件 apply-cmvn scp:cmvn.scp scp:feat.scp ark:applycmvn.ark 使用splice-feats来继续变换特征 splice-feats --left-context=3 --right-context=3 ark:applycmvn.ark ark:splice.ark 使用transform来进行特征转换,为了解码调用 transform-feats final.mat ark:splice.ark ark:transform.ark 最后通过得到的transform.ark进行解码的操作,得到一个晶格文件 nnet-latgen-faster [options] <fst-in fsts-rspecifier>

    作者:Audior 来源:CSDN 原文:https://blog.csdn.net/chinatelecom08/article/details/81252343 版权声明:本文为博主原创文章,转载请附上博文链接!