twgo / siann1-hak8_boo5-hing5

聲學模型訓練
MIT License
1 stars 1 forks source link

8/9 接辨識流程筆記 #60

Open leo424y opened 6 years ago

leo424y commented 6 years ago

從 WAV 到 TXT 的流程

  1. 準備 Kaldi 辨識檔案 data/train http://kaldi-asr.org/doc/data_prep.html

  2. 服務來試,取得decode結果 輸入 exp/model data/train 輸出 exp/model/decode_hok8bu7_1

PS. 若兩音檔要組合,需有時間標記

辨識相關 steps 含 make_mfcc,compute_cmvn_stats, decode_fmllr

#!/bin/bash

. cmd.sh
. path.sh

# 服務來試.sh exp/model/graph_sp data/train exp/model/decode_hok8bu7_1

set -e # exit on error

tshi3=$3
(
  utils/utt2spk_to_spk2utt.pl $tshi3/utt2spk > $tshi3/spk2utt

  utils/fix_data_dir.sh  $tshi3

  mfccdir=$tshi3/mfcc
  make_mfcc_dir=$tshi3/make_mfcc/

  steps/make_mfcc.sh --nj 1 --cmd "$train_cmd" \
   $tshi3 $make_mfcc_dir $mfccdir
  steps/compute_cmvn_stats.sh $tshi3 $make_mfcc_dir $mfccdir
)
graph_dir=$1
decode_dir=$4
(
  steps/decode_fmllr.sh --nj 1 --cmd "$decode_cmd" \
    --config conf/decode.config \
    $graph_dir $tshi3 $decode_dir
)