Open sih4sing5hong5 opened 6 years ago
alaw/mulaw 混合實驗預計如下,請隊長過目
8k 處理方式:avconv 降成8k a-law
訓練\測試 | 仝8K | 仝8K_alaw | 仝8K_ulaw |
---|---|---|---|
8k | 35.02(#92) | 34.94(#101) | |
8k_alaw | 37.26(#102) | 36.71(#99) |
8k 處理方式:avconv 降成8k u-law
訓練\測試 | 仝8K | 仝8K_alaw | 仝8K_ulaw |
---|---|---|---|
8k | 35.02(#92) | ||
8k_ulaw |
8k 處理方式:avconv 降成8k a-law + u-law 混合
訓練\測試 | 仝8K | 仝8K_alaw | 仝8K_ulaw |
---|---|---|---|
8k | 35.02(#92) | ||
8k_aulaw |
頭前兩个表kap做伙,一个表就好
第三表應該是(包含第一二个表)
訓練\測試 | 仝8K | 仝8K_alaw | 仝8K_ulaw |
---|---|---|---|
8k | 35.02(#92) | ||
8k+8k_a | |||
8k+8k_u | |||
8k+8k_a+8k_u | |||
8k_a | |||
8k_u | |||
8k_a+8k_u |
感謝整併! 那麼兩份以上的語料 8k+8k_a, 8k+8k_u, 8k+8k_a+8k_u , 8k_a+8k_u 其處理方式 應是將wav.scp 兩倍/三倍的量下去訓練
以8k_a+8k_u為例 目前腦袋的script長這樣,請隊長指導
RUN sed -z 's/\n/avconv -i - -f alaw -ar 8000 - | avconv -f alaw -ar 8000 -i - -f wav -ar 8000 - |\n/g' $KALDI_S5C/data/train/wav.scp > $KALDI_S5C/data/train/wav-alaw.scp
RUN sed -z 's/\n/avconv -i - -f mulaw -ar 8000 - | avconv -f mulaw -ar 8000 -i - -f wav -ar 8000 - |\n/g' $KALDI_S5C/data/train/wav.scp > $KALDI_S5C/data/train/wav-mulaw.scp
RUN cat $KALDI_S5C/data/train/wav-alaw.scp > $KALDI_S5C/data/train/wav.scp
RUN cat $KALDI_S5C/data/train/wav-mulaw.scp >> $KALDI_S5C/data/train/wav.scp
先共表整理出來,我先幫你看