twgo / siann1-hak8_boo5-hing5

聲學模型訓練
MIT License
1 stars 1 forks source link

整理這禮拜欲做的實驗 #51

Open sih4sing5hong5 opened 6 years ago

sih4sing5hong5 commented 6 years ago

先共表整理出來,我先幫你看

leo424y commented 6 years ago

alaw/mulaw 混合實驗預計如下,請隊長過目

模擬電話音8k/a-law

8k 處理方式:avconv 降成8k a-law

訓練\測試 仝8K 仝8K_alaw 仝8K_ulaw
8k 35.02(#92) 34.94(#101)
8k_alaw 37.26(#102) 36.71(#99)

模擬電話音8k/u-law

8k 處理方式:avconv 降成8k u-law

訓練\測試 仝8K 仝8K_alaw 仝8K_ulaw
8k 35.02(#92)
8k_ulaw

混合 a-law 與 u-law

8k 處理方式:avconv 降成8k a-law + u-law 混合

訓練\測試 仝8K 仝8K_alaw 仝8K_ulaw
8k 35.02(#92)
8k_aulaw
sih4sing5hong5 commented 6 years ago

頭前兩个表kap做伙,一个表就好

第三表應該是(包含第一二个表)

訓練\測試 仝8K 仝8K_alaw 仝8K_ulaw
8k 35.02(#92)
8k+8k_a
8k+8k_u
8k+8k_a+8k_u
8k_a
8k_u
8k_a+8k_u
leo424y commented 6 years ago

感謝整併! 那麼兩份以上的語料 8k+8k_a, 8k+8k_u, 8k+8k_a+8k_u , 8k_a+8k_u 其處理方式 應是將wav.scp 兩倍/三倍的量下去訓練

leo424y commented 6 years ago

以8k_a+8k_u為例 目前腦袋的script長這樣,請隊長指導

RUN sed -z 's/\n/avconv -i - -f alaw -ar 8000 - | avconv -f alaw -ar 8000 -i - -f wav -ar 8000 - |\n/g' $KALDI_S5C/data/train/wav.scp > $KALDI_S5C/data/train/wav-alaw.scp
RUN sed -z 's/\n/avconv -i - -f mulaw -ar 8000 - | avconv -f mulaw -ar 8000 -i - -f wav -ar 8000 - |\n/g' $KALDI_S5C/data/train/wav.scp > $KALDI_S5C/data/train/wav-mulaw.scp
RUN cat $KALDI_S5C/data/train/wav-alaw.scp > $KALDI_S5C/data/train/wav.scp
RUN cat $KALDI_S5C/data/train/wav-mulaw.scp >> $KALDI_S5C/data/train/wav.scp