twgo / siann1-hak8_boo5-hing5

聲學模型訓練

MIT License

1 stars 1 forks source link

整理這禮拜欲做的實驗 #51

Open sih4sing5hong5 opened 6 years ago

sih4sing5hong5 commented 6 years ago

先共表整理出來，我先幫你看

leo424y commented 6 years ago

alaw/mulaw 混合實驗預計如下，請隊長過目

模擬電話音8k/a-law

8k 處理方式：avconv 降成8k a-law

訓練\測試	仝8K	仝8K_alaw	仝8K_ulaw
8k	35.02(#92)	34.94(#101)
8k_alaw	37.26(#102)	36.71(#99)

模擬電話音8k/u-law

8k 處理方式：avconv 降成8k u-law

訓練\測試	仝8K	仝8K_alaw	仝8K_ulaw
8k	35.02(#92)
8k_ulaw

混合 a-law 與 u-law

8k 處理方式：avconv 降成8k a-law + u-law 混合

訓練\測試	仝8K	仝8K_alaw	仝8K_ulaw
8k	35.02(#92)
8k_aulaw

sih4sing5hong5 commented 6 years ago

頭前兩个表kap做伙，一个表就好

第三表應該是(包含第一二个表)

訓練\測試	仝8K	仝8K_alaw	仝8K_ulaw
8k	35.02(#92)
8k+8k_a
8k+8k_u
8k+8k_a+8k_u
8k_a
8k_u
8k_a+8k_u

leo424y commented 6 years ago

感謝整併！那麼兩份以上的語料 8k+8k_a, 8k+8k_u, 8k+8k_a+8k_u , 8k_a+8k_u 其處理方式應是將wav.scp 兩倍/三倍的量下去訓練

leo424y commented 6 years ago

以8k_a+8k_u為例目前腦袋的script長這樣，請隊長指導

RUN sed -z 's/\n/avconv -i - -f alaw -ar 8000 - | avconv -f alaw -ar 8000 -i - -f wav -ar 8000 - |\n/g' $KALDI_S5C/data/train/wav.scp > $KALDI_S5C/data/train/wav-alaw.scp
RUN sed -z 's/\n/avconv -i - -f mulaw -ar 8000 - | avconv -f mulaw -ar 8000 -i - -f wav -ar 8000 - |\n/g' $KALDI_S5C/data/train/wav.scp > $KALDI_S5C/data/train/wav-mulaw.scp
RUN cat $KALDI_S5C/data/train/wav-alaw.scp > $KALDI_S5C/data/train/wav.scp
RUN cat $KALDI_S5C/data/train/wav-mulaw.scp >> $KALDI_S5C/data/train/wav.scp