Tele-AI / TeleSpeech-ASR

388 stars 37 forks source link

方言识别质量非常差 #33

Open dfengpo opened 1 week ago

dfengpo commented 1 week ago

我用一条包括粤语,普通话的录音进行识别 出来的结果质量非常差,出现英文单词的频率比较高,但是实际根本没有英文

TTTdas commented 2 days ago

我用一条包括粤语,普通话的录音进行识别 出来的结果质量非常差,出现英文单词的频率比较高,但是实际根本没有英文

如果您用的是开源出来的那个微调模型,确实不太支持粤语哈。那个模型就是简单的在kespeech上微调的,里面不包含粤语的标注数据