Tele-AI / TeleSpeech-ASR

388 stars 37 forks source link

粤语或者闽南语直接可用 asr 模型 #26

Open pengzhendong opened 1 month ago

pengzhendong commented 1 month ago

请问有计划开源开源30万小时训练的直接可用的asr模型吗?kespeech 支持的方言都是北方的方言,对南方小伙伴不太友好。

dfengpo commented 1 week ago

确实是,方言识别效果很差

TTTdas commented 2 days ago

请问有计划开源开源30万小时训练的直接可用的asr模型吗?kespeech 支持的方言都是北方的方言,对南方小伙伴不太友好。

这个是在计划中的,后面会陆续开源各种直接可用的模型~

TTTdas commented 2 days ago

确实是,方言识别效果很差

目前开源出来的微调过的模型是利用kespeech的标注数据训的,很多方言都不太支持哈。可以基于开源的 无监督预训练 模型,添加少量目标方言去微调,就可以达到很好的性能