粤语或者闽南语直接可用 asr 模型

Tele-AI / TeleSpeech-ASR

388 stars 37 forks source link

Open pengzhendong opened 1 month ago

pengzhendong commented 1 month ago

请问有计划开源开源30万小时训练的直接可用的asr模型吗？kespeech 支持的方言都是北方的方言，对南方小伙伴不太友好。

dfengpo commented 1 week ago

确实是，方言识别效果很差

TTTdas commented 2 days ago

请问有计划开源开源30万小时训练的直接可用的asr模型吗？kespeech 支持的方言都是北方的方言，对南方小伙伴不太友好。

这个是在计划中的，后面会陆续开源各种直接可用的模型~

TTTdas commented 2 days ago

确实是，方言识别效果很差

目前开源出来的微调过的模型是利用kespeech的标注数据训的，很多方言都不太支持哈。可以基于开源的无监督预训练模型，添加少量目标方言去微调，就可以达到很好的性能