PaddlePaddle / PaddleSpeech

Easy-to-use Speech Toolkit including Self-Supervised Learning model, SOTA/Streaming ASR with punctuation, Streaming TTS with text frontend, Speaker Verification System, End-to-End Speech Translation and Keyword Spotting. Won NAACL2022 Best Demo Award.
https://paddlespeech.readthedocs.io
Apache License 2.0
10.55k stars 1.81k forks source link

[S2T]examples/wenetspeech/local/data.sh 脚本中会使用的 utils/make_filted_shard_list.py 脚本不存在 #3157

Open lemondy opened 1 year ago

lemondy commented 1 year ago

examples/wenetspeech/local/data.sh 脚本中如下代码会使用的 utils/make_filted_shard_list.py 脚本不存在untils目录下

https://github.com/PaddlePaddle/PaddleSpeech/blob/9c387577fd9758d04b43844f8297286632333bb3/examples/wenetspeech/asr1/local/data.sh#L93

zh794390558 commented 1 year ago

是的,目前脚本还有些问题,尚未放上去。@zxcd 可以把自己仓库的给了link在这里。

lemondy commented 1 year ago

请问examples/wenetspeech 这个demo 可以这个正常的train吗?当前正在下载wenetspeech 数据

zxcd commented 1 year ago

可以正常训练,这个脚本可以先参考这个:https://github.com/zxcd/PaddleSpeech/blob/单测/examples/wenetspeech/asr1/local/make_filted_shard_list.py

lemondy commented 1 year ago

可以正常训练,这个脚本可以先参考这个:https://github.com/zxcd/PaddleSpeech/blob/单测/examples/wenetspeech/asr1/local/make_filted_shard_list.py

ok,多谢,我来试试

lemondy commented 1 year ago

https://github.com/zxcd/PaddleSpeech/blob/baa4a0b1ab548653f21e85daf7b51231f5db23f2/examples/wenetspeech/asr1/local/data.sh#L77

@zxcd 你好,local/data.sh 77行 train_config 这个参数不存在,麻烦帮忙更新下

lemondy commented 1 year ago

我现在想要基于conformer_u2pp_online_wenetspeech 这个模型做微调,不知哪里有这个模型可用可训练的完整代码?

zxcd commented 1 year ago

https://github.com/zxcd/PaddleSpeech/blob/baa4a0b1ab548653f21e85daf7b51231f5db23f2/examples/wenetspeech/asr1/local/data.sh#L77

@zxcd 你好,local/data.sh 77行 train_config 这个参数不存在,麻烦帮忙更新下

这个可以简单的改成config_path 就可以用了

lemondy commented 1 year ago

https://github.com/wenet-e2e/wenet/issues/1397 看到wenetspeech 数据集团队开源仓库里面有个详细finetune 的示例,写的很清楚,供大家参考

Chuyaoyuan commented 1 year ago

@lemondy 问下你微调成功了吗,我也在跑examples/wenetspeech/asr1,目前在/data.sh 脚本stage 2处,报错:No module named 'paddlespeech.s2t.transform',在脚本的 python3 utils/compute_cmvn_stats.py 处,这个文件我重命名的utils下compute-cmvn-stats.py,不知道我这么做对不对

Chuyaoyuan commented 1 year ago

@lemondy 问下你微调成功了吗,我也在跑examples/wenetspeech/asr1,目前在/data.sh 脚本stage 2处,报错:No module named 'paddlespeech.s2t.transform',在脚本的 python3 utils/compute_cmvn_stats.py 处,这个文件我重命名的utils下compute-cmvn-stats.py,不知道我这么做对不对

@zh794390558 你好,麻烦问下 examples/wenetspeech 的训练或微调什么时候可以提供个完整能跑的流程啊,作为新人总是卡住,又没处找参考