Open cantabile-kwok opened 2 years ago
超算好像对用户有cpu核数的限制,sbatch -c只能选择1。不过,即使只申请一个cpu核,好像也可以设置--nj不为1,这样的话应该是共用一个cpu核,实测需要八九个小时完成dev和test的decode(使用nj=4,a100),由于不太清楚这个ASR模型的decode效率,所以想问问这个速度是否与nj=1是类似的?有什么办法可以提高并行度嘛?
--nj
这个速度是正常的。如果是调试效果,可以尝试切出一个test set的子集,调试好后再在完整测试集上测试。
另外一个小建议:你可以看看里面有个config,是可以使用gpu做inference和decoding的(asr.sh中的gpu_inference),默认应该是关的,你可以设置打开看看decoding速度是否能提高
打开GPU开关应该能达到1h以内了
超算好像对用户有cpu核数的限制,sbatch -c只能选择1。不过,即使只申请一个cpu核,好像也可以设置
--nj
不为1,这样的话应该是共用一个cpu核,实测需要八九个小时完成dev和test的decode(使用nj=4,a100),由于不太清楚这个ASR模型的decode效率,所以想问问这个速度是否与nj=1是类似的?有什么办法可以提高并行度嘛?