Closed wxy0505 closed 1 year ago
我在训练完模型后导出的图的cer跟评估的cer不一样,我要如何拿到我评估的cer这个值的曲线图
导出什么图?训练时的评估cer是贪心解码,eval评估的默认是集束搜索解码
训练完不是有个loss和cer图吗,那训练的评价可以改成集合授索解析吗?
训练的评价可以用集合授索的吗?
如果你是使用Windows的,本身就不支持几束搜索解码,所以改不改都是一样
我用的Unbutu
那个加预训练模型和不加预训练模型差别大吗?我刚才把训练的模型当作预训练模型训练了一会,但发现速度特别慢;
你训练的模型当作预训练模型
这个跟是否是用预训练模型无关,是模型配置变了,
好的,哥我之前看你没更新之前是conformer-online的效果要好点,但我今天看你更新的是conformer-offline的效果好了,我现在要重新训练,所以想问问您我要用那个去训练,会有更好的效果,在AISHELL数据集上
差不多。
好的,谢谢
哥,有没有什么办法可以解决多线程的问题,我用多线程时它训练两轮就会卡死,但不用多线程训练一次要100多天,就一个AISHELL数据集,而且batch_size我还是调的32,有没有什么办法可以解决?
读取 数据默认就是4个线程的。
batchsize设置大,可能会爆显存
我用4线程都会爆显存
我之前也试着调小过,但发现都用不了那个多线程
显存只跟batchsize和模型大小有关
好的,我试试8跟4
这个语言模型是在预测解码的使用使用的,不是作为预训练模型的。