Open hocken-li opened 2 years ago
多GPU训练时保存的模型会在每一个key前面加上module,你可以在载入时,通过切片的方式将其去掉,例如:key[7:],从索引7开始。如果只有一张卡,可以不用采用多GPU训练。
请问训练时模型参数都设置的什么呢,epoch,batch_size,lr之类的我的loss一直在0.8下不来,一开始的训练时你们有用VGG16的模型权重吗
您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)
请问训练时模型参数都设置的什么呢,epoch,batch_size,lr之类的我的损失一直在0.8下不来,一开始的训练时你有用VGG16的模型权重吗,我发现代码的命名结构跟VGG16的不一样,我自己改了下降到0.6就也降不下来了
@lan-mie-mie 不好意思,我的loss用的是自己的数据集train出来,原数据集我没有研究,模型参数只是按默认值跑了一下而已,给不了你建议
好的,谢谢你的回复,打扰了,如果你还有关于segnet的程序的话可以方便共享给我吗,没有就算了 祝好运!
------------------ 原始邮件 ------------------ 发件人: "codecat0/CV" @.>; 发送时间: 2023年4月23日(星期天) 下午4:33 @.>; @.**@.>; 主题: Re: [codecat0/CV] SegNet模型保存 (Issue #2)
@lan-mie-mie 不好意思,我的loss用的是自己的数据集train出来,原数据集我没有研究,模型参数只是按默认值跑了一下而已,给不了你建议
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you were mentioned.Message ID: @.***>
Reference
没有使用
您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)
你好,你的这个问题解决了吗,我也遇到了这个情况
您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)
你好,你的这个问题解决了吗,我也遇到了这个情况
单卡的话 就不用使用torch.nn.DataParallel了,这个是使用多卡训练的;至于多卡训练的权重载入到单卡时,要将权重key中的module删除,你可以查查单卡如何载入多GPU训练的权重
您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)
你好,你的这个问题解决了吗,我也遇到了这个情况
单卡的话 就不用使用torch.nn.DataParallel了,这个是使用多卡训练的;至于多卡训练的权重载入到单卡时,要将权重key中的module删除,你可以查查单卡如何载入多GPU训练的权重
好的,谢谢
您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)