codecat0 / CV

本仓库将使用Pytorch框架实现经典的图像分类网络、目标检测网络、图像分割网络,图像生成网络等,并会持续更新!!!
214 stars 36 forks source link

SegNet模型保存 #2

Open hocken-li opened 2 years ago

hocken-li commented 2 years ago

您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)

codecat0 commented 2 years ago

多GPU训练时保存的模型会在每一个key前面加上module,你可以在载入时,通过切片的方式将其去掉,例如:key[7:],从索引7开始。如果只有一张卡,可以不用采用多GPU训练。

lan-mie-mie commented 1 year ago

请问训练时模型参数都设置的什么呢,epoch,batch_size,lr之类的我的loss一直在0.8下不来,一开始的训练时你们有用VGG16的模型权重吗

lan-mie-mie commented 1 year ago

您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)

请问训练时模型参数都设置的什么呢,epoch,batch_size,lr之类的我的损失一直在0.8下不来,一开始的训练时你有用VGG16的模型权重吗,我发现代码的命名结构跟VGG16的不一样,我自己改了下降到0.6就也降不下来了

hocken-li commented 1 year ago

@lan-mie-mie 不好意思,我的loss用的是自己的数据集train出来,原数据集我没有研究,模型参数只是按默认值跑了一下而已,给不了你建议

lan-mie-mie commented 1 year ago

好的,谢谢你的回复,打扰了,如果你还有关于segnet的程序的话可以方便共享给我吗,没有就算了 祝好运!

------------------ 原始邮件 ------------------ 发件人: "codecat0/CV" @.>; 发送时间: 2023年4月23日(星期天) 下午4:33 @.>; @.**@.>; 主题: Re: [codecat0/CV] SegNet模型保存 (Issue #2)

@lan-mie-mie 不好意思,我的loss用的是自己的数据集train出来,原数据集我没有研究,模型参数只是按默认值跑了一下而已,给不了你建议

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you were mentioned.Message ID: @.***>

codecat0 commented 1 year ago

Reference

没有使用

zhqssg commented 2 months ago

您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)

你好,你的这个问题解决了吗,我也遇到了这个情况

codecat0 commented 2 months ago

您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)

你好,你的这个问题解决了吗,我也遇到了这个情况

单卡的话 就不用使用torch.nn.DataParallel了,这个是使用多卡训练的;至于多卡训练的权重载入到单卡时,要将权重key中的module删除,你可以查查单卡如何载入多GPU训练的权重 1

zhqssg commented 2 months ago

您好,我在model_path导入ep050.pth的文件,但是他出现错误:KeyError: 'module.encoder.encode1.0.weight' 同时, ep050.pth在训练集与测试集loss均达0.05,但是,我用它predict的时候,只有一种颜色输出,甚至用训练集里的照片也是这样的结果 想请教一下: 请问是模型保存的出现问题了吗? 或者是torch.nn.DataParallel的问题吗?(我的cuda定义是True,但是我只有一张显卡;可是我cuda定义是False时是cpu训练,很慢)

你好,你的这个问题解决了吗,我也遇到了这个情况

单卡的话 就不用使用torch.nn.DataParallel了,这个是使用多卡训练的;至于多卡训练的权重载入到单卡时,要将权重key中的module删除,你可以查查单卡如何载入多GPU训练的权重 1

好的,谢谢