Candy-CY / Hyperspectral-Image-Classification-Models

收录及复现的高光谱遥感图像分类模型
523 stars 69 forks source link

数据划分 #5

Open wang-chuanzhi opened 10 months ago

wang-chuanzhi commented 10 months ago

你好,有个问题想请教一下,在创建高光谱图像的3D cube的时候,数据是有重叠部分的,比如贵代码mydata.py的createImageCubes函数中,这样在训练集和测试集划分之后,两者之间的数据有重叠,训练集能够看到测试集的数据,请问这个问题怎么解决或者解释?

Candy-CY commented 10 months ago

你好,重叠的部分确实是涉及到了数据信息泄露的问题,我目前也在针对这个问题进行思考研究。一种解决的方法就是使用Disjoint训练集和测试集,比如Houston2013,有标准的训练集和测试集,可以在一定程度上缓解这一问题。还有这篇论文也提出了一个解决的思路,感兴趣的话可以看看。 NALEPA J, MYLLER M, KAWULOK M. Validating hyperspectral image segmentation[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(8) : 1264 – 1268.

在 2023-11-23 10:45:56,"wang-chuanzhi" @.***> 写道:

你好,有个问题想请教一下,在创建高光谱图像的3D cube的时候,数据是有重叠部分的,比如贵代码mydata.py的createImageCubes函数中,这样在训练集和测试集划分之后,两者之间的数据有重叠,训练集能够看到测试集的数据,请问这个问题怎么解决或者解释?

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

wang-chuanzhi commented 10 months ago

好的,感谢解答!