NJU-LHRS / official-CMID

The official implementation of paper "Unified Self-Supervised Learning Framework for Remote Sensing Images".
80 stars 5 forks source link

求助MillionAID数据集的一些问题 #8

Closed wangjiawen-123 closed 1 year ago

wangjiawen-123 commented 1 year ago

作者你好,想请问一下MillionAID在链接打开以后,train只有1.82G,test分别有17个文件,每个大概8G,根据您下面所写预训练是在MillionAID的testset上的,请问您是用的这17个文件嘛?还需不需要额外的txt文件呢? MillionAID dataset: Please learn the details and download the dataset from MillionAID For pre-training, we utilize the test-set of MillionAID dataset and load the data by PyTorch ImageFolder 期待您的回复

pUmpKin-Co commented 1 year ago

Hi~我当初也注意到这个问题,MillionAID只有train数据是开放了标注的,test集是没有的,但由于CMID自监督训练无需标注,就使用了test部分,也就是17个文件,不需要txt文件,全部下载下来解压即可. 谢谢您对我们工作的关注!

pUmpKin-Co commented 1 year ago

Closed as long periods of inactivity, feel free to reopen if there is any problem.

HappyGoLucky6666 commented 3 months ago

作者你好,我对于MillionAID数据集也有一些疑问需要您的解答。我看到的该数据集也是包括一个训练集和17个测试集,和上面的这位老哥一样的应该。目前还在下载阶段,不过训练集较小已经下载好了。打开文件夹内部发现,您所说的train数据是开放了标注的其实就是把部分的、少量的图片分类存放起来是吗?里面并没有像其他数据集一样使用txt文件进行标注的文件吗?如果是我所说的情况的话,我在想那么不是不能够使用该数据集进行测试操作吗,毕竟他没有标记文件,无法使用其来进行模型的性能评价。这也是你们团队来使用其他数据集进行下游任务测试的原因吧。期待您的回复,谢谢!!!

Hi~我当初也注意到这个问题,MillionAID只有train数据是开放了标注的,test集是没有的,但由于CMID自监督训练无需标注,就使用了test部分,也就是17个文件,不需要txt文件,全部下载下来解压即可. 谢谢您对我们工作的关注!