lidq92 / CNNIQA

[unofficial] CVPR2014-Convolutional neural networks for no-reference image quality assessment
163 stars 39 forks source link

请教您一个数据集读取的问题 #23

Closed lllllllllllll-llll closed 4 years ago

lllllllllllll-llll commented 4 years ago

为什么在进行model训练和测试的时候读取的图片都是distorted image呢?live里面一共982张图片,779张distorted image,其余混杂着reference image,为什么在训练测试model的时候要剔除这些reference image呢?这样对model训练是不是可以提升准确性呢?谢谢大佬回答。

lidq92 commented 4 years ago

@lllllllllllll-llll (982-779)/29=7, 你所说的982张图像中重复了7次参考图像,具体的是5种失真中压缩的两种失真各分了两组实验。 一般都是只用失真图像作训练的(跟模型准确率是否提升没有关系)。

如果你非要加上有标注的参考图像(实际上不算标注了,因为参考图像的dmos都是0了),可以只加上一组参考图像就行了(但如果没有特别的情况需要这么做的话,就是现行的779张图像就行了。),没必要重复7次。

我不清楚为什么有个别研究者要把这些参考图像算上,因为原数据集论文TIP2006作者写的也是779张图像。 如果重复7次的参考图像都算上的话,那么就会出现很多预测结果一样的结果,这个时候是可能导致你计算的指标偏更好的。