CalayZhou / MBNet

Improving Multispectral Pedestrian Detection by Addressing Modality Imbalance Problems (ECCV 2020)
103 stars 30 forks source link

Kaist数据预处理,如何得到kaist_train_data.npy #22

Open liushhAlex opened 3 years ago

liushhAlex commented 3 years ago

同学您好!我有两个数据预处理的问题想请教:

  1. 论文中提到使用AR-CNN中的重新标注的kaist-pair矩形框标注进行训练,我去下载了AR-CNN公开的kaist-pair标注,发现和您提供 "./data/cache/kaist_train_data.npy" 输出的矩形框信息不一致,想请问一下您是如何基于kaist-pair得到kaist_train_data.npy当中的'bboxes'信息呢,能否可以公开数据预处理的代码?
  2. 我看到您提供的CVC4_txt_to_numpy.txt,其中以rgb图的矩形框作为输入网络的真值框,而注释掉的代码采用红外图和rgb图矩形框平均作为输入网络的真值框,我想请问您设计的原理是什么呢? 如果能回复我,不胜感激~
CalayZhou commented 3 years ago

同学您好,kaist_train_data.npy标签是AR-CNN公开的kaist-pair标注中RGB与红外标签的平均,处理方式也即CVC4_txt_to_numpy.txt注释掉的代码,因为CVC14中有一段视频红外与RGB图像严重不对齐(约有300帧),甚至会有RGB出现了行人而红外没有出现行人的情况,因此不能采用标签平均的方式,采用把RGB标签作为训练目标,而红外作为一个辅助参考的方式。

liushhAlex commented 3 years ago

非常感谢您的回复!谢谢

zhen256 commented 2 years ago

您好,请问一下这个怎么解决?failed to run cuBLAS routine: CUBLAS_STATUS_EXECUTION_FAILED