leeyeehoo / CSRNet-pytorch

CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes
642 stars 259 forks source link

问题 #51

Open eain3314 opened 5 years ago

eain3314 commented 5 years ago

首先。图像预处理是指将所有待训练和测试的图片根据标注的人头点的坐标生成对应的密度图,并与标注的人头总数一起作为ground-truth。训练阶段是指将所有的训练集(包括图像预处理生成的ground-truth)输送到以VGG16前十层作为前端的网络进行人头特征提取,然后将提取到的人头特征输送到空洞卷积神经网络的进行训练,最后通过提取出的人头位置特征生成对应的密度图。 麻烦看一下我理解的对吗?谢谢