Lmoer / tianchi-agricultural-semantic-segmentation

天池2019 年县域农业大脑AI挑战赛 第11名解决方案 deeplabv3-pytorch, crf等
24 stars 2 forks source link


Project

依赖项

conda create -n project python=3.6
source activate project
pip install torch==1.1.0或pip install http://mirrors.aliyun.com/pypi/packages/69/60/f685fb2cfb3088736bafbc9bdbb455327bdc8906b606da9c9a81bae1c81e/torch-1.1.0-cp36-cp36m-manylinux1_x86_64.whl
pip install torchvision==0.3.0或pip install http://mirrors.aliyun.com/pypi/packages/2e/45/0f2f3062c92d9cf1d5d7eabd3cae88cea9affbd2b17fb1c043627838cb0a/torchvision-0.3.0-cp36-cp36m-manylinux1_x86_64.whl
pip install pillow
pip install opencv-python

数据准备

提前解压image_1.png、image_2.png、image_3.png、image_4.png、image_1_label.png、 image_2_label.png放在data目录下。数据切割比较耗时,需要3个小时左右的时间,目录如下。

|–data

​ |-- model

​ |-- train

​ |--data

​ |--label

​ |-- test

​ |--image3

​ |--mask3

​ |--image4

​ |--mask4

​ |-- jingwei_round1_train_20190619/image_1.png

​ |-- jingwei_round1_train_20190619/image_2.png

​ |-- jingwei_round1_train_20190619/image_1_label.png

​ |-- jingwei_round1_train_20190619/image_2_label.png

​ |--jingwei_round1_test_a_20190619/image_3.png

​ |-- jingwei_round1_test_a_20190619/image_4.png

python generate_train_data.py
python generate_test_data.py

模型训练

(1)使用deeplabv3,交叉熵训练。优化器SGD

python train.py --train --exp bn_lr7e-3 --epochs 20 --base_lr 0.007

(2)使用deeplabv3,focalloss和lovasz_losses训练。优化器SGD

python train_focalloss.py --train --exp bn_lr7e-3 --epochs 20 --base_lr 0.007

focalloss,在训练时可以根据样本的学习难易程度调整样本的loss权重,使模型可以更加关注难学习的样本。

lovasz_losses :语义分割一般用IOU去衡量模型的表现,但IOU不是一个可导函数,利用IOU直接训练模型会导致训练过程的不稳定。一个模型从坏到好,我们希望监督它的loss/metric的过渡是平滑的,直接暴力套用IoU显然不行,怎么优化IOU一直是语义分割要面临的问题,一般的baseline论文一般通过优化cross entropy去优化IoU。但优化cross entropy并不等同于优化IoU。LovaszSoftmax可以作为IOU的替代目标函数。

github链接https://github.com/bermanmaxim/LovaszSoftmax

(3)使用deeplabv3,focalloss和lovasz_losses训练。基于余弦退火的SWA(随机梯度平均)优化器

基于余弦退火的SWA(随机梯度平均)优化器https://github.com/Lmoer/learn_blog/blob/master/lavz_loss%E4%BB%A5%E5%8F%8Aswa%E7%AC%94%E8%AE%B0.md

python train_swa.py --train --exp bn_lr7e-3 --epochs 30 --base_lr 0.007

(4)使用deeplabv3,focalloss和lovasz_losses训练。512 512, 448 448 多尺度交替训练。增强模型不同尺度的检测准确率

python train_multiscale.py --train --exp bn_lr7e-3 --epochs 30 --base_lr 0.007

(5)模型融合,投票。(使用backbone为resnet50,引入attention机制 的Unet 训练模型,以及deeplabv3模型的预测结果进行融合(文件夹Unet_resnet34/))

python vote.py

模型预测及预测结果拼接

python predict.py

图像后处理,填充空洞

python fill_hole.py

1

2

条件随机场后处理(pydensecrf)

CRF文件夹下