Open xiaoshideta opened 1 month ago
4.3 测试mask_select_hint python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --lambda_mask=0.75 --select="min" --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --lambda_mask=1.0 --select="min" --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --lambda_mask=0.5 --select="min" --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.01 --distillation_flag=1 --lambda_mask=1.0 --select="min" --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=1.0 --distillation_flag=1 --lambda_mask=1.0 --select="min" --mask_single="mask_hint"
测试select_hint python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --lambda_mask=0.75 --select="min" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --lambda_mask=1.0 --select="min" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.01 --distillation_flag=1 --lambda_mask=1.0 --select="min" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=1.0 --distillation_flag=1 --lambda_mask=1.0 --select="min" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --lambda_mask=0.75 --select="max" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --lambda_mask=1.0 --select="max" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.01 --distillation_flag=1 --lambda_mask=1.0 --select="max" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=1.0 --distillation_flag=1 --lambda_mask=1.0 --select="max" --mask_single="hint"
4.5 python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --lambda_mask=0.9 --select="min" --losses loss1 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --lambda_mask=0.75 --select="min" --losses loss1 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --lambda_mask=0.5 --select="min" --losses loss1 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --lambda_mask=0.25 --select="min" --losses loss1 --mask_single="mask_hint"
4.7 KD+hint 不同层数 python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --losses loss1 --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --losses loss2 --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --losses loss3 --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --losses loss4 --mask_single="hint" 选择方法 python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --mask_single="hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="max" --mask_single="hint"
4.8 sunrgbd python -m torch.distributed.launch --nproc_per_node=8 sun_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.1 --distillation_flag=1 --select="min" --losses loss1 --mask_single="hint"
nyu 使用KD+hint(一层1×1+2层3×3) python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --lambda_mask=1.0 --mask_single="mask_hint"
使用KD+mask_hint python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --lambda_mask=0.9 --losses loss1 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --lambda_mask=0.9 --losses loss2 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --lambda_mask=0.9 --losses loss3 --mask_single="mask_hint"
4.9 nyu 使用KD+hint(一层1×1+2层3×3) python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --lambda_mask=1.0 --losses loss2 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --lambda_mask=1.0 --losses loss3 --mask_single="mask_hint"
使用KD+mask_hint python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --lambda_mask=0.9 --losses loss4 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="min" --lambda_mask=0.9 --mask_single="mask_hint"
4.9 sunrgbd python -m torch.distributed.launch --nproc_per_node=8 sun_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.0 --distillation_flag=1 --select="min" --losses loss1 --mask_single="hint"
nyu 使用KD+hint(一层1×1+2层3×3) python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="max" --lambda_mask=1.0 --mask_single="mask_hint"
使用KD+mask_hint python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --select="max" --lambda_mask=0.9 --mask_single="mask_hint"
4.10 sunrgbd python -m torch.distributed.launch --nproc_per_node=8 sun_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.01 --distillation_flag=1 --lambda_mask=1.0 --select="min" --losses loss1 --mask_single="mask_hint" python -m torch.distributed.launch --nproc_per_node=8 sun_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.05 --distillation_flag=1 --lambda_mask=1.0 --select="min" --losses loss1 --mask_single="mask_hint"
python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_flag=1 --lambda_mask=0.75 python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_flag=1 --lambda_mask=1.0 python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_flag=1 --lambda_mask=0.5 python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.01 --distillation_flag=1 --lambda_mask=0.75 python -m torch.distributed.launch --nproc_per_node=2 nyu_b4_train.py --port=29516 --distillation_alpha=1.0 --distillation_beta=0.01 --distillation_flag=1 --lambda_mask=1.0