Open jaseleephd opened 4 years ago
Score model with 6 layers
python run_ebm.py --opt_dtok wmt14_fair_ende --opt_batchtokens 8192 --opt_distill --opt_scorenet --train --tensorboard --opt_modeltype fakegrad --opt_train_delta_steps 4 --opt_hiddensz 512 --opt_embedsz 512 --opt_priorl 6 --opt_decoderl 6 --opt_heads 8 --opt_fixbug2 --opt_direction_n_layers 6 --opt_ebm_lr 0.0001 --opt_train_sgd_steps 1 --opt_train_step_size 1.0
Score model with 5 layers
python run_ebm.py --opt_dtok wmt14_fair_ende --opt_batchtokens 8192 --opt_distill --opt_scorenet --train --tensorboard --opt_modeltype fakegrad --opt_train_delta_steps 4 --opt_hiddensz 512 --opt_embedsz 512 --opt_priorl 6 --opt_decoderl 6 --opt_heads 8 --opt_fixbug2 --opt_direction_n_layers 5 --opt_ebm_lr 0.0001 --opt_train_sgd_steps 1 --opt_train_step_size 1.0
Score model with 6 layers
Score model with 5 layers