Open hecongqing opened 3 months ago
这个数据是我们用于画 heatmap 的数据,不是必须的,这步使用的数据是由 extract 步骤产生的,也就是上面的 path,可以通过第一步 extract module 产生
谢谢, 还有一个问题
我看到第一步使用了这个权重 ,想请问下这个是来自于
还是bert-base-chinese
刑事文书 BERT
好的 我先试试
python selector_two_multi_class_ot_v3.py
请问下这个部分训练的参数可以提供下吗
parser.add_argument('--batch_size', type=int, default=128, help='batch size')
parser.add_argument('--epoch_num', type=int, default=40, help='number of epochs')
parser.add_argument('--each_test_epoch', type=int, default=1)
parser.add_argument('--lr', type=float, default=0.001, help='learning rate')
parser.add_argument('--weight_decay', type=float, default=0., help='decay weight of optimizer')
parser.add_argument('--model_name', type=str, default='bert', help='matching model')
parser.add_argument('--checkpoint', type=str, default="./weights/extract/", help='checkpoint path')
parser.add_argument('--max_length', type=int, default=512, help='max length of each case')
parser.add_argument('--input_size', type=int, default=768)
parser.add_argument('--hidden_size', type=int, default=384)
parser.add_argument('--kernel_size', type=int, default=3)
parser.add_argument('--threshold', type=float, default=0.3)
parser.add_argument('--cuda_pos', type=str, default='0', help='which GPU to use')
parser.add_argument('--max_seq_len', type=int, default=115, help='number of max seq length')
parser.add_argument('--coefficient', type=float, default=1., help='balance the dgcnn loss and the ot loss')
parser.add_argument('--coefficient_lrable', type=int, default=0, help='whether to use learnable') # [true / false]
parser.add_argument('--seed', type=int, default=42, help='which seed to use')
parser.add_argument('--early_stopping_patience', type=int, default=5, help='which seed to use')
parser.add_argument('--threshold_ot', type=float, default=1.25, help='threshold ot')
parser.add_argument('--f_mass', type=float, default=3, help='f mass')
parser.add_argument('--weight', type=float, default=100, help='weight')
parser.add_argument('--convert_to_onehot', type=int, default=1, help='convert to one hot') # [0, 1]
parser.add_argument('--ot_mode', type=str, default='max', help='ot mode') # [max, gumbel]
parser.add_argument('--reg', type=float, default=0.3, help='regular')
parser.add_argument('--model_usage', type=str, default='train', help='[train eval search]')
parser.add_argument('--four_class', type=int, default=1, help='if use ot loss') # [0, 1]
parser.add_argument('--cost_cal_way', type=str, default='class_embedding', help='[l2, attention, class_embedding]') # [l2, attention, class_embedding]
parser.add_argument('--loss_only_label1', type=int, default=0, help='if only optimizer 1') # [0, 1]
parser.add_argument('--criterion', type=str, default="BCEFocal", help='criterions:[BCEFocal, MSE, BCE]')
parser.add_argument('--simot', type=int, default=1, help='simot 0 false 1 true')
parser.add_argument('--simpercent', type=float, default=1, help='percent_label')
parser.add_argument('--class_mask_weight', type=float, default=0.01, help='class_mask_weight')parser.add_argument('--batch_size', type=int, default=128, help='batch size')
parser.add_argument('--epoch_num', type=int, default=40, help='number of epochs')
parser.add_argument('--each_test_epoch', type=int, default=1)
parser.add_argument('--lr', type=float, default=0.001, help='learning rate')
parser.add_argument('--weight_decay', type=float, default=0., help='decay weight of optimizer')
parser.add_argument('--model_name', type=str, default='bert', help='matching model')
parser.add_argument('--checkpoint', type=str, default="./weights/extract/", help='checkpoint path')
parser.add_argument('--max_length', type=int, default=512, help='max length of each case')
parser.add_argument('--input_size', type=int, default=768)
parser.add_argument('--hidden_size', type=int, default=384)
parser.add_argument('--kernel_size', type=int, default=3)
parser.add_argument('--threshold', type=float, default=0.3)
parser.add_argument('--cuda_pos', type=str, default='0', help='which GPU to use')
parser.add_argument('--max_seq_len', type=int, default=115, help='number of max seq length')
parser.add_argument('--coefficient', type=float, default=1., help='balance the dgcnn loss and the ot loss')
parser.add_argument('--coefficient_lrable', type=int, default=0, help='whether to use learnable') # [true / false]
parser.add_argument('--seed', type=int, default=42, help='which seed to use')
parser.add_argument('--early_stopping_patience', type=int, default=5, help='which seed to use')
parser.add_argument('--threshold_ot', type=float, default=1.25, help='threshold ot')
parser.add_argument('--f_mass', type=float, default=3, help='f mass')
parser.add_argument('--weight', type=float, default=100, help='weight')
parser.add_argument('--convert_to_onehot', type=int, default=1, help='convert to one hot') # [0, 1]
parser.add_argument('--ot_mode', type=str, default='max', help='ot mode') # [max, gumbel]
parser.add_argument('--reg', type=float, default=0.3, help='regular')
parser.add_argument('--model_usage', type=str, default='train', help='[train eval search]')
parser.add_argument('--four_class', type=int, default=1, help='if use ot loss') # [0, 1]
parser.add_argument('--cost_cal_way', type=str, default='class_embedding', help='[l2, attention, class_embedding]') # [l2, attention, class_embedding]
parser.add_argument('--loss_only_label1', type=int, default=0, help='if only optimizer 1') # [0, 1]
parser.add_argument('--criterion', type=str, default="BCEFocal", help='criterions:[BCEFocal, MSE, BCE]')
parser.add_argument('--simot', type=int, default=1, help='simot 0 false 1 true')
parser.add_argument('--simpercent', type=float, default=1, help='percent_label')
parser.add_argument('--class_mask_weight', type=float, default=0.01, help='class_mask_weight')
用了默认的参考,并将model_usage改成train, 代码不能运行
不能运行的原因有很多🙁,可能是环境问题等,毕竟代码是很早的了,要学会自己调试一下,适配到新的环境里~
想请问下代码运行的参数,想复现下代码
因为看到selector_two_multi_class_ot_v3.py很多超参数,希望您能提供下超参数
The parameters used in above code are shown in their own files as default parameters.
请问下这个中间的数据如何产生