Open liuzhipengchd opened 2 weeks ago
https://github.com/PaddlePaddle/PaddleNLP/blob/34a71c8242691874b711832e51f60507a8090124/paddlenlp/transformers/ernie/configuration.py#L1291 需要在这里定义 self.enable_recompute = enable_recompute,默认 enable_recompute=False
https://github.com/PaddlePaddle/PaddleNLP/commit/ae02a3c1a2fcdc8d1f24fe9c989fa345b7644f0c 我们在这个commit id修复这个问题,考虑到部分模型没有办法使用recompute策略,我们禁用了recompute策略。
ae02a3c 我们在这个commit id修复这个问题,考虑到部分模型没有办法使用recompute策略,我们禁用了recompute策略。
你好,我还想问个问题,在使用ranking/cross_encoder的时候,这个单塔的对于文本的先后顺序有点太敏感了。。同一对文本,改变先后顺序,计算的得分差异有点大。。有什么办法可以解决?(采用双塔可以吗)
软件环境
重复问题
错误描述
稳定复现步骤 & 代码
'''执行命令 python3 -u -m paddle.distributed.launch --gpus "1,3" \ train_batch_neg.py \ --device gpu \ --save_dir ./checkpoints_medicine/ \ --batch_size 64 \ --learning_rate 5E-5 \ --epochs 3 \ --output_emb_size 1024 \ --model_name_or_path ernie-3.0-base-zh \ --save_steps 10 \ --max_seq_length 64 \ --margin 0.2 \ --train_set_file /root/train_data/medicine/train_supervised.csv \ --recall_result_dir "recall_result_dir" \ --recall_result_file "recall_result.txt" \ --hnsw_m 100 \ --hnsw_ef 100 \ --recall_num 50 \ --similar_text_pair_file "/root/train_data/search/supervised/dev.csv" \ --corpus_file "/root/train_data/search/supervised/corpus.csv" '''