Closed SwaggyZhang closed 11 months ago
您的复现中可能存在以下问题: 1.pre-train.py是在整个数据集上预训练的,修改shotnum需要在下游上修改 2.论文中并没有使用交叉验证的方式来获取最终结果 3.根据您所用的机器和实验环境,超参数需要进行适当调整
您的复现中可能存在以下问题: 1.pre-train.py是在整个数据集上预训练的,修改shotnum需要在下游上修改 2.论文中并没有使用交叉验证的方式来获取最终结果 3.根据您所用的机器和实验环境,超参数需要进行适当调整
感谢您在百忙之中的耐心解答!
关于交叉验证,我是直接以prompt_fewshot.py
中line 465
的acc计算方法为准的,并未做自定义改动。
请问您是以这个结果为准,还是以其他结果为准呢?
您的复现中可能存在以下问题: 1.pre-train.py是在整个数据集上预训练的,修改shotnum需要在下游上修改 2.论文中并没有使用交叉验证的方式来获取最终结果 3.根据您所用的机器和实验环境,超参数需要进行适当调整
感谢您在百忙之中的耐心解答! 关于交叉验证,我是直接以
prompt_fewshot.py
中line 465
的acc计算方法为准的,并未做自定义改动。 请问您是以这个结果为准,还是以其他结果为准呢?
465行是读取数据时的代码;计算acc的代码见359行; 您所遇到的问题可能由于其他两点导致的,另外不佳的预训练模型会极大影响下游任务的表现。
您的复现中可能存在以下问题: 1.pre-train.py是在整个数据集上预训练的,修改shotnum需要在下游上修改 2.论文中并没有使用交叉验证的方式来获取最终结果 3.根据您所用的机器和实验环境,超参数需要进行适当调整
感谢您在百忙之中的耐心解答! 关于交叉验证,我是直接以
prompt_fewshot.py
中line 465
的acc计算方法为准的,并未做自定义改动。 请问您是以这个结果为准,还是以其他结果为准呢?465行是读取数据时的代码;计算acc的代码见359行; 您所遇到的问题可能由于其他两点导致的,另外不佳的预训练模型会极大影响下游任务的表现。
感谢您的耐心解答! 我明白了您的意思,但可能是我之前的表达不清楚。
您在prompt_few-shot.py
中line643 - line645
标明了10fold,不知我是否理解有误?
您在之前的回答中说,论文中的acc并未采用此处的10 fold acc,那么您是采用的line 650
的 acc_mean
吗?
再次感谢您的回复!
您好,感谢您开源并上传论文的最新代码,在学习您代码并试图复现的过程中,我发现
prompt_fewshot.py
的运行效果并不很好(以10折交叉验证的平均acc为准),默认数据集上的10折交叉验证平均acc在23.5左右,论文中展示的acc为31.84,相差略远,现将我的参数附上。(仅将pre_train.py 中的train_num_per_class
以及shot_num
改为5)我在pre_train.py 的运行参数如下:
prompt_fewshot.py 中的参数如下:
GPU为RTX3090