RedSmallPanda / SSQR

Resources for "Self-Supervised Query Reformulation for Code Search"
2 stars 1 forks source link

你好作者,pretrain.py训练过程中会在epoch处卡住,这是为什么? #4

Open Bittersweetxz opened 4 months ago

Bittersweetxz commented 4 months ago

image

Bittersweetxz commented 4 months ago

初步猜测是数据有问题,是这样吗

xiangzheng666 commented 3 months ago

我也遇到了,是pretrain.py中的span_corruption_mask函数有问题,当textsplit后长度小于2,while进入死循环

xiangzheng666 commented 3 months ago

我的解决方案是过滤train_context.csv中的长度小的数据

Bittersweetxz commented 3 months ago

作者您好,

非常感谢您的帮助,解决了问题,祝您学术道路上顺风顺水,勇攀高峰!

祝好

2024/7/22

Bittersweetxz commented 3 months ago

我的解决方案是过滤train_context.csv中的长度小的数据

顺便问一下,过滤后能复现出论文结果吗。