Open Bittersweetxz opened 4 months ago
初步猜测是数据有问题,是这样吗
我也遇到了,是pretrain.py中的span_corruption_mask函数有问题,当textsplit后长度小于2,while进入死循环
我的解决方案是过滤train_context.csv中的长度小的数据
作者您好,
非常感谢您的帮助,解决了问题,祝您学术道路上顺风顺水,勇攀高峰!
祝好
2024/7/22
我的解决方案是过滤train_context.csv中的长度小的数据
顺便问一下,过滤后能复现出论文结果吗。