PaddlePaddle / PaddleHub

Awesome pre-trained models toolkit based on PaddlePaddle. (400+ models including Image, Text, Audio, Video and Cross-Modal with Easy Inference & Serving)【安全加固,暂停交互,请耐心等待】
https://www.paddlepaddle.org.cn/hub
Apache License 2.0
12.73k stars 2.08k forks source link

无法正常启动训练, 打印完start,就没了, 也不报错, 会直接触发重启 #978

Closed smartmark-pro closed 4 years ago

smartmark-pro commented 4 years ago

欢迎您反馈PaddleHub使用问题,非常感谢您对PaddleHub的贡献! 在留下您的问题时,辛苦您同步提供如下信息:

  1. 官网: aistudio 环境
  1. 见该项目 https://aistudio.baidu.com/aistudio/projectdetail/1121228

如果使用当前的paddlehub==1.6.0 会出现'Parameter' object has no attribute 'gradient_clip_attr', 看了以前的内容回答, 改成了 hub 1.7.版本, 有一次能启动训练了, 但是因为出现了数据bug, 我去修改下, 再次运行之后就没有启动成功过了

暂时猜测是版本问题, 自己无法解决

smartmark-pro commented 4 years ago

在群里已得到反馈,

  1. 经过判断是因为使用"roberta_wwm_ext_chinese_L-24_H-1024_A-16"模型的batch_size过大导致notebook的重启, 之前设置的是1, 改完数据bug, 我顺便修改了batch_size,
  2. "Parameter' object has no attribute 'gradient_clip_attr" 的错误, 升级到最新版本(paddlehub==1.8.2, paddlepaddle-gpu==1.8.5.post107)不再出现该错误