Closed liushanshan07 closed 5 years ago
看到有类似的问题:https://github.com/PaddlePaddle/Paddle/issues/11755 可否重启下呢?
看到有类似的问题:#11755 可否重启下呢?
非常忧伤,我已经重启过很多次了。都是同样的错误。
不太确定啊,可否share下 job看下呢,本地能否复现呢?
不太确定啊,可否share下 job看下呢,本地能否复现呢? http://10.90.251.16:8001/webssh/ai00/9cc06588-7aba-5871-bc06-1ea5aa1c7ceb/10.255.124.20/1022649795.job-e6c5be26213d1db0-trainer_20181107_115939/9cc93a16-0c63-5615-a9ae-a9fc487c4988/stopped/ 这个是网页终端,可以看见job的配置的。本地无法复现这个问题,因为咱本地没有v100卡。 具体路径是:/root/paddlejob/workspace/env_run/train.py
Hi,试下先把ParallelExecutor fetch list去掉可否运行呢
您好,此issue在近三周暂无更新,我们将于今天内关闭。若在关闭后您仍需跟进提问,可重新开启此问题,我们将在24小时内回复您。因关闭带来的不便我们深表歉意,请您谅解~感谢您对PaddlePaddle的支持
paddlecloud v100训练ctc ocr识别模型。出现如下错误。