Open ZhiyuYUE opened 2 weeks ago
并且第一次训练时,0卡会无法加载完训练集导致卡在94%,终止之后再进行训练就会出现以下报错: raise ValueError(f"No slot '{slot}' specified on host '{hostname}'") ValueError: No slot '4' specified on host 'localhost'
并且第一次训练时,0卡会无法加载完训练集导致卡在94%,终止之后再进行训练就会出现以下报错: raise ValueError(f"No slot '{slot}' specified on host '{hostname}'") ValueError: No slot '4' specified on host 'localhost'