Open LuoFanA595 opened 1 year ago
实际显存占用率也不高,自身分词数据只有120M大小, 修改batch_size=16或者32时均被Killed,只能使用源码batch_size=8. 使用Tesla-T4训练1个Epoch都需要一周时间~~ 有没有大佬遇到这种问题该怎么解
实际显存占用率也不高,自身分词数据只有120M大小, 修改batch_size=16或者32时均被Killed,只能使用源码batch_size=8. 使用Tesla-T4训练1个Epoch都需要一周时间~~ 有没有大佬遇到这种问题该怎么解