Closed ray075hl closed 2 months ago
您好 我看llama1里面7b的训练速度3300tokens/gpu/second 是在2000多张卡的集群上训练的速度; 如果我只有5台机器40卡,是不是应该速度应该比它快很多啊?
您好 我看llama1里面7b的训练速度3300tokens/gpu/second 是在2000多张卡的集群上训练的速度; 如果我只有5台机器40卡,是不是应该速度应该比它快很多啊?