Closed monster119120 closed 3 months ago
我们用的是80G的卡,在40G的卡上确实会OOM。您是用多少显存的卡?
我们用的是80G的卡,在40G的卡上确实会OOM。您是用多少显存的卡?
我也是80G的A100呀。。
现在github上有多卡代码了,你用2张A100跑fullKV试试。不过我当时是一张A100就能跑mistral的fullKV了
现在github上有多卡代码了,你用2张A100跑fullKV试试。不过我当时是一张A100就能跑mistral的fullKV了
感谢大佬更新代码!单卡A100 80G FullKV已经完全没问题了!
可以的,请问你是怎么解决的?
可以的,请问你是怎么解决的?
我自己新写了个算法,然后把mistral的prepare_input换成transformers官方的就行啦。
请问论文里怎么在longbench上测的mistral7B的full kv版本呀,我一跑就OOM了。。。