Open teng1996 opened 3 years ago
请问albert_chinese_large 只有64M,为什么还显存溢出呢。用bert,同样的batch_size 并没有问题啊?
我用base v100 32G都能OOM
请问albert_chinese_large 只有64M,为什么还显存溢出呢。用bert,同样的batch_size 并没有问题啊?