Closed Rorschaaaach closed 1 year ago
开到max_seq_len 512, batch_size 1占用达到了21g,是因为清华修改了他们的代码跟模型嘛?
哪一个文件夹下面的代码,报给我一下
目前,已经更新了代码,再试一试
开到max_seq_len 512, batch_size 1占用达到了21g,是因为清华修改了他们的代码跟模型嘛?