Closed pql123 closed 1 year ago
我在使用bert4keras加载 bert-base-chinese,做分类任务时,会查出显存,但是使用bert4torch就可以正常训练,是torch显存优化的比tensorflow好?还是bert4torch会冻结某些参数嘛?我的显卡是1660 6g显存。
bert4torch不会冻结参数,至于你说的显存问题,基于以上我目前也判别不出来
我在使用bert4keras加载 bert-base-chinese,做分类任务时,会查出显存,但是使用bert4torch就可以正常训练,是torch显存优化的比tensorflow好?还是bert4torch会冻结某些参数嘛?我的显卡是1660 6g显存。
基本信息