Onion12138 / CasRelPyTorch

Reimplement CasRel model in PyTorch.使用PyTorch对吉林大学CasRel模型进行复现,并在百度关系抽取数据集上训练测试。
184 stars 26 forks source link

为什么训练时候显示显存才占了5个G,官方的占30个g #8

Open 18438602970 opened 2 years ago

18438602970 commented 2 years ago

为什么训练时候显示显存才占了5个G,官方的占30个g,而且还训练的很慢,这是怎么回事啊,标签按理说应该占据很大内存呀,seqlen*关系种类;然后我更改了batch,又说GPU暴了,这是啥情况