Open xiehuanyi opened 1 year ago
test_batch_size
,调小 batch 看下。OpenGB500 有 249,743 个实体,我这边测应该是占 31.8 G感谢 我试试
@.*** | |
---|---|
@.*** |
---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2022年12月06日 11:29 | | 收件人 | @.> | | 抄送至 | Huanyi @.>@.> | | 主题 | Re: [PaddlePaddle/PGL] Graph4KG的ComplEx跑验证集时Out of Memory (Issue #505) |
测试时对应的参数为 test_batch_size,调小 batch 看下。OpenGB500 有 249,743 个实体,我这边测应该是占 31.8 G 如果有修改代码,另一种可能是传入数据的 shape 不对造成错误的 broadcast,导致显存不正常溢出,可以打印下 RotateScore 函数的输入参数shape看看是不是 [batch_size, 1, ent_embed_dim], [batch_size, 1, rel_embed_dim], [batch_size, candidate_num, ent_embed_dim], 文件位置为这里
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>
使用ai studio上的32g v100在OpenBG500数据集上跑RotatE模型,训练集正常,测试集无论bs调多少都会OOM。
我的代码:
因为一直报错,我就把max_steps设为1,事实上模型的训练很正常,但是测试的时候会oom