Closed tangyu-ty closed 1 year ago
我在teslav100 32g上跑DHCF模型,yelp数据集,29601个user,24734个item,1517326的交互 num.factors=32,batchsize为4096,结果发现显存爆炸,调试bs为100也会爆炸。这个模型好像网上仅此这一份开源代码,我想确认的是,该模型真的需要这么大的显存吗。
原论文拒绝开源,我跟一作沟通过。这是我按原文复现的,基本上大数据集没法跑,按原文超图囊括二阶就一定会导致adjaceny matrix爆炸。原论文漏洞很多,只能说谨慎看待结果吧。
6
我在teslav100 32g上跑DHCF模型,yelp数据集,29601个user,24734个item,1517326的交互 num.factors=32,batchsize为4096,结果发现显存爆炸,调试bs为100也会爆炸。这个模型好像网上仅此这一份开源代码,我想确认的是,该模型真的需要这么大的显存吗。