nzc / dnn_ctr

The framework to deal with ctr problem。The project contains FNN,PNN,DEEPFM, NFM etc
756 stars 285 forks source link

关于FNN #12

Open aa147138 opened 5 years ago

aa147138 commented 5 years ago

您好,跑FNN的时候出现这个错误是什么情况? RuntimeError: cuda runtime error (8) : invalid device function at /pytorch/aten/src/THC/generated/../generic/THCTensorMathReduce.cu:18

MARMOTatZJU commented 5 years ago

https://github.com/nzc/dnn_ctr/blob/master/model/FNN.py 这个里面536行的这句with torch.cuda.device(2):中的2改成0试一下。

aa147138 commented 5 years ago

已经改过了,在Quadro K4200上跑就会出现这个错误,在Tesla P100上跑就没问题。是计算能力的问题还是显存大小的问题?

MARMOTatZJU commented 5 years ago

这样的话有可能是显卡驱动的情况,也有可能是pytorch需要重新安装。建议如果方便的话重新安装一下pytorch。

aa147138 commented 5 years ago

我有试过torch.cuda.is_available()这个操作,返回的事true,显卡驱动应该是没问题的吧?我的pytorch也是才装的,之前没用这个环境。用conda装的 另外,那个错误的定位是在这个地方 fm_first_order_emb_arr = [(torch.sum(emb(Xi[:,i,:]),1).t()*Xv[:,i]).t() for i, emb in enumerate(self.fm_first_order_embeddings)]