lambdaji / tf_repos

TensorFlow Script
681 stars 319 forks source link

DeepFM gpu利用率问题 #8

Open laochangxin opened 6 years ago

laochangxin commented 6 years ago

lambdaji你好~一直有关注你的知乎和tf_repos,最近在实践中利用DeepFM实现了一个排序模型,想请教一个实际运用的问题,请问你在实际运用中是否会出现GPU利用率的问题?我这边在训练过程利用率始终在10%以下,如果单GPU资源利用都达不到100%,分布式也就没意义了。。。我用的是Tesla P40,显存有24G,显存应该不是瓶颈,数据规模field有81,feature index大约是百万级,对利用率问题一直不解,还望指教,多谢!

lambdaji commented 6 years ago

我们场景网络规模没那么大,没上GPU,给不了你实用的建议。参考下https://zhuanlan.zhihu.com/p/31558973

laochangxin commented 6 years ago

好的,多谢~ 从我这边实验多份数据的结果看,还是因为输入的特征维度过大,需要的存储也更大,这么看在大规模稀疏特征集合下用GPU效率上并没有什么收益

mathlf2015 commented 5 years ago

我也碰到这个问题,请教下你是怎么解决的。。