qiaoguan / deep-ctr-prediction

CTR prediction models based on deep learning(基于深度学习的广告推荐CTR预估模型)
https://github.com/qiaoguan/deep-ctr-prediction
907 stars 276 forks source link

话说现在用TensorFlow分布式训练CTR模型怎么搞速度快啊? #18

Open guotong1988 opened 3 years ago

guotong1988 commented 3 years ago

Parameter Server架构还是All Reduce架构? CPU还是GPU? 有没有开源代码参考? 用不用改TensorFlow源码? 性价比最高的方案是?

qiaoguan commented 3 years ago

tf estimator 也直接支持分布式的,是一种最快的实验方式吧, 另外对于ctr模型,由于tfrecord解析数据速度的限制,用gpu可能会发现利用率上不去,把tfrecord 用一些解析数据很快的方式重写,用gpu训练,batchsize调大,训练速度也能提升好多倍

simonshiwt commented 1 year ago

tf estimator 也直接支持分布式的,是一种最快的实验方式吧, 另外对于ctr模型,由于tfrecord解析数据速度的限制,用gpu可能会发现利用率上不去,把tfrecord 用一些解析数据很快的方式重写,用gpu训练,batchsize调大,训练速度也能提升好多倍

大佬好,我也发现我的模型训练有点慢,而且gpu利用率极低,"tfrecord 用一些解析数据很快的方式重写"具体指哪些方法能够列举一下吗?感谢!