lambdaji / tf_repos

TensorFlow Script
681 stars 319 forks source link

libsvm数据转化问题 #37

Open shuDaoNan9 opened 4 years ago

shuDaoNan9 commented 4 years ago

建议可以加个readme 比如get_criteo_feature.py默认测试集的所有特征都在训练集出现过,否则feature_map不全; 比如测试的数据不能太少,不然cutoff都没了; 比如测试集这里跟训练集这里下标差一:val = dists.gen(i, features[continous_features[i] - 1]),然后我改成跟训练集一样的下标了,应该是我的数据格式测试集合训练集是一样的,博主的两者数据坐标差一? 测试集的label = features[0]我也加上去了,这样后面对比测试效果应该能更加方便对比,不然延用训练集的最后一个label感觉怪怪的; 比如数值型连续值不能只有一个唯一值,否则归一化出错; ...........