Open Atakey opened 3 years ago
将 os.environ['RECOMPUTE'] 无论设置为0还是1,训练速度 均没有出现明显差异,例如当前模型代码下同样的 batch_size, tf2.1 + keras 采用recompute_grad 比未采用重计算训练速度大约慢20%左右
关于recompute的各种问题,欢迎提出解决方案,但是如果纯粹提出问题,那么作者也无能为力,因为recompute的代码是纯粹东拼西凑而来的,作者也不理解原理,无从改进,更不用说结果estimator这种作者也没用过的东西的使用方法了。
提问时请尽可能提供如下信息:
基本信息
核心代码
自我尝试
重计算 测试情况 keras=2.3.1 tf2.1 + keras 重计算可用 tf2.1 + tfkeras 重计算可用
tf2.2 + keras 重计算可用 tf2.2 + tfkeras 重计算可用
tf2.3 + keras AttributeError: module 'tensorflow.python.framework.ops' has no attribute '_TensorLike' # 应该是keras版本过低不适配tf2.3的原因 tf2.3 + tfkeras 重计算可用
而无论采用tf 2.1、2.2、2.3的哪个版本,model_to_estimator之后训练,重计算均失效。