Closed xsthunder closed 3 years ago
你说的是realformer吧
我在tf 1.15下,测试keras/tf.keras都能成功跑起上述模型。这说明模型的代码实现是没有问题的。
你有没有试过去掉tf.compat.v1.disable_eager_execution()
看能不能成功?
我对tf 2.x比较抗拒,目前不打算针对tf 2.x开发,只能说尽量同时支持一下~
去掉tf.compat.v1.disable_eager_execution()
无效
先不管,谢谢苏神的快速回答
可能是构建模型时,
build_transformer_model
参数设置有问题,example中没有找到residual_attention_scores
的参数使用样例,希望提供基本信息
核心代码
输出信息
自我尝试
不管什么问题,请先尝试自行解决,“万般努力”之下仍然无法解决再来提问。此处请贴上你的努力过程。
尝试1 测试环境
去掉
residual_attention_scores=True
,成功构建。尝试2 从图中找算子,动态构建attention weight矩阵旁路
失败,tf1的算子结果tensor,不支持用于keras.Model构建模型。tf1的算子结果tensor只能在session下运行后拿到结果。
更换tf1.15
Python 3.6.9 ubuntu1~18.04 tf.keras.version: '2.2.4-tf' tf: '1.15.4' bert4keras: 0.9.9 chinese_roberta_wwm_ext_L-12_H-768_A-12
输出信息变更
同样地,去掉
residual_attention_scores=True
,成功构建。