Closed cccddd77 closed 1 month ago
在--Graph --use-fp16 --fuse-bn-relu --fuse-bn-add-relu ...参数训练时,eval阶段会在FusedNormalizationAddRelu算子处报错,原因是cudnn_fused_normalization_add_relu算子中使用的cudnn接口只在训练阶段才支持CUDNN_BATCHNORM_OPS_BN_ACTIVATION / CUDNN_BATCHNORM_OPS_BN_ADD_ACTIVATION操作,相关代码逻辑也是根据训练阶段写的,不适配推理阶段,所以在这个Pass处需要根据是否为推理阶段来做算子替换。
--Graph --use-fp16 --fuse-bn-relu --fuse-bn-add-relu ...
CUDNN_BATCHNORM_OPS_BN_ACTIVATION / CUDNN_BATCHNORM_OPS_BN_ADD_ACTIVATION
View latest API docs preview at: https://oneflow-staging.oss-cn-beijing.aliyuncs.com/docs/Oneflow-Inc/oneflow/pr/10533/
在
--Graph --use-fp16 --fuse-bn-relu --fuse-bn-add-relu ...
参数训练时,eval阶段会在FusedNormalizationAddRelu算子处报错,原因是cudnn_fused_normalization_add_relu算子中使用的cudnn接口只在训练阶段才支持CUDNN_BATCHNORM_OPS_BN_ACTIVATION / CUDNN_BATCHNORM_OPS_BN_ADD_ACTIVATION
操作,相关代码逻辑也是根据训练阶段写的,不适配推理阶段,所以在这个Pass处需要根据是否为推理阶段来做算子替换。