Closed Tongkaio closed 7 months ago
修复 FillKernel 的 core dump 问题,已能够正常训练,但因为 contiguous 和 strided_copy 的性能较差,训练速度会很慢,CustomDevice 将默认关闭 FLAGS_use_stride_kernel(#1097),待相关算子性能优化完毕后再打开,开启 stride 时的训练截图:
增加 stride 相关的单测,单测中会手动开启 FLAGS_use_stride_kernel 进行测试:
Thanks for your contribution!
修复 FillKernel 的 core dump 问题,已能够正常训练,但因为 contiguous 和 strided_copy 的性能较差,训练速度会很慢,CustomDevice 将默认关闭 FLAGS_use_stride_kernel(#1097),待相关算子性能优化完毕后再打开,开启 stride 时的训练截图:
增加 stride 相关的单测,单测中会手动开启 FLAGS_use_stride_kernel 进行测试: