Open JuncFang-git opened 3 years ago
Hi Tony, 很感谢您的分享。此处指出博客中一个可能的错误。
博客链接:https://face2ai.com/CUDA-F-2-2-%E6%A0%B8%E5%87%BD%E6%95%B0%E8%AE%A1%E6%97%B6/
在此节中,分析不完整块用时会有“滑铁卢”时,数据大小本该为(1 << 24 )+ 1, 但从您的输出打印中看到数据大小实则为 1<<(24 + 1) = 33,554,432。 所以耗时将近为2倍,这个数据可能是有误的。
Regard, Juncfang
Hi Tony, 很感谢您的分享。此处指出博客中一个可能的错误。
博客链接:https://face2ai.com/CUDA-F-2-2-%E6%A0%B8%E5%87%BD%E6%95%B0%E8%AE%A1%E6%97%B6/
在此节中,分析不完整块用时会有“滑铁卢”时,数据大小本该为(1 << 24 )+ 1, 但从您的输出打印中看到数据大小实则为 1<<(24 + 1) = 33,554,432。 所以耗时将近为2倍,这个数据可能是有误的。
Regard, Juncfang