Tony-Tan / CUDA_Freshman

2.18k stars 435 forks source link

博客内容有误[2.2] #2

Open JuncFang-git opened 3 years ago

JuncFang-git commented 3 years ago

Hi Tony, 很感谢您的分享。此处指出博客中一个可能的错误。

博客链接:https://face2ai.com/CUDA-F-2-2-%E6%A0%B8%E5%87%BD%E6%95%B0%E8%AE%A1%E6%97%B6/

在此节中,分析不完整块用时会有“滑铁卢”时,数据大小本该为(1 << 24 )+ 1, 但从您的输出打印中看到数据大小实则为 1<<(24 + 1) = 33,554,432。 所以耗时将近为2倍,这个数据可能是有误的。

Regard, Juncfang