Open cj1128 opened 3 years ago
谢谢文章,看了很受启发。
很深入, 到实现细节. 赞楼主.
测量的时候尝试把gettime放在循环外面试一下?
因为获取时间的开销是很大的,为了减小这个函数的开销,它甚至专门被从从内核从提取到了用户空间(见 man vdso),现在测量的时间可能很大一部分是来自获取时间的开销(尤其是getUS中的getimeofday),在循环外面一次测量总的计算时间可能比较合适
@lightfindyou 测量的时候尝试把gettime放在循环外面试一下?
因为获取时间的开销是很大的,为了减小这个函数的开销,它甚至专门被从从内核从提取到了用户空间(见 man vdso),现在测量的时间可能很大一部分是来自获取时间的开销(尤其是getUS中的getimeofday),在循环外面一次测量总的计算时间可能比较合适
有道理,后面我来试试,感谢这个建议~
测量时间用RDTSC,记得关闭降频
@aguludunu 测量时间用RDTSC,记得关闭降频
好的我试试,这个 intrinsic 我记得 Casey 也提到过。
感谢分享,最近在实现定点数快速运算,很多机器相关的细节不好找资料,讲的非常详细,受益匪浅。
https://cjting.me/2021/03/16/the-missing-div-instruction-part1/
消失的除法指令:Part1