cj1128 / cj1128.github.io

👻 My blog
https://cjting.me
17 stars 0 forks source link

消失的除法指令:Part1 #37

Open cj1128 opened 3 years ago

cj1128 commented 3 years ago

https://cjting.me/2021/03/16/the-missing-div-instruction-part1/

消失的除法指令:Part1

mendlin commented 3 years ago

谢谢文章,看了很受启发。

wkongzhu commented 3 years ago

很深入, 到实现细节. 赞楼主.

lightfindyou commented 2 years ago

测量的时候尝试把gettime放在循环外面试一下?

因为获取时间的开销是很大的,为了减小这个函数的开销,它甚至专门被从从内核从提取到了用户空间(见 man vdso),现在测量的时间可能很大一部分是来自获取时间的开销(尤其是getUS中的getimeofday),在循环外面一次测量总的计算时间可能比较合适

cj1128 commented 2 years ago

@lightfindyou 测量的时候尝试把gettime放在循环外面试一下?

因为获取时间的开销是很大的,为了减小这个函数的开销,它甚至专门被从从内核从提取到了用户空间(见 man vdso),现在测量的时间可能很大一部分是来自获取时间的开销(尤其是getUS中的getimeofday),在循环外面一次测量总的计算时间可能比较合适

有道理,后面我来试试,感谢这个建议~

aguludunu commented 2 years ago

测量时间用RDTSC,记得关闭降频

cj1128 commented 2 years ago

@aguludunu 测量时间用RDTSC,记得关闭降频

好的我试试,这个 intrinsic 我记得 Casey 也提到过。

Simakeng commented 2 years ago

感谢分享,最近在实现定点数快速运算,很多机器相关的细节不好找资料,讲的非常详细,受益匪浅。