nihui / vkpeak

A tool which profiles Vulkan devices to find their peak capacities
MIT License
99 stars 3 forks source link

这实现不是 peak #9

Open tpoisonooo opened 1 year ago

tpoisonooo commented 1 year ago

例如 glsl_p1_data , 里面有 buffer_ld1 和计算。

测量的值包含了内存和计算,肯定比真实的 mem/ compute peak 都低很多。

tpoisonooo commented 1 year ago

这里有 Nvidia GPU mem peak 的实现 https://github.com/Yinghan-Li/YHs_Sample/tree/master/cuda/microbenchmark

tpoisonooo commented 1 year ago

compute peak 的结果,应该没有 a_blob 输入,直接执行一个复杂的数学计算(算 pi ?)。

nihui commented 1 year ago

如果没有输入输出,将无法保证核心的运算不被驱动优化掉

tpoisonooo commented 1 year ago

那就做两次,一次输入+复杂计算+输出; 一次输入+简单加法+输出。 两次结果相减。