Closed nihui closed 1 year ago
nihui姐姐,看下 #47 , sunnycase 优化了下sum后处理,加快了些速度,你可以更新下你的代码看看是否提升更多
nihui姐姐,看下 #47 , sunnycase 优化了下sum后处理,加快了些速度,你可以更新下你的代码看看是否提升更多
sunnycase的pr中有关后处理的改动看起来并不能加速呀,是c906的改动在加速
是的,不过她把后处理函数统一提到arch_xxx里了,所以需要你在新增文件里加下默认的cpu计算的后处理函数,否则合并后该架构会找不到postprocess函数。。 当然如果你能顺便也优化下对应架构里的postprocess函数就更好啦~
run mbnet 1000 times for getting avg time
r9-5950x single thread fedora 36