sipeed / TinyMaix

TinyMaix is a tiny inference library for microcontrollers (TinyML).
Apache License 2.0
868 stars 142 forks source link

x86 sse2 optimization #52

Closed nihui closed 1 year ago

nihui commented 1 year ago

run mbnet 1000 times for getting avg time

r9-5950x single thread fedora 36


int8 optlevel before(ms) after(ms)
0 3.407 2.985
1 2.719 2.607

fp32 optlevel before(ms) after(ms)
0 5.43 3.322
1 4.889 2.575
Zepan commented 1 year ago

nihui姐姐,看下 #47 , sunnycase 优化了下sum后处理,加快了些速度,你可以更新下你的代码看看是否提升更多

nihui commented 1 year ago

nihui姐姐,看下 #47 , sunnycase 优化了下sum后处理,加快了些速度,你可以更新下你的代码看看是否提升更多

sunnycase的pr中有关后处理的改动看起来并不能加速呀,是c906的改动在加速

Zepan commented 1 year ago

是的,不过她把后处理函数统一提到arch_xxx里了,所以需要你在新增文件里加下默认的cpu计算的后处理函数,否则合并后该架构会找不到postprocess函数。。 当然如果你能顺便也优化下对应架构里的postprocess函数就更好啦~