no5-aaron-wu / no5-aaron-wu.github.io

aaron-wu的个人博客
0 stars 0 forks source link

SIMD[3]: NEON 内联汇编 | 旭穹の陋室 #40

Open no5-aaron-wu opened 2 years ago

no5-aaron-wu commented 2 years ago

https://no5-aaron-wu.github.io/2022/06/14/SIMD-3-NeonAssembly/

前言 汇编作为代码的最底层实现,大概的流程就是加载数据到寄存器,计算,把寄存器的值写回内存。 一般运行瓶颈就在于数据的加载和写出还有指令之间的数据依赖等等,所以怎么更高效的读写数据还有使相邻指令之间的数据依赖最小等等,是做优化经常都会遇到的问题,当然这个很吃经验,但是也总是会有一些套路可寻。 ARMv7与ARMv8对比 寄存器 通用寄存器 ARMv7(或 ARMv8 的AArch32执行状态) 有