SHUSCT / SHUBYD_GMCORE_ASC24

MIT License
0 stars 0 forks source link

[Need-Attention-to]about func "adv_fill_vhalo" in file "adv_mod.F90" #19

Open BeverlyCrl opened 5 months ago

BeverlyCrl commented 5 months ago

在如下面图片提到的函数adv_fill_vhalo中出现了多个循环嵌套进行类似矩阵运算的情况。也许可以访存优化,也许可以并行展开,我觉得是个不错的上手地方。(如果这个矩阵规模比较小,也许需要慎重考虑并行开销,有时候也会用一些花活,比如更加靠近汇编的调用寄存器,当然 这有点太花了,先尝试一些基础的优化吧)

image