Closed sunnycase closed 1 year ago
还需要处理下默认的 tm_layers.c里的147~152行,因为在O0时 会重复定义 l_postprocess_sum
以及可以把 l_postprocess_sum 重命名成 tm_postprocess_sum (原来的l前缀代表的是local,剥离出来的话可以就使用一般性tm前缀)
还需要处理下默认的 tm_layers.c里的147~152行,因为在O0时 会重复定义 l_postprocess_sum 以及可以把 l_postprocess_sum 重命名成 tm_postprocess_sum (原来的l前缀代表的是local,剥离出来的话可以就使用一般性tm前缀)
Fixed.
BATCH_SIZE
(pow of 2)l_postprocess_sum
toarch_x.h
n
parameter tol_postprocess_sum
for vectorizeoutscale_inv
for usingfmul
instead offdiv
tm_dot_prod_pack2
for C906l_postprocess_sum
for C906Benchmark:
on D1-H
TM_MDL_INT8 (ms)