airockchip / rknn-toolkit2

Other
991 stars 104 forks source link

连板测试精度发现有算子的输出值异常 #183

Open lwcode opened 1 month ago

lwcode commented 1 month ago

在onnx模型中, 有一个Concat算子,输入0为/Slice_2_output_0, 1x64维的boolean, 输入1为/ConstantOfShape_output_0, 1x16维, 该变量为常值, 都是false(0), 输出是1x80的boolean变量, 如下图: 90fed91894bf9ec5c5233342cb946e4 但是做连扳精度测试时发现, Concat算子的输出异常, 产看snapshot文件夹里对应该算子的输出值为: c9b2a66e289bc2c17da9634315f0ed2 这个值异常, 理论上从65-80这些数据应该都是固定的false(0), 但是此处却出现了异常值, 这一结果在PC的模拟器里是正常的, 如何解决这一问题?

yuyun2000 commented 1 month ago

更换版本

lwcode commented 1 month ago

更换版本

rknn的驱动版本还是onnx的模型版本?

yuyun2000 commented 1 month ago

rknntoolkit的不同版本,转出的模型是不一样的,有些bug是随版本的,有的老版本可能更好

lwcode commented 1 month ago

rknntoolkit的不同版本,转出的模型是不一样的,有些bug是随版本的,有的老版本可能更好

好的, 我用的最新版本, 那我降版本试试, 感谢!

lwcode commented 1 month ago

rknntoolkit的不同版本,转出的模型是不一样的,有些bug是随版本的,有的老版本可能更好

我换了1.6版本的,但是直接卡死在模型build那个中间了,cpu一直占用着,但是等了快两个多小时还卡同一个地方,而且昨天也是卡这里,onnx模型就11M左右.

yuyun2000 commented 1 month ago

卡死说明版本不适配,zip2我建议你用2.0版本

lwcode commented 1 month ago

卡死说明版本不适配,zip2我建议你用2.0版本

2.0的也报错, 我换了刚发布的2.2版本可以跑, 而且错误情况相对2.1版本的结果大幅度减少, 我看到还有一两处有异常, 我查查看是不是要更换算子, 谢谢帮忙!

lwcode commented 1 month ago

卡死说明版本不适配,zip2我建议你用2.0版本 现在还有这两处: image image

lwcode commented 1 month ago

/Transpose_45_output_0这一层就是简单的举证变化, 它的输入/Reshape_42_output_0并没有异常, 所以, 应该还是onnx转换的时候rknn把这层给转换错误或者优化掉了吧 image