Closed RookieHuang closed 5 months ago
可以试下混合量化。直接用默认的混合量化配置。
可以试下混合量化。直接用默认的混合量化配置。
@eRaul 仅对最后两个节点用fp16精度,推理速度直接慢了快一倍,请问下这种情况正常吗?
@eRaul 另外请问一下用python api rknn.inference推理出来的结果和c api中从output.buf(output.wan_float=1)中取出来的结果不太一致是正常的吗?
可以试下混合量化。直接用默认的混合量化配置。
@eRaul 仅对最后两个节点用fp16精度,推理速度直接慢了快一倍,请问下这种情况正常吗?
贴下混合量化前后的性能分析结果。
@eRaul 另外请问一下用python api rknn.inference推理出来的结果和c api中从output.buf(output.wan_float=1)中取出来的结果不太一致是正常的吗?
算下余弦距离,看下差多少?
使用model.zip模型进行rknn工具进行后量化后,在rv1126上推理的输出节点与原始模型存在很大差异。 采用量化分析工具分析发现仅最后有两个节点的eculidean_norm较大,cosine_norm较小,请问如何解决?![image](https://github.com/rockchip-linux/rknn-toolkit/assets/48719225/4f972ad4-4ee0-455c-897b-6e62feb081cc)