Closed XiaotaoChen closed 1 month ago
model_deploy阶段可以打开--compare_all获取所有层的对比信息,看看出错是在哪个节点上
感谢,我们这边试了下,发现是因为在model_transform
阶段也使用text_inp.npz
和 text_feat.npz
进行验证,这一步貌似会修改text_feat.npz
的内容,保存每一层的输出信息;然后我们再拿这个text_feat.npz
用在model_deploy
中对齐,就报错了。使用最原始的仅包含输出tensor的text_feat.npz
就能验证通过。
model_deploy阶段可以打开--compare_all获取所有层的对比信息,看看出错是在哪个节点上
@charlesxzb 你好,两个新问题。
text_feat.npz
进行验证程序通过了。但看输出目录下的子目录tinyclip-vit-40M_text-sim_bm1684x_F16
下有input_ref_data.dat, output_ref_data.dat
数据,查看这里的数据,input_ref_data.dat
结果和text_inp.npz
一致,但output_ref_data.dat
结果和text_feat.npz
明显不一致,不知道为啥会验证通过;text_inp.npz
内容测试text_encoder
模型发现输出结果不符合预期。输出结果和output_ref_data.dat
一致;text_encoder
结果没有对齐,问题应该可以通过output_ref_data.dat
为啥和text_feat.npz
不一致定位。应该是使用方式哪里有问题。麻烦解答一下。根据官方解答,是因为f16模式equal算子对比数值超出表示范围导致的。转成fp32模型或f16模型对于具体层使用fp32数据格式即可避免该问题。
背景
model_transform入参和输出
入参 其中
text_inp.npz
和text_feat.npz
为对应onnx模型输入和输出结果,已验证结果正确。输出较长,见最后
model_deploy入参和输出信息
入参
输出
model_transform输出信息