shenyunhang / APE

[CVPR 2024] Aligning and Prompting Everything All at Once for Universal Visual Perception
https://arxiv.org/abs/2312.02153
Apache License 2.0
459 stars 28 forks source link

和hugging face上的效果不一样。 #28

Open chenjun2hao opened 5 months ago

chenjun2hao commented 5 months ago

同一张图像,同样的参数,用仓库的代码和hugging face demo推理的可视化结果不一样,hugging face是做了什么优化修改嘛?

chenjun2hao commented 5 months ago

参数是按hugging face demo中的设置的。hugging face app.py下载下来跑还是和hugging face上的不一样。。。

shenyunhang commented 5 months ago

huggingface demo是有加了以下参数:

"model.model_vision.select_box_nums_for_evaluation=500",
"model.model_vision.text_feature_bank_reset=True",
"model.model_vision.backbone.net.xattn=False",
"model.model_vision.transformer.encoder.pytorch_attn=True",
"model.model_vision.transformer.decoder.pytorch_attn=True",

这里可以看到huggingface demo的具体调用方法。

如果结果还是不一样,可能和环境有关系。