shenyunhang / APE

[CVPR 2024] Aligning and Prompting Everything All at Once for Universal Visual Perception
https://arxiv.org/abs/2312.02153
Apache License 2.0
459 stars 28 forks source link

模型的inference #16

Open duoqingxiaowangzi opened 6 months ago

duoqingxiaowangzi commented 6 months ago

Snipaste_2023-12-21_15-34-42 作者你好,请问这里下面的infer on images or videos和上面的infer on 160+ dataset有什么区别吗,我想用这个模型在自己的数据集上测试结果该用哪个啊

shenyunhang commented 6 months ago

你好,

  1. infer on images or videos可以看作是命令行demo,可以直接对输入的图像或者视频进行推理,参数传入图像或者视频的文件路径,输出每个图像或者视频的推理结果,但是不会计算指标。
  2. infer on 160+ dataset的脚本是对已经注册的数据集进行推理,输出整个数据集的推理结果,同时计算指标。论文里的结果都是通过这种方式评测。如果要注册新数据集,可以参考detectron的文档,或者参考其他数据集的注册方式。
duoqingxiaowangzi commented 6 months ago

好的,非常感谢

XiongRui020325 commented 3 months ago

Snipaste_2023-12-21_15-34-42 作者你好,请问这里下面的infer on images or videos和上面的infer on 160+ dataset有什么区别吗,我想用这个模型在自己的数据集上测试结果该用哪个啊

你好,请问你在自己的数据集上推理实现了吗?可以请教一下过程吗?