JJJYmmm / Pix2SeqV2-Pytorch

Simple Implementation of Pix2seqV2(multi-task)
17 stars 7 forks source link

we test the image of voc2012 with "voc_object_detection.pth" #5

Open Hupo777 opened 6 months ago

Hupo777 commented 6 months ago

我们在voc数据上测试了给的权值,但是可视化效果显示,预测结果很不准,您有什么看法吗

JJJYmmm commented 6 months ago

不好意思,很有可能效果就是很一般(

这个项目只是对于 https://github.com/moein-shariatnia/Pix2Seq 的一个扩充,我提供的权重只是初步训练的结果,仅供学习参考。

关于检测的性能,您可以参考上述链接(本项目性能不会高过shariatnia-pix2seq)或 issue

如果您追求detection baseline级别的表现,可以参考官方实现

注:Pytorch版本实现的话,我个人推荐AiT提供的复现代码,实现相当完善,包括了Pix2seq原文中的noise box,可参考这里。不过放出的权重只有Transformer encoder部分,可能需要联系作者拿到完整权重或自行训练(我之前训过,但是没有保存)。

祝好。

gg22mm commented 5 months ago

到完整权重或自行训练(我之前训过,但是没有保

大老,Pytorch版本实现的话,我看这个是不是更好: https://github.com/facebookresearch/detr 但是不懂为什么 不维护了~~!

JJJYmmm commented 5 months ago

到完整权重或自行训练(我之前训过,但是没有保

大老,Pytorch版本实现的话,我看这个是不是更好: https://github.com/facebookresearch/detr 但是不懂为什么 不维护了~~!

1) detr是query based的检测框架,和pix2seq这种auto regressive的还是不太一样(当然detr的性能更好,follow的工作也更多)

2) 可以看看mmdetection等code base,这些维护挺勤快的(

gg22mm commented 5 months ago

好的,非常感谢,我去了解一下~~