baaivision / Painter

Painter & SegGPT Series: Vision Foundation Models from BAAI
MIT License
2.53k stars 176 forks source link

SegGPT训练代码是否有公开计划? #43

Open Alaya-Con opened 1 year ago

Alaya-Con commented 1 year ago

问题如题。 补充问题:1、SegGPT在推理时,每个prompt图需要与待检测图合并,重新推理提取特征然后特征组合,效率不高。 能否把实现方式改为prompt图的特征不需要与待检测图片合并,单独提取特征后做特征组合;对于每个新的待检测图片不需要重新提取特征,在推理时的效率可以大幅度提高。 2、SegGPT在使用多个prompt图时确实分割效果确实有一定提升,但是在某些场景下并不是prompt图越多越好,尤其是对于不熟悉的场景,例如待分割目标占图片比例较小,非日常场景等。对于这类问题有没有更多的研究?

CCJGD commented 1 year ago

+1

wzp8023391 commented 8 months ago

问题如题。 补充问题:1、SegGPT在推理时,每个prompt图需要与待检测图合并,重新推理提取特征然后特征组合,效率不高。 能否把实现方式改为prompt图的特征不需要与待检测图片合并,单独提取特征后做特征组合;对于每个新的待检测图片不需要重新提取特征,在推理时的效率可以大幅度提高。 2、SegGPT在使用多个prompt图时确实分割效果确实有一定提升,但是在某些场景下并不是prompt图越多越好,尤其是对于不熟悉的场景,例如待分割目标占图片比例较小,非日常场景等。对于这类问题有没有更多的研究?

Nice idea. Actually, after I test SegGPT in remote sensing images, I found that it still have severe limitations. For example, some objects can't extracted by it, even I add over 100 prompts images. I think that segGPT is over estimated! My Email:1044625113@qq.com