Haiyang-W / GiT

[ECCV2024 Oral🔥] Official Implementation of "GiT: Towards Generalist Vision Transformer through Universal Language Interface"
https://arxiv.org/abs/2403.09394
Apache License 2.0
293 stars 12 forks source link

有没有推理的示例代码? #9

Closed dream-in-night closed 2 months ago

dream-in-night commented 3 months ago

demo 下面都是检测和分割的,没有提示词的

Haiyang-W commented 2 months ago

demo 下面都是检测和分割的,没有提示词的

感谢你的关注。你意思是image caption?只需要给定对应的config就可以在coco caption上inference。我们没有实现通用的prompt inference。只实现了在特定数据集的evaluation。后边会考虑写一下这部分代码。感谢你的理解。