finetune on my own open-vocabulary dataset

AILab-CVC / YOLO-World

[CVPR 2024] Real-Time Open-Vocabulary Object Detection

https://www.yoloworld.cc

GNU General Public License v3.0

4.29k stars 417 forks source link

finetune on my own open-vocabulary dataset #436

Closed Nathan-Li123 closed 1 month ago

Nathan-Li123 commented 1 month ago

I want to fine-tune on my own open-vocabulary dataset. Could you please advise me on how to do it specifically? Referring to the config file for fine-tuning on COCO, what modifications should I make?

lvke9529 commented 1 month ago

看下对你是否有帮助：https://blog.csdn.net/ITdaka/article/details/139306984

Nathan-Li123 commented 1 month ago

thanks

wenqiuL commented 1 month ago

@lvke9529 我跟着这个博主的流程训练过了，但是存在的问题是无法保留zero-shot的能力，甚至完全遗忘。请问你解决了如何对自定义数据集进行微调如何保证开放词汇的效果吗？

lvke9529 commented 1 month ago

@lvke9529 我跟着这个博主的流程训练过了，但是存在的问题是无法保留zero-shot的能力，甚至完全遗忘。请问你解决了如何对自定义数据集进行微调如何保证开放词汇的效果吗？

在检测的时候降低阈值，比如0.0001这样，你试试，但是效果不是很好

wenqiuL commented 1 month ago

@lvke9529 非常感谢你！检测出来的图片终于不是原图了，但效果确实是微乎其微。请问你有尝试过以下两种方法或者其他方法进行改善这种问题吗？ 1、在COCO数据集中添加GQA数据集。 2、使用Prompt YOLO-World。

LLH-Harward commented 3 weeks ago

@lvke9529 我跟着这个博主的流程训练过了，但是存在的问题是无法保留zero-shot的能力，甚至完全遗忘。请问你解决了如何对自定义数据集进行微调如何保证开放词汇的效果吗？

在检测的时候降低阈值，比如0.0001这样，你试试，但是效果不是很好

@lvke9529 您好微调后检测出物体的置信度很低请问有解决方法吗？