AlibabaResearch / efficientteacher

A Supervised and Semi-Supervised Object Detection Library for YOLO Series
GNU General Public License v3.0
820 stars 147 forks source link

How to get the COCO 1%,2%,5% label list #95

Open dragonfly13650 opened 1 year ago

dragonfly13650 commented 1 year ago

请问有提供COCO数据集1%,2%,5%有标签的txt文件吗,如果是自己划分数据,需要按每个类别等比例划分吗

Efiath commented 10 months ago

请问有提供COCO数据集1%,2%,5%有标签的txt文件吗,如果是自己划分数据,需要按每个类别等比例划分吗

您好,请问你后来解决了吗,我也有这个问题。

dragonfly13650 commented 10 months ago

我后来直接在整个数据集上划分的,没有按每个类别划分,训练下来效果还好,应该没什么问题,感觉这个问题可能不是很关键

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2023年10月26日(星期四) 下午2:25 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [AlibabaResearch/efficientteacher] How to get the COCO 1%,2%,5% label list (Issue #95)

您好,请问你后来解决了吗,我也有这个问题。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Efiath commented 10 months ago

请问有提供COCO数据集1%,2%,5%有标签的txt文件吗,如果是自己划分数据,需要按每个类别等比例划分吗

感谢回答,那您的1%,2%,5%就纯随机采样吗,但是我感觉这样的1%里很可能会出现例如80个类不齐全的情况

dragonfly13650 commented 10 months ago

因为coco每个类别本来就不平衡,所以就算等比例抽取了,有些类的样本还是很少,不过你可以多设几个seed划分数据集,进行多次实验

---Original--- From: @.> Date: Thu, Oct 26, 2023 21:23 PM To: @.>; Cc: @.**@.>; Subject: Re: [AlibabaResearch/efficientteacher] How to get the COCO 1%,2%,5%label list (Issue #95)

请问有提供COCO数据集1%,2%,5%有标签的txt文件吗,如果是自己划分数据,需要按每个类别等比例划分吗

感谢回答,那您的1%,2%,5%就纯随机采样吗,但是我感觉这样的1%里很可能会出现例如80个类不齐全的情况

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Efiath commented 10 months ago

请问有提供COCO数据集1%,2%,5%有标签的txt文件吗,如果是自己划分数据,需要按每个类别等比例划分吗

您好,麻烦再请教您一个问题(时间太久作者一直没回我),我是训练VOC数据集,采用直接ssod方法,我看在ssod_trainer.py文件中也使用了init_seeds固定了seeds,,但是相同代码训练两次的结果还是不一样,而且多的时候能差一个点,您之前有遇到过类似的情况吗?或者您知道我这个问题可能是什么原因导致的吗?我现在希望完全相同的代码可以让两次结果相同,以便验证我的改进有效果,感谢您的回答。

dragonfly13650 commented 10 months ago

我没有遇到过这种情况,不过我看到了一个博客https://blog.csdn.net/weixin_43977640/article/details/114969005的解释可能是对的,可能是多线程数据采样的原因

------------------ 原始邮件 ------------------ 发件人: "AlibabaResearch/efficientteacher" @.>; 发送时间: 2023年11月3日(星期五) 中午12:12 @.>; @.**@.>; 主题: Re: [AlibabaResearch/efficientteacher] How to get the COCO 1%,2%,5% label list (Issue #95)

请问有提供COCO数据集1%,2%,5%有标签的txt文件吗,如果是自己划分数据,需要按每个类别等比例划分吗

您好,麻烦再请教您一个问题(时间太久作者一直没回我),我是训练VOC数据集,采用直接ssod方法,我看在ssod_trainer.py文件中也使用了init_seeds固定了seeds,,但是相同代码训练两次的结果还是不一样,而且多的时候能差一个点,您之前有遇到过类似的情况吗?或者您知道我这个问题可能是什么原因导致的吗?我现在希望完全相同的代码可以让两次结果相同,以便验证我的改进有效果,感谢您的回答。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

TahereSaidi commented 5 months ago

@dragonfly13650 Hello no body answer me so If you know what I should do, please guide me. I had a question about the Coco data set. When I run this line of code, the train2017 images are missing in the generated dataset folder. When I run this line of code, only the validation folder contains the images. Can you help me where the problem is? Thank you