dog-qiuqiu / Yolo-FastestV2

:zap: Based on Yolo's low-power, ultra-lightweight universal target detection algorithm, the parameter is only 250k, and the speed of the smart phone mobile terminal can reach ~300fps+
812 stars 194 forks source link

请问大佬还有什么改进的想法吗? #59

Open DaMiBear opened 2 years ago

DaMiBear commented 2 years ago

本人这方面还是小白,但是想在大佬的肩膀上再改进一下,不知有没有什么方向可以提供?我是想放在RK3568或者RK3588上面跑一下手势识别。

noahzhy commented 2 years ago

+1, 个人感觉跑手势识别的话,加个关键点的分支,然后加上landmark 的损失应该就行了。解耦头的话,landmark的头应该和reg的头应为同为一个。

DaMiBear commented 2 years ago

多谢指导。我才把YOLOX的head代码看了,想试一下anchor free。而且发现YOLOX中的解耦头,obj和reg是同一个,而qiuqiu大佬的是cls和obj同一个。也不知道是不是 obj和reg是同一个解耦头效果不好还是因为其他原因。

noahzhy commented 2 years ago

嗯嗯,我最近也在将yolox中的改进方法往这边迁移,解耦头不一致的问题我也注意到了,我也比较疑惑。

DaMiBear commented 2 years ago

在自己比较简单的数据集上尝试了一下改为anchor free,以及解耦头改为reg和obj共用一个后,感觉效果还是有点提升的。

noahzhy commented 2 years ago

坦白来说,我也认同obj和reg一个解耦头,因为之前 CVPR2020 的论文也提到过 obj 和 reg 的关注点更相近,cls 的关注点和 obj的关注点相距甚远。 Snipaste_2022-06-03_00-34-45

DaMiBear commented 2 years ago

这论文我没看过,查了下是这篇吧?《Revisiting the Sibling Head in Object Detector》,得去拜读下。 买的RK3568也才到😁,用ncnn的benchmark中yolo-fastest-v2四个线程24.2ms,不知道后面如果加关键点会是多少了。

noahzhy commented 2 years ago

嗯嗯,是这篇,rk3568的性能挺让人惊喜的,我这边也在尝试看看用k510跑一下试试

DaMiBear commented 2 years ago

之前看到过k210,听说k510会很强,但那时候k510迟迟不出,没想到现在出来了。