OpenGVLab / UniFormerV2

[ICCV2023] UniFormerV2: Spatiotemporal Learning by Arming Image ViTs with Video UniFormer
https://arxiv.org/abs/2211.09552
Apache License 2.0
294 stars 19 forks source link

关于是否真的有效问题。 #73

Open tang-ed opened 5 months ago

tang-ed commented 5 months ago

我将网络完完整整复制到本地,然后参数用的是k400网络的参数,不加载任何预训练,从0开始,来进行训练,数据用的是someV2,其中,随机获取五类的全部样本,然后进行8:2的数据分割,进行训练,训练了很多次,基本都是train缓慢下降,val直接起步就过拟合了。那么这个网络算法真的是否对视频分类有效果呢?还是我做的不对,必须要加载预训练?当然,训练程序都是自己写的,只用了一个网络,学习率设置为lr=5e-5,没有设置下降策略。

tang-ed commented 5 months ago

解决了,需要使用余弦预热和余弦下降策略