Open kkaqs opened 7 months ago
我按照0.0.0.0.14中的STDP教程,与梯度下降混合训练,构建VGG11识别cifar10数据集 在训练过程中发现有些层的 delta_w 过大,有些层比较小,请问这种情况是正常的嘛,还是我的代码配置可能存在问题?
深度神经网络里面的权重通常都很小,大梯度是有问题的。可以先用梯度下降训练,然后用很小的学习率结合STDP去微调权重 另外,STDP是无监督的方法,不一定保证微调后性能可以提升
好的谢谢!想问下教程中提到的 权重的更新量- delta_w * scale ,其中 scale是不是用来调整 - delta_w 范围的呀,不知道是不是可以这样用
scale实际上就是学习率的意思
scale
好的感谢!
我按照0.0.0.0.14中的STDP教程,与梯度下降混合训练,构建VGG11识别cifar10数据集 在训练过程中发现有些层的 delta_w 过大,有些层比较小,请问这种情况是正常的嘛,还是我的代码配置可能存在问题?