nndl / solutions

《神经网络与深度学习》课后习题答案-分享讨论
690 stars 80 forks source link

习题8-2 #82

Open golovin017 opened 2 months ago

golovin017 commented 2 months ago

联想到对于数据进行规范化的方式,利用维度D能够有效的减小X的方差从而避免因为X方差过大带来的softmax梯度较小的问题,相当于对于原始数据进行一个scaling down