Open Kinpzz opened 7 years ago
介绍了计算机视觉发展历史,ImageNet数据集及比赛成果。本课程着重于机器学习的深度学习在计算机视觉应用部分。
本节课主要介绍了KNN分类器,但是它不适用于在图像分类上。如何通过cross-validation来选择最佳的k(hyperparamater)
介绍了神经网络在线性分类器上的应用。$$f(x_i, W, b) = Wx+b$$ (x维三通道彩色图像压平为1维向量),W每一行的意义“:代表了每一类的平均图像。
前向传播:用于计算得到预期结果和loss, $$f = W Relu(x)$$ 反向传播:通过链式法则从后往前倒推出每一层的梯度,使用Optimizer如Gradient Descent来更新W使得loss趋近收敛
使得神经网络得到非线性分类能力 最常使用Relu = Max(0,x),也可以使用Leaky Relu,Elu, tanh 不使用sigmoid,容易梯度消失,不适合反向传播。
PS: 结合西瓜书理解反向传播的数学原理
Data Normalizaiton
X -= np.mean(X, axis=0)
X /= np.std(X, axis=0)
learnable norm parameters
Deeplearning software
CNN
RNN
CS231n 深度学习与计算机视觉