lawlite19 / MachineLearning_Python

机器学习算法python实现
MIT License
6.91k stars 2.41k forks source link

机器学习算法Python实现

MIT license

目录

一、线性回归

1、代价函数

2、梯度下降算法

3、均值归一化

4、最终运行结果

5、使用scikit-learn库中的线性模型实现


二、逻辑回归

1、代价函数

可以看出,当{{h_\theta }(x)}趋于1y=1,与预测值一致,此时付出的代价cost趋于0,若{{h_\theta }(x)}趋于0y=1,此时的代价cost值非常大,我们最终的目的是最小化代价值

2、梯度

3、正则化

4、S型函数(即{{h_\theta }(x)}

5、映射为多项式

6、使用scipy的优化方法

7、运行结果

8、使用scikit-learn库中的逻辑回归模型实现


逻辑回归_手写数字识别_OneVsAll

1、随机显示100个数字

2、OneVsAll

3、手写数字识别

4、预测

5、运行结果

6、使用scikit-learn库中的逻辑回归模型实现


三、BP神经网络

1、神经网络model

2、代价函数

3、正则化

4、反向传播BP

5、BP可以求梯度的原因

6、梯度检查

7、权重的随机初始化

8、预测

9、输出结果


四、SVM支持向量机

1、代价函数

2、Large Margin

3、SVM Kernel(核函数)

4、使用scikit-learn中的SVM模型代码


五、K-Means聚类算法

1、聚类过程

2、目标函数

3、聚类中心的选择

4、聚类个数K的选择

5、应用——图片压缩

6、使用scikit-learn库中的线性模型实现聚类

7、运行结果


六、PCA主成分分析(降维)

1、用处

2、2D-->1D,nD-->kD

3、主成分分析PCA与线性回归的区别

4、PCA降维过程

5、数据恢复

6、主成分个数的选择(即要降的维度)

7、使用建议

8、运行结果

9、使用scikit-learn库中的PCA实现降维


七、异常检测 Anomaly Detection

1、高斯分布(正态分布)Gaussian distribution

2、异常检测算法

3、评价p(x)的好坏,以及ε的选取

4、选择使用什么样的feature(单元高斯分布)

5、多元高斯分布

7、程序运行结果