maoruibin / maoruibin.github.com

personal blog
http://gudong.site
MIT License
21 stars 5 forks source link

机器学习术语 #73

Open maoruibin opened 6 years ago

maoruibin commented 6 years ago

关于机器学习

机器学习的主要任务是分类。另一个主要任务是回归,它主要用于预测数值型数据。

标签

理想输出值(很可能跟实际结果有偏差),也就是我们要预测的事物,即通常所说的 y ,可以理解为一个预测的结果,一个真实特征经过一个模型(这个模型可以通过各种方法获得)的处理后,得到的结果就是现在所说的标签。

特征

已知输入项(一个确定的,来自现实世界的确定值),简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征。

在垃圾邮件检测器实例中,特征可能包括

样本

数据的特定实例:X

有标签样本

机器学习分类

监督学习

有标签的数据,也就是每一个样本都有确定的标签。 监督学习,必须知道预测什么,既目标变量的分类信息。

朴素贝叶斯、逻辑回归和神经网络都属于监督学习方法。

分类

样本只有几个确定的结果,比如垃圾邮件检测模型,就可以采用分类的方式,一份邮件只有两个结果,要么是垃圾邮件,要么不是

回归

结果不是确定的,比如房价预测,

无监督学习

训练数据由没有任何相应目标值的一组输入向量x组成。 无监督学习,数据没有类别信息,也不会给定目标值。