jinliangXX / jinliangXX.github.io

Jinliang Blog ->
https://jinliangxx.github.io/
MIT License
0 stars 0 forks source link

第三天-机器学习100天 - 金良的博客 | Jinliang Blog #4

Open jinliangXX opened 5 years ago

jinliangXX commented 5 years ago

https://jinliangxx.github.io/2019/04/04/ML-100Days-Day3/

There is no royal road to learning.

jinliangXX commented 5 years ago

多元线性回归中的虚拟变量陷阱很有意思,我的理解是虚拟变量就是可以由其他变量直接推导出来的,于是再分别学习没有意义,反而加大任务量且无价值。

godzilla2019 commented 5 years ago

这篇为什么要躲避?

jinliangXX commented 5 years ago

@godzilla2019 这篇为什么要躲避?

因为这篇是多元线性回归,即每个样本的属性值$\geq 2$,当有两个或两个以上的属性值时,有可能存在一个变量被其他变量推导出来的情况,这样训练把样本所有的属性值作为$\textbf x$进行训练就没有没有意义了。
下面以两个属性值为例:加入每个样本有两个属性值$x_1,x_2$,并且高度相关,即$x_1=C-x_2$,C为一个实数值,那么我们训练的时候就没有必要将两个属性值全部放入模型中,仅训练一个属性,剩余的那个属性自然就能推导出来了。 /(ㄒoㄒ)/~~ 公式打不出来