sanshengshi626 / daka-statistics

0 stars 0 forks source link

Day4 #4

Open sanshengshi626 opened 5 years ago

sanshengshi626 commented 5 years ago

线性回归: y = w'x+e 最小二乘法 mse rmse 卡方分布: 从标准正态分布中取样,并计算取样值的平方和,得到的样本服从卡方分布。 对于离散性分布来说,卡方分布其实就是(实际值-期望值)^2/期望值。 其实质是检验样本对总体的估计效果。 如果卡方值大于显著性水平,估计效果就差。 F分布: 用来判断总波动是由样本组间波动引起的还是组内波动引起的。 对于列联表,计算组间波动与组内波动的比值。这一比值便符合自由度1为组间自由度,自由度2为组内自由度的F分布。 这一比值所在的概率区间小于显著性水平时,则是有组间波动引起的,反之,则是组内波动引起的。