ssnau / blog

1 stars 0 forks source link

p值 #7

Open ssnau opened 7 years ago

ssnau commented 7 years ago

read this article: https://zhuanlan.zhihu.com/p/20052019

one answer

P是“拒绝原假设时犯错误概率”又或者说是“如果你拒绝掉原假设实际上是在冤枉好人的概率”。

不管怎么表达理解上都有点绕,所以你还是看例子吧。

比如你做一个假设( null hypothesis):你的女性朋友平均身高2米,输入你统计的样本数据(e.g. 输入10000个样本)后,计算机给你返回的p值是0.03。这意味着如果你拒绝“女性朋友平均身高2米”这个结论,犯错的概率是0.03,小于0.05(人们一般认为拒绝一句话时犯错概率小于0.05就可以放心大胆地拒绝了),这个时候你就可以拒绝原假设。如果计算机返回p值是0.9,那么你就会想,这说明拒绝原假设犯错概率高达90%,那么我就不应该拒绝原假设,即你应该认为你的女性朋友平均身高就是2米。

至于什么是alpha呢,上面例子中0.05这个标准就是alpha值,这个标准是可以你自己人为改变的。

anthor answer

所谓显著性水平α,即当原假设为真时,拒绝原假设的概率,就是弃真错误的概率。

在假设检验中,我们往往不能直接证明备择假设,即所谓的全称命题只能被否证而不能被证明。所以我们需要去否证(拒绝)原假设。

原假设和备择假设的地位其实不同,原假设是我们要反对的,同时他又是受保护的,我们必须要有足够的证据才能拒绝他。

首先,我们有一个原则:在控制犯第一类错误(弃真)的概率α的条件下,尽量使犯第二类错误(取伪)的概率β小。根据这一原则,在假设检验中,我们更加倾向于拒绝原假设,而不是接受原假设。实际上,原假设是要受保护的,这意味着要推翻原假设需要很充分的证据。我们必须需要找到足够多的证据去拒绝他,当拒绝他的证据不够时,我们都不能说接受原假设,只能说“没有足够的证据证明原假设可以拒绝”,或者更严格地说“在显著性水平α下没有发现足够的证据反对原假设”。我们不能轻易地放弃原假设是正确的这一判断,于是我们设置了显著性水平,即我们可以容忍的一个概率,什么概率?当原假设为真时,拒绝他的概率。一般我们取0.05(抑或是0.01、0.1),在这种情况下,根据小概率原理,在一次实验中,我们认为拒绝一个正确的原假设是不可能发生的。

这时候再来解释p值,α是我们给p值设置的上限。p值怎么求?我们根据实际情况,确定统计量,然后求出z值(或t值),并且查表,p值=(1-查表结果)×2【双尾的话要乘以2】。所以p值是什么意思?P值是指当原假设为真时所得到的观察结果或更为极端结果出现的概率,他反映了一种实际的风险,原假设为真时的真实风险,按我的简单的理解,他就是实际上的我们拒绝了一个正确的原假设的概率(落入了拒绝域的概率),如果p值比α小,我们就接受“拒绝原假设”。p值越小,拒绝原假设的理由就越充分。

another

p值和显著性水平α根本不是一回事,很多人包括提问者把它们混为一谈了。α是人为定的,取0.1、0.05、0.01随你需要,当然也不能瞎选。α定了,拒绝域也就确定了。接下来才要看抽样的结果,p值是根据样本算出来的,不是人为确定的。要注意拒绝原假设的条件是p值小于α。如果α越大,则拒绝的可能性越大,但不是p值变大了,p值还是那个p值,除非你重新抽样。举个例子,如果计算出来的p值是0.02,α选0.05的时候可以拒绝原假设,如果选0.01就无法拒绝了。所以把α与p值分开看就清楚了。