也不知道P值是招誰惹誰了,反正大家都喜歡拿他開刷!老早就有一篇爭議挺大的公眾號文章說「P值已死」,立馬就有人反駁「別鬧了,P值沒死」。其實, Nature雜志在14年2月份時就刊發(fā)了一篇文章,對統(tǒng)計效度的金標(biāo)準(zhǔn)「P值」提出了質(zhì)疑,認(rèn)為P值并沒有統(tǒng)計學(xué)家所認(rèn)為的那樣可信。 我們暫且把這個問題擱置一下,替P值君問一句:「為什么受傷的總是我呀?是我是我還是我」真要說起個問題,咱們得從統(tǒng)計學(xué)的框架說起。 現(xiàn)代統(tǒng)計學(xué)的框架 現(xiàn)代統(tǒng)計學(xué)兩分天下:一分統(tǒng)計描述,一分統(tǒng)計推斷。統(tǒng)計書上經(jīng)常這樣表述:統(tǒng)計描述和統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的兩個組成部分,兩者相輔相成、缺一不可,統(tǒng)計描述是現(xiàn)代統(tǒng)計學(xué)的基礎(chǔ)和前提,統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的核心和關(guān)鍵。 統(tǒng)計描述就是給數(shù)據(jù)拍張快照唄,看看他們長什么樣子。我們熟知的均數(shù)、中位數(shù)就是用來看他們扎堆的位置,扎在什么地方;標(biāo)準(zhǔn)差、四分位數(shù)間距等就是用來看他們扎堆的程度,扎得有多緊。當(dāng)然我們也可以用直方圖,箱線圖,散點圖等統(tǒng)計圖形來更為形象直觀的查看。 統(tǒng)計推斷是用我們手中的樣本數(shù)據(jù)來推斷其背后的總體特征。統(tǒng)計推斷里有兩大塊內(nèi)容:參數(shù)估計和假設(shè)檢驗。參數(shù)估計就是我們用樣本的統(tǒng)計量(如樣本均數(shù))去估計總體的參數(shù)(如總體均數(shù))。此時,我們可以有兩種策略:一種是簡單了事,直接把樣本統(tǒng)計量當(dāng)做總體參數(shù),這就是所謂的點估計;另外一種策略就是考慮到抽樣誤差,我們用一個范圍,而不是一個單一的值去估計總體參數(shù),此即所謂的區(qū)間估計。而假設(shè)檢驗則是利用小概率反正法思想,從問題的對立面(H0,原假設(shè))出發(fā),假定H0成立的條件下,去計算檢驗統(tǒng)計量,獲得P值,再通過P值來在H0,H1(備擇假設(shè))之間做進(jìn)一步取舍。
既然統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的核心和關(guān)鍵,看到這里,你也能體會到作為假設(shè)檢驗的黃金判定標(biāo)準(zhǔn)的P值,在統(tǒng)計學(xué)中的地位啦。那具體而言,什么是P值呢? P值和假設(shè)檢驗 什么是P值呢?按照頻率學(xué)派的經(jīng)典套路:
P值就是在H0為真時,觀察到的差異來源于抽樣誤差的可能性大小。聽完這個解釋,或許我們眼前能閃現(xiàn)一絲靈光。我們以正態(tài)分布的Z檢驗為例簡要說明下,不知道不理解為什么那么多的統(tǒng)計教材竟然要以t檢驗為例來講假設(shè)檢驗。如果你被他們毒害了,不知道什么是Z檢驗,請看如下公式: 看不懂?不著急。一步一步來。依據(jù)「P值就是在H0為真時,觀察到的差異來源于抽樣誤差的可能性的大小」這一定義,我們假定H0為真,也就是假定樣本均數(shù)「X Bar」(即X頭上抬根杠,微信編輯器什么時候能插入公式啊,只好擬音啦) 就等于總體均數(shù)「miu」(擬音),但是實際上,我們利用手中的樣本數(shù)據(jù)計算的均數(shù) 「X Bar」和總體均數(shù)「miu」總是有差異的,這個差異就是公式中的分子,但是這個差異缺乏一個統(tǒng)一的度量,于是 我們除以一個 總體的變異幅度(暫且用標(biāo)準(zhǔn)誤代替,也就是上圖中的分母), 這樣就得到一個以總體變異幅度來度量的差異,也就是說這個差異是多個標(biāo)準(zhǔn)誤,或者說差了多少個標(biāo)準(zhǔn)誤的距離,這個就是我們所說的統(tǒng)計量,Z值?,F(xiàn)在在看看Z檢驗的公式,是否好容易理解多了? 統(tǒng)計量Z值其實就是樣本均數(shù)和總體均數(shù)相差的,以標(biāo)準(zhǔn)誤度量的單位量。
那么P值呢?別急。每一個Z值可以對應(yīng)到一個相應(yīng)的P值,比如,Z=1.96表示 差了1.96倍標(biāo)準(zhǔn)誤的距離,對應(yīng)的P 值就是0.05。 但是不同的分布,統(tǒng)計量不同,因此難以標(biāo)化統(tǒng)一,不過P 值卻可以,而且在實際操作中,由于計算機統(tǒng)計軟件包的發(fā)展,P值也很容易獲得。 獲得P值后,比如,比如啊,P=0.003,我們可以回過頭來想:既然我們已經(jīng)假定H0為真了,也就是(「X Bar」-「miu」)應(yīng)該沒有差異了,但是現(xiàn)在還有Z倍標(biāo)準(zhǔn)誤的差異??! 那現(xiàn)在這個差異是哪里來的呢?只有一個可能的原因:抽樣誤差。但是現(xiàn)在可以歸因于抽樣誤差的概率很小,只有0.003啊(統(tǒng)計軟件計算結(jié)果),0.003的概率,1000次也才3次,竟然一次就讓我們趕上了,這不太可能吧?是的,確實不太可能。那我們就只能回過頭來懷疑我們的根基,我們的原假設(shè)H0錯了,因此我們否定H0, 接受H1。 這才是我們的假設(shè)檢驗。這才是我們的P值。既然P值是假定H0為真的條件下,我們所觀察到的差異來源于抽樣誤差的概率。這很容易讓我們想到,如果H0真的為真,我們因P值<> I類錯誤的概率是不是P值呢?To P or not to P, that's a question。 要說起清楚這個問題,還得勞神費心另寫一篇:假設(shè)檢驗的前世今生。 P.S.部分圖片來自Google搜索。 按: SAS官方在1月15日,北上廣三地同時有線下活動,感興趣的可以去看看。北京這邊某人有一個「醫(yī)學(xué)研究里的SAS PROC和SAS 繪圖主題的分享」,可以去捧場,或者踢館!報名:http://club./Active.aspx |
|