統(tǒng)計？我懂個P！

智慧之吻 2016-06-17

展開全文

也不知道P值是招誰惹誰了，反正大家都喜歡拿他開刷！老早就有一篇爭議挺大的公眾號文章說「P值已死」，立馬就有人反駁「別鬧了，P值沒死」。其實， Nature雜志在14年2月份時就刊發(fā)了一篇文章，對統(tǒng)計效度的金標(biāo)準(zhǔn)「P值」提出了質(zhì)疑，認(rèn)為P值并沒有統(tǒng)計學(xué)家所認(rèn)為的那樣可信。

我們暫且把這個問題擱置一下，替P值君問一句：「為什么受傷的總是我呀？是我是我還是我」真要說起個問題，咱們得從統(tǒng)計學(xué)的框架說起。

現(xiàn)代統(tǒng)計學(xué)的框架

現(xiàn)代統(tǒng)計學(xué)兩分天下：一分統(tǒng)計描述，一分統(tǒng)計推斷。統(tǒng)計書上經(jīng)常這樣表述：統(tǒng)計描述和統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的兩個組成部分，兩者相輔相成、缺一不可，統(tǒng)計描述是現(xiàn)代統(tǒng)計學(xué)的基礎(chǔ)和前提，統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的核心和關(guān)鍵。

統(tǒng)計描述就是給數(shù)據(jù)拍張快照唄，看看他們長什么樣子。我們熟知的均數(shù)、中位數(shù)就是用來看他們扎堆的位置，扎在什么地方；標(biāo)準(zhǔn)差、四分位數(shù)間距等就是用來看他們扎堆的程度，扎得有多緊。當(dāng)然我們也可以用直方圖，箱線圖，散點圖等統(tǒng)計圖形來更為形象直觀的查看。

統(tǒng)計推斷是用我們手中的樣本數(shù)據(jù)來推斷其背后的總體特征。統(tǒng)計推斷里有兩大塊內(nèi)容：參數(shù)估計和假設(shè)檢驗。參數(shù)估計就是我們用樣本的統(tǒng)計量（如樣本均數(shù)）去估計總體的參數(shù)（如總體均數(shù)）。此時，我們可以有兩種策略：一種是簡單了事，直接把樣本統(tǒng)計量當(dāng)做總體參數(shù)，這就是所謂的點估計；另外一種策略就是考慮到抽樣誤差，我們用一個范圍，而不是一個單一的值去估計總體參數(shù)，此即所謂的區(qū)間估計。而假設(shè)檢驗則是利用小概率反正法思想，從問題的對立面（H0，原假設(shè)）出發(fā)，假定H0成立的條件下，去計算檢驗統(tǒng)計量，獲得P值，再通過P值來在H0，H1（備擇假設(shè)）之間做進(jìn)一步取舍。

既然統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的核心和關(guān)鍵，看到這里，你也能體會到作為假設(shè)檢驗的黃金判定標(biāo)準(zhǔn)的P值，在統(tǒng)計學(xué)中的地位啦。那具體而言，什么是P值呢？

P值和假設(shè)檢驗

什么是P值呢？按照頻率學(xué)派的經(jīng)典套路：

敷衍的人會告訴你：「P值啊，就是P Value，Probability Value，就是概率啊」聽完我們想揍死他，你還別笑，有些統(tǒng)計培訓(xùn)班還真這么講的
老實本分的老師會告訴你：「P值啊，就是在H0為真的條件下，獲得當(dāng)前樣本或者更偏的樣本的概率」。聽完我們很迷茫啊，看著我們迷茫的眼神，老師無奈的寫下「P=Prob(X|H0)」，我們只好無奈且善意的點點頭
少有的明白人會告訴你：「P值啊，就是在H0為真時，觀察到的差異來源于抽樣誤差的可能性大小」

P值就是在H0為真時，觀察到的差異來源于抽樣誤差的可能性大小。聽完這個解釋，或許我們眼前能閃現(xiàn)一絲靈光。我們以正態(tài)分布的Z檢驗為例簡要說明下，不知道不理解為什么那么多的統(tǒng)計教材竟然要以t檢驗為例來講假設(shè)檢驗。如果你被他們毒害了，不知道什么是Z檢驗，請看如下公式：

看不懂？不著急。一步一步來。依據(jù)「P值就是在H0為真時，觀察到的差異來源于抽樣誤差的可能性的大小」這一定義，我們假定H0為真，也就是假定樣本均數(shù)「X Bar」(即X頭上抬根杠，微信編輯器什么時候能插入公式啊,只好擬音啦) 就等于總體均數(shù)「miu」（擬音），但是實際上，我們利用手中的樣本數(shù)據(jù)計算的均數(shù) 「X Bar」和總體均數(shù)「miu」總是有差異的，這個差異就是公式中的分子，但是這個差異缺乏一個統(tǒng)一的度量，于是我們除以一個總體的變異幅度（暫且用標(biāo)準(zhǔn)誤代替，也就是上圖中的分母），這樣就得到一個以總體變異幅度來度量的差異，也就是說這個差異是多個標(biāo)準(zhǔn)誤，或者說差了多少個標(biāo)準(zhǔn)誤的距離，這個就是我們所說的統(tǒng)計量，Z值?，F(xiàn)在在看看Z檢驗的公式，是否好容易理解多了？統(tǒng)計量Z值其實就是樣本均數(shù)和總體均數(shù)相差的，以標(biāo)準(zhǔn)誤度量的單位量。

那么P值呢？別急。每一個Z值可以對應(yīng)到一個相應(yīng)的P值，比如，Z=1.96表示差了1.96倍標(biāo)準(zhǔn)誤的距離，對應(yīng)的P 值就是0.05。

但是不同的分布，統(tǒng)計量不同，因此難以標(biāo)化統(tǒng)一，不過P 值卻可以，而且在實際操作中，由于計算機統(tǒng)計軟件包的發(fā)展，P值也很容易獲得。獲得P值后，比如，比如啊，P=0.003，我們可以回過頭來想：既然我們已經(jīng)假定H0為真了，也就是（「X Bar」-「miu」）應(yīng)該沒有差異了，但是現(xiàn)在還有Z倍標(biāo)準(zhǔn)誤的差異??！那現(xiàn)在這個差異是哪里來的呢？只有一個可能的原因：抽樣誤差。但是現(xiàn)在可以歸因于抽樣誤差的概率很小，只有0.003啊（統(tǒng)計軟件計算結(jié)果），0.003的概率，1000次也才3次，竟然一次就讓我們趕上了，這不太可能吧？是的，確實不太可能。那我們就只能回過頭來懷疑我們的根基，我們的原假設(shè)H0錯了，因此我們否定H0，接受H1。