2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

統(tǒng)計?我懂個P!

 智慧之吻 2016-06-17

也不知道P值是誰惹誰了,反正大家都喜歡拿他開刷!老早就有一篇爭議挺大的公眾號文章說「P值已死」,立馬就有人反駁「別鬧了,P值沒死」。其實, Nature雜志在14年2月份時就刊發(fā)了一篇文章,對統(tǒng)計效度的金標(biāo)準(zhǔn)「P值」提出了質(zhì)疑,認(rèn)為P值并沒有統(tǒng)計學(xué)家所認(rèn)為的那樣可信。


我們暫且把這個問題擱置一下,替P值君問一句:「為什么受傷的總是我呀?是我是我還是我」真要說起個問題,咱們得從統(tǒng)計學(xué)的框架說起。


現(xiàn)代統(tǒng)計學(xué)的框架


現(xiàn)代統(tǒng)計學(xué)兩分天下:一分統(tǒng)計描述,一分統(tǒng)計推斷。統(tǒng)計書上經(jīng)常這樣表述:統(tǒng)計描述和統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的兩個組成部分,兩者相輔相成、缺一不可,統(tǒng)計描述是現(xiàn)代統(tǒng)計學(xué)的基礎(chǔ)和前提,統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的核心和關(guān)鍵。



統(tǒng)計描述就是給數(shù)據(jù)拍張快照唄,看看他們長什么樣子。我們熟知的均數(shù)、中位數(shù)就是用來看他們扎堆的位置,扎在什么地方;標(biāo)準(zhǔn)差、四分位數(shù)間距等就是用來看他們扎堆的程度,扎得有多緊。當(dāng)然我們也可以用直方圖,箱線圖,散點圖等統(tǒng)計圖形來更為形象直觀的查看。


統(tǒng)計推斷是用我們手中的樣本數(shù)據(jù)來推斷其背后的總體特征。統(tǒng)計推斷里有兩大塊內(nèi)容:參數(shù)估計和假設(shè)檢驗。參數(shù)估計就是我們用樣本的統(tǒng)計量(如樣本均數(shù))去估計總體的參數(shù)(如總體均數(shù))。此時,我們可以有兩種策略:一種是簡單了事,直接把樣本統(tǒng)計量當(dāng)做總體參數(shù),這就是所謂的點估計;另外一種策略就是考慮到抽樣誤差,我們用一個范圍,而不是一個單一的值去估計總體參數(shù),此即所謂的區(qū)間估計。而假設(shè)檢驗則是利用小概率反正法思想,從問題的對立面(H0,原假設(shè))出發(fā),假定H0成立的條件下,去計算檢驗統(tǒng)計量,獲得P值,再通過P值來在H0,H1(備擇假設(shè))之間做進(jìn)一步取舍。



既然統(tǒng)計推斷是現(xiàn)代統(tǒng)計學(xué)的核心和關(guān)鍵,看到這里,你也能體會到作為假設(shè)檢驗的黃金判定標(biāo)準(zhǔn)的P值,在統(tǒng)計學(xué)中的地位啦。那具體而言,什么是P值呢?


P值和假設(shè)檢驗


什么是P值呢?按照頻率學(xué)派的經(jīng)典套路:

  • 敷衍的人會告訴你:「P值啊,就是P Value,Probability Value,就是概率啊」聽完我們想揍死他,你還別笑,有些統(tǒng)計培訓(xùn)班還真這么講的

  • 老實本分的老師會告訴你: 「P值啊,就是在H0為真的條件下,獲得當(dāng)前樣本或者更偏的樣本的概率」。聽完我們很迷茫啊,看著我們迷茫的眼神,老師無奈的寫下「P=Prob(X|H0)」,我們只好無奈且善意的點點頭

  • 少有的明白人會告訴你:P值啊,就是在H0為真時,觀察到的差異來源于抽樣誤差的可能性大小


P值就是在H0為真時,觀察到的差異來源于抽樣誤差的可能性大小。聽完這個解釋,或許我們眼前能閃現(xiàn)一絲靈光。我們以正態(tài)分布的Z檢驗為例簡要說明下,不知道不理解為什么那么多的統(tǒng)計教材竟然要以t檢驗為例來講假設(shè)檢驗。如果你被他們毒害了,不知道什么是Z檢驗,請看如下公式:




看不懂?不著急。一步一步來。依據(jù)「P值就是在H0為真時,觀察到的差異來源于抽樣誤差的可能性的大小」這一定義,我們假定H0為真,也就是假定樣本均數(shù)「X Bar」(即X頭上抬根杠,微信編輯器什么時候能插入公式啊,只好擬音啦) 就等于總體均數(shù)「miu」(擬音),但是實際上,我們利用手中的樣本數(shù)據(jù)計算的均數(shù) 「X Bar和總體均數(shù)「miu總是有差異的,這個差異就是公式中的分子,但是這個差異缺乏一個統(tǒng)一的度量,于是 我們除以一個 總體的變異幅度(暫且用標(biāo)準(zhǔn)誤代替,也就是上圖中的分母), 這樣就得到一個以總體變異幅度來度量的差異,也就是說這個差異是多個標(biāo)準(zhǔn)誤,或者說差了多少個標(biāo)準(zhǔn)誤的距離,這個就是我們所說的統(tǒng)計量,Z值?,F(xiàn)在在看看Z檢驗的公式,是否好容易理解多了? 統(tǒng)計量Z值其實就是樣本均數(shù)和總體均數(shù)相差的,以標(biāo)準(zhǔn)誤度量的單位量。


那么P值呢?別急。每一個Z值可以對應(yīng)到一個相應(yīng)的P值,比如,Z=1.96表示 差了1.96倍標(biāo)準(zhǔn)誤的距離,對應(yīng)的P 值就是0.05。





但是不同的分布,統(tǒng)計量不同,因此難以標(biāo)化統(tǒng)一,不過P 值卻可以,而且在實際操作中,由于計算機統(tǒng)計軟件包的發(fā)展,P值也很容易獲得。 獲得P值后,比如,比如啊,P=0.003,我們可以回過頭來想:既然我們已經(jīng)假定H0為真了,也就是(「X Bar」-「miu」)應(yīng)該沒有差異了,但是現(xiàn)在還有Z倍標(biāo)準(zhǔn)誤的差異??! 那現(xiàn)在這個差異是哪里來的呢?只有一個可能的原因:抽樣誤差。但是現(xiàn)在可以歸因于抽樣誤差的概率很小,只有0.003啊(統(tǒng)計軟件計算結(jié)果),0.003的概率,1000次也才3次,竟然一次就讓我們趕上了,這不太可能吧?是的,確實不太可能。那我們就只能回過頭來懷疑我們的根基,我們的原假設(shè)H0錯了,因此我們否定H0, 接受H1。




這才是我們的假設(shè)檢驗。這才是我們的P值。既然P值是假定H0為真的條件下,我們所觀察到的差異來源于抽樣誤差的概率。這很容易讓我們想到,如果H0真的為真,我們因P值<>


I類錯誤的概率是不是P值呢?To P or not to P, that's a question。 要說起清楚這個問題,還得勞神費心另寫一篇:假設(shè)檢驗的前世今生。


P.S.部分圖片來自Google搜索。



按: SAS官方在1月15日,北上廣三地同時有線下活動,感興趣的可以去看看。北京這邊某人有一個「醫(yī)學(xué)研究里的SAS PROC和SAS 繪圖主題的分享」,可以去捧場,或者踢館!報名:http://club./Active.aspx

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多