分類資料的組間比較非常簡單,不像定量資料那樣,還得看正態(tài)性、方差齊性這么煩人的過程。唯一需要看的就是結(jié)局是什么樣子。所以,如果說定量資料你能用錯(cuò),你還可以說,你不會(huì)做正態(tài)性檢驗(yàn)、不會(huì)方差齊性檢驗(yàn)。那么如果分類資料的組間比較你用錯(cuò)的,真的沒有什么理由可以找,所以你真的沒有任何犯錯(cuò)的理由。 分類資料就是那些可以劃分類別的數(shù)據(jù),兩類和多類均可,只不過需要注意一下多類別的時(shí)候可能是有序的,也可能是無序的。無序的就是沒有什么等級(jí)高低順序,就像血型,沒有什么理由認(rèn)為A比B要高一等或低一等。有序就是能看出一種天然的順序,就像療效,無效、顯效、痊愈,給人感覺痊愈就是比顯效高一等。 有一種情形要注意,不是看到率或百分比就要認(rèn)為是分類資料,就要用卡方檢驗(yàn)的。有的率是作為連續(xù)資料來分析的。比如脂肪百分比,雖然也是個(gè)比例,但你沒法用卡方檢驗(yàn)。因?yàn)檫@個(gè)百分比是每個(gè)人都有一個(gè)這樣的數(shù)值,你能做的是把每個(gè)人的百分比作為一個(gè)定量資料,然后進(jìn)行組間比較。以前就有人真的這么問過我說:這不是比例嗎?比例不是都得用卡方嗎?我想這種觀念很可能是老師在教學(xué)的時(shí)候習(xí)慣把比例和率跟卡方聯(lián)系起來,事實(shí)上未必,其實(shí)用“分類資料”這樣的字眼更好一些。分類資料的比例,說的是一定的數(shù)量占所有人的百分比,具體到每個(gè)人來說,他只有0或1這樣的數(shù)值(多分類也可能是0、1、2等),計(jì)算的比例是0或1占的比例。而剛才這種情形是每個(gè)人都有一個(gè)具體的不同數(shù)值,這是完全不同的。 對(duì)于分類資料的組間比較,可以通過下面這樣一張圖來選擇方法: 從這個(gè)圖不難看出,分類資料的組間比較只需要注意三點(diǎn)就可以: (1)設(shè)計(jì)類型。這個(gè)你自己是很清楚的。大多數(shù)情況下,可能我們做的都是基于完全隨機(jī)設(shè)計(jì)的。對(duì)于沒有設(shè)計(jì)的,如比較男女之間的發(fā)病率,男女分組不是隨機(jī)設(shè)計(jì)的,那也采用完全隨機(jī)設(shè)計(jì)的方法來分析。 (2)組別數(shù),從小學(xué)一年級(jí)就應(yīng)該能數(shù)的很清楚了。 (3)重要的是結(jié)局的類型,是二分類還是多分類,多分類是有序的還是無序的。 從圖中不難看出,最重要的是你的結(jié)局的類型,對(duì)于完全隨機(jī)設(shè)計(jì),只要你的結(jié)局是二分類和無序多分類,不管是比較2組還是多組,都可以毫不猶豫地選擇卡方檢驗(yàn)。但如果是有序多分類,那就需要根據(jù)是2組還是多組,選擇相應(yīng)的方法。 其實(shí),對(duì)于定量資料的組間比較和分類資料的組間比較,我想表達(dá)的并不僅僅是畫兩幅圖讓大家照著來找分析方法,更重要的是,學(xué)會(huì)一種分析思路。如果看一下統(tǒng)計(jì)學(xué)教材,不難看出教材的特點(diǎn),大都是以不同方法作為章節(jié)區(qū)分的依據(jù),比如第二章講t檢驗(yàn),第三章講卡方檢驗(yàn),等等。作為教材的編纂,這無可厚非,但作為老師講課,卻不一定非要嚴(yán)格按照這種方式來講。 為什么國內(nèi)好多學(xué)生,學(xué)了1年的統(tǒng)計(jì),真正碰到數(shù)據(jù)的時(shí)候,卻總是束手無策,甚至連最基本的分析思路都不知道,空學(xué)了一肚子的t檢驗(yàn)和卡方檢驗(yàn),卻不知道從哪兒下手。我想,也許是因?yàn)榻滩牡慕淌诜绞礁覀儗?shí)際分析的思路恰好相反。實(shí)際分析數(shù)據(jù)時(shí),你收集了一批數(shù)據(jù),然后需要根據(jù)數(shù)據(jù)的類型、特征、分布等選擇恰當(dāng)?shù)姆椒?;而教材中,是把各種方法割裂開,講各種方法的使用條件。 那么,當(dāng)你面對(duì)一堆數(shù)據(jù)的時(shí)候,你是把你腦子中的各種方法逐一來匹配一下嗎?每個(gè)方法都來試試,看看哪個(gè)符合應(yīng)用條件?還是根據(jù)數(shù)據(jù)類型、特征來選擇合適的方法呢?我想可能根據(jù)數(shù)據(jù)的條件來選擇方法更加自然一些,這是一種分析思路。而用方法來套數(shù)據(jù)這不是分析思路。也許,這就是為什么你學(xué)了這么久統(tǒng)計(jì),卻始終還不了解分析思路的原因。 所以,其實(shí)對(duì)于定量資料和分類資料的這2張圖,更重要的是學(xué)會(huì)分析思路,不要用方法去套數(shù)據(jù),而要根據(jù)數(shù)據(jù)來選方法。久而久之,才會(huì)形成自己的分析體系。 |
|