筆記 GWAS 操作流程5-1:根紅苗正的GWAS分析軟件:GEMMA1. GEMMA軟件介紹這個肯定厲害了,是「大家閨秀」,是「名門望族」,是「根紅苗正」的GWAS分析軟件。 「GEMMA名稱來源:」
「GEMMAX主要特點:」 ? 2. GEMMA語法特點相對于plink的語法,GEMMA語法更簡練,一個杠,一個字母。比如:
GEMMA支持plink的二進制文件:
「表型數(shù)據(jù)格式:」一列,注意順序和基因組的ID順序一致,如果是多個性狀,那就是多列,沒有ID列。
比如下面的數(shù)據(jù)是一個協(xié)變量,第一列為截距。 3. GEMMA分析一般線性模型沒有協(xié)變量「首先將plink格式轉(zhuǎn)化為二進制的plink格式:」 plink --file b --make-bed --out c 「然后將表型數(shù)據(jù)提取單獨一列:」 awk '{print $3}' phe.txt >p.txt 「然后進行一般線性模型關(guān)聯(lián)分析:」 gemma-0.98.1-linux-static -bfile c -p p.txt -lm 1 「結(jié)果和plink的linear結(jié)果對比:」 plink的結(jié)果: 兩者結(jié)果完全一致。 事實上,加上協(xié)變量的分析,gemma和plink的結(jié)果也是一樣的,因為都是應(yīng)用的是一般線性模型。 4. GEMMA分析混合線性模型「第一步:先生成G矩陣」 gemma-0.98.1-linux-static -bfile c -gk 2 -p p.txt 代碼解釋:
GEMMA 0.98.1 (2018-12-10) by Xiang Zhou and team (C) 2012-2018 G矩陣在output文件夾下:result.sXX.txt 「第二步:使用混合線性模型進行GWAS分析」 gemma-0.98.1-linux-static -bfile c -k output/result.sXX.txt -lmm 1 -p p.txt GEMMA 0.98.1 (2018-12-10) by Xiang Zhou and team (C) 2012-2018 「第三步:查看結(jié)果文件」結(jié)果在output文件夾下:result.assoc.txt 5. GEMMA中LM模型和LMM模型的結(jié)果比較setwd("/home/dengfei/gwas/qmsim/dat/plink_file/10_gemma_analysis_lmm/output") 「Pvalue比較」 > cor(re1$p_wald.x,re1$p_wald.y) 「Beta回歸系數(shù)比較:」 > cor(re1$beta.x,re1$beta.y)
寫到這里,流暢的感覺撲鼻而來,不寫了,發(fā)個朋友圈,洗洗睡吧……
|
|
來自: 育種數(shù)據(jù)分析 > 《待分類》