家系劃分,也算是將親緣關(guān)系近的放在一起,作為一個(gè)家系。因此是可以使用系譜構(gòu)建的親緣關(guān)系A(chǔ)矩陣,進(jìn)行聚類分析,然后可視化,然后挑選家系的。 如果沒(méi)有系譜,也可以根據(jù)不同的表型,進(jìn)行相關(guān)分析,得到相關(guān)系數(shù)矩陣,然后進(jìn)行家系劃分的。當(dāng)然,這個(gè)就比較扯,因?yàn)殚L(zhǎng)得像不一定是一個(gè)家系,而家系默認(rèn)為是有親緣關(guān)系的。 那怎么辦? 可以檢測(cè)基因型數(shù)據(jù),就可以根據(jù)G矩陣進(jìn)行聚類分析,家系劃分的。 道理都是相通的,很有意思。 概念定義 共祖系數(shù):共祖系數(shù)為概率fAB,表示一個(gè)來(lái)自個(gè)體A,另一個(gè)來(lái)自個(gè)體B的兩個(gè)同源基因(或等位基因)在系譜上是一致或相同的概率,也就是說(shuō)來(lái)自同一祖先基因的概率, 相關(guān)系數(shù): 是2倍的共祖系數(shù) 近交系數(shù): 近交系數(shù)(inbreeding coefficient)是指根據(jù)近親交配的世代數(shù),將基因的純化程度用百分?jǐn)?shù)來(lái)表示即為近交系數(shù),也指?jìng)€(gè)體由于近交而造成異質(zhì)基因減少時(shí),同質(zhì)基因或純合子所占的百分比也叫近交系數(shù),個(gè)體中兩個(gè)親本的共祖系數(shù)。 如果系譜構(gòu)建好的A矩陣,如何進(jìn)行家系劃分呢? 1. 數(shù)據(jù)格式:矩陣包括行號(hào)和列號(hào) 2. 熱點(diǎn)圖+聚類
![]() 3. 縱向聚類圖1
![]() 4. 縱向聚類圖2
![]() 5. 橫向聚類圖
![]() 6. 拓展:家系劃分關(guān)于拓展,你有什么想到的呢? 如果根據(jù)系譜,構(gòu)建A矩陣,然后將相關(guān)的個(gè)體提取出來(lái),劃分家系,這不就是聚類分析靈活的例子么? 如果根據(jù)基因組信息,構(gòu)建G矩陣或者H矩陣,然后將感興趣的個(gè)體提取出來(lái),劃分家系,指導(dǎo)育種選配,不也是一個(gè)方向么? 然后題目就構(gòu)成了:如何利用系譜信息進(jìn)行家系劃分并可視化 上面是之前的思路,現(xiàn)在實(shí)現(xiàn)了用G矩陣劃分家系了,實(shí)踐效果很好,下面介紹一下思路: 1,構(gòu)建G矩陣,可以是GCTA,可以是GEMMA,可以是ASRGenomics,也可以是R編程,都可以。 2,標(biāo)準(zhǔn)化矩陣,因?yàn)镚矩陣會(huì)有偏,比如為負(fù)數(shù),比如對(duì)角線小于1,這里可以將對(duì)角線標(biāo)準(zhǔn)化為1,負(fù)值變?yōu)?,相當(dāng)于用G相關(guān)系數(shù)矩陣代替 3,全同胞,考慮到孟德爾隨機(jī)誤差,可以設(shè)置范圍0.3~0.6,提取相關(guān)符合的個(gè)體對(duì) 4,分組,如果出現(xiàn)了一次,就劃分到同一個(gè)家系中 5,家系間計(jì)算平均相關(guān)系數(shù),如果比較接近,也可以考慮合并家系 下一篇分享一下具體代碼。 分割線 1,快來(lái)領(lǐng)取 | 飛哥的GWAS分析教程 4,R語(yǔ)言學(xué)習(xí)看最新版的電子書不香嘛? |
|
來(lái)自: 育種數(shù)據(jù)分析 > 《待分類》