2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

[神器分享] 自從用了這個神器,大規(guī)模RNA-seq數(shù)據(jù)挖掘我也可以

 百味科研芝士 2019-04-14

作者:白介素2

大家好,我是白介素2同學,想必小伙伴們早已開工了,白介素同學這個春節(jié)實在是沒怎么學習呀(所謂人在江湖,身不由己,容我甩個鍋),慚愧慚愧,悟已往之不諫,知來者之可追。新的一年,我們都是追夢人!

追夢,分享一個神器,向科研更深處探索


咱不來虛的,只分享干貨,不談枯燥的理論,只來通俗易懂的操作。先來看一張圖:

通過這張圖展示的是 GEO數(shù)據(jù)庫中的 RNA-seq數(shù)據(jù)與芯片數(shù)據(jù)積累隨時間的變化,很顯然測序數(shù)據(jù)從2015年開始就已經(jīng)超過了芯片數(shù)據(jù)的累積。大批量的數(shù)據(jù)產(chǎn)生固然是個好事,同時也帶來了一個問題,公開的RNA-seq數(shù)據(jù)大多提供的是原始數(shù)據(jù),這樣就對數(shù)據(jù)的重新挖掘使用帶來了很大困難。為啥嘞,數(shù)據(jù)量太大,臨床醫(yī)生,小實驗室你確定做得了,就連測序數(shù)據(jù)從原始數(shù)據(jù)開始的分析都會遇到很多困難?今天要介紹的神器呢叫做 ARCHS4,它的誕生呢就是為了解決這個問題,過程講的比較復(fù)雜,簡單講就是有一個團隊人家用有效的設(shè)備算法把 GEO/SRA 原始數(shù)據(jù)整合,分析,預(yù)處理成方便后續(xù)分析的矩陣格式,就像 TCGA那樣的數(shù)據(jù)庫,之所以應(yīng)用廣泛,數(shù)據(jù)整理的格式就是原因之一呀。該數(shù)據(jù)庫包括人和鼠的sample 187,946 , 其中人84,863,鼠103,083。接下來就看下具體這個神器有哪些功能吧:

數(shù)據(jù)下載功能Download

https://amp.pharm./archs4/download.html

可供下載的數(shù)據(jù)包括:

這里只列舉了部分,甚至還包括了 TCGA的數(shù)據(jù),數(shù)據(jù)都整理為 H5格式,數(shù)據(jù)包括原始的 read count數(shù)據(jù)和 meta data信息,簡單講這些數(shù)據(jù)都整理成了方便后續(xù)分析的矩陣格式,可以這樣全部下載。

當然也可以挑選自己感興趣的下載,可以挑選自己感興趣的組織,細胞系,也可以手動選擇,基因集,Download部分會自動產(chǎn)生下載數(shù)據(jù)的 R代碼,放到 Rstudio運行即可。

這里白介素同學,隨便測試下在了一個代碼,可以看看長啥樣,有R基礎(chǔ)的小伙伴應(yīng)該更容易理解:

大概就是這樣,運行下就可以啦。

https://amp.pharm./archs4/data.html#

此外數(shù)據(jù)下載后,就是做數(shù)據(jù)解析了,H5文件格式的解析,批次效應(yīng)移除等,都有提供相應(yīng)的代碼:

提供代碼鏈接:https://amp.pharm./archs4/help.html


查詢功能

meta data信息查詢,可以看下自己感興趣的組織, 細胞系等的。

查找 signature,輸入數(shù)據(jù)為上調(diào)和下調(diào)基因,尋找match這些基因的sample。

富集查詢,找到富集某些基因集的sample然后下載,可以從8個基因集庫中選擇感興趣的,比如KEGG,GO庫,其實這是一個反向的操作,與咱們通常的差異分析得到基因集進行富集不同,這是一種通過感興趣的通路,基因集來找sample。

基因查詢功能,遇到一個感興趣的基因,這時候這個功能就派上用場啦,比如案例給出的 FOXM1基因

點擊下就可以得到很多信息:

主要功能就是這些啦,提供處理過的數(shù)據(jù)下載和查詢功能。然后就是了解下這個數(shù)據(jù)庫的背景,文章在20184月發(fā)表在 Nature Communcations上。

內(nèi)容就分享到這兒啦,白介素同學祝大家學習愉快! 

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多