基因的上下游分析

實(shí)驗介紹基因的上下游分析是做生物醫學(xué)研究必要的分析之一,但需要整合各種調控數據庫以及多樣本基因表達數據,某些研究人員可能無(wú)從下手!
您只需要提供感興趣的基因(或者miRNA,TF)名稱(chēng),云生信整合全世界權威公共數據庫所有樣本數據,從眾多基因上下游的分析結果中,挑選出與疾病最相關(guān)的結果。結果作為實(shí)驗的理論支持,大大降低實(shí)驗的假陽(yáng)性!
基因的上下游分析分析內容:
1. 轉錄因子調控靶基因分析(TF-target);
2. microRNA調控靶基因分析(miRNA-Target);
3. 蛋白質(zhì)與蛋白質(zhì)相互作用分析(PPI);
4. 其他,例如TF-miRNA、TF-lncRNA、lncRNA-mRNA、miRNA-lncRNA等。
云生信整合的全世界權威公共數據庫所有樣本數據:
1. 各個(gè)物種的轉錄調控數據庫(TRANSFAC、JASPAR、TRED、PAZAR、AGRIS、RegulateDB、CHIPBASE等);
2. 各種miRNA調控靶基因的算法工具(miRBase、miRWalk、TargetScan、miRanda、PicTar、PITA等);
3. 蛋白互作數據庫(如HPRD、STRING、DIP、BioGRID、MINT等);
4. TCGA數據庫的RNA-seq、small-RNA-seq等;
5. GEO數據庫的基因芯片、miRNAx芯片等。
圖片可直接使用:
云生信團隊的分析過(guò)程依托于云生信分析平臺(www.bioclouservice.com ),獲得的分析圖片完全達到SCI論文的水平要求,可以直接使用。
分析耗時(shí)及報價(jià):
基因的每種調控分析為1500元,與疾病關(guān)聯(lián)的精確分析為2000元。多個(gè)基因或多種調控同時(shí)分析還有大優(yōu)惠!
結直腸癌相關(guān)的miR-***的上游和下游調控關(guān)系分析樣例
分析目的:
通過(guò)對結直腸癌公共芯片數據的分析,獲得與結直腸癌相關(guān)的mir-***調控的上游、下游基因。
分析過(guò)程:
1. 公共芯片數據的選擇下載。
本分析使用的數據下載自GEO(GSE4****)[1],樣本來(lái)自1992年至2004年期間在MSK腫瘤中心接受診治的結直腸癌患者,包括1**例結直腸癌樣本,與5*例正常結直腸組織對照。芯片平臺使用的是Affymetrix HG-U133A ,能夠檢測超過(guò)*****個(gè)人基因的轉錄表達水平。
2. 差異表達基因分析
我們使用R軟件包Limma[2]中的經(jīng)驗貝葉斯模型識別1**例結直腸癌與5*例正常結直腸組織之間的差異表達基因,以logFC絕對值大于或者等于0.585(相當于1.5倍的平均表達水平改變)和adj.P.Val 小于0.05為基因顯著(zhù)差異表達的閾值。adj.P.Val是Benjamini & Hochberg方法[3]進(jìn)行多重檢驗校正的結果。我們一共發(fā)現了522個(gè)顯著(zhù)上調基因和653個(gè)顯著(zhù)下調基因。
3. miRNA靶基因關(guān)系分析
使用miRecord數據庫[4]的實(shí)驗驗證數據,以及miRecord數據庫的預測數據。其中,miRecord預測工具我們使用了miranda[5],mirtarget2[6],pita[7],rnahybrid[8],targetscan[9]這5中預測方法進(jìn)行分析,然后選擇預測結果出現4次及以上的關(guān)系對作為 miRNA調控靶基因關(guān)系對。最后,我們將這些預測得到的靶基因與結直腸癌差異表達基因進(jìn)行交集分析,得到了miRNA調控的差異表達基因信息。
miRecord Validated Targets數據庫中,經(jīng)過(guò)實(shí)驗驗證的miR-***調控靶基因只有一個(gè)結果,即 MTA1基因。miRecord Predicted Targets數據庫中,選擇大于等于4次的關(guān)系對,最終得到了2214個(gè)靶基因。
將實(shí)驗驗證結果+預測結果共計2215個(gè)靶基因與522個(gè)顯著(zhù)上調基因和653個(gè)顯著(zhù)下調基因取交集后,分別得到了49個(gè)上調靶基因和58個(gè)下調靶基因。如圖1所示。
圖1 miR-***的靶基因與差異表達基因的venn圖
4. TF調控miRNA分析
我們使用CHIPbase[10]數據預測分析調控miR-***的轉錄因子(TF)信息,然后從中篩選出屬于差異表達基因的TF。
利用CHIPbase數據庫我們得到,調控miR-***的轉錄因子共有**個(gè),其中屬于結直腸癌差異表達基因的共有2個(gè),即MYC,CEBPB。
5. 構建整合網(wǎng)絡(luò )圖。
結合miR-***的上游和下游分析結果,使用cytoscape[11]軟件做圖,結果如圖2所示。
圖2 整合網(wǎng)絡(luò )圖。菱形代表轉錄因子(TF);六邊形代表miRNA;橢圓代表靶基因。紅色代表差異上調基因,綠色代表差異下調基因。
結論
通過(guò)以上的分析,我們能夠得到與疾?。ńY直腸癌)相關(guān)的差異表達基因列表,miR-***調控的靶基因以及被調控的轉錄因子,并從中獲得與結直腸癌相關(guān)的miR-***的上游和下游關(guān)系。我們可以從中獲得重要的轉錄因子,并挑選合適的靶基因。
參考文獻1.Sheffer, M., et al., Association of survival and disease progression with chromosomal instability: a genomic exploration of colorectal cancer. Proceedings of the National Academy of Sciences of the United States of America, 2009. 106(17): p. 7131-6.
2.Smyth, G.K., Limma: linear models for microarray data, in Bioinformatics and Computational Biology Solutions Using {R} and Bioconductor, R.G.a.V.C.a.S.D.a.R.I.a.W. Huber, Editor. 2005, Springer: New York. p. 397--420.
3.Benjamini, Y.H., Yosef Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society, Series B, 1995. 57(1): p. 289-300.
4.Xiao, F., et al., miRecords: an integrated resource for microRNA-target interactions. Nucleic acids research, 2009. 37(Database issue): p. D105-10.
5.John, B., et al., Human MicroRNA targets. PLoS biology, 2004. 2(11): p. e363.
6.Wang, X., miRDB: a microRNA target prediction and functional annotation database with a wiki interface. RNA, 2008. 14(6): p. 1012-7.
7.Kertesz, M., et al., The role of site accessibility in microRNA target recognition. Nature genetics, 2007. 39(10): p. 1278-84.
8.Kruger, J. and M. Rehmsmeier, RNAhybrid: microRNA target prediction easy, fast and flexible. Nucleic Acids Res, 2006. 34(Web Server issue): p. W451-4.
9.Agarwal, V., et al., Predicting effective microRNA target sites in mammalian mRNAs. Elife, 2015. 4.
10.Yang, J.H., et al., ChIPBase: a database for decoding the transcriptional regulation of long non-coding RNA and microRNA genes from ChIP-Seq data. Nucleic Acids Res, 2013. 41(Database issue): p. D177-87.
11.Smoot, M.E., et al., Cytoscape 2.8: new features for data integration and network visualization. Bioinformatics, 2011. 27(3): p. 431-432.