WGCNA分析

實(shí)驗介紹基因共表達網(wǎng)絡(luò )分析致力于尋找協(xié)同表達的基因模塊,并探索基因網(wǎng)絡(luò )與研究者關(guān)注的表型之間的關(guān)聯(lián)關(guān)系。它基于高通量的微陣列技術(shù),應用基因表達芯片得到實(shí)驗數據沒(méi)從轉錄水平探索基因網(wǎng)絡(luò )與疾病或者性狀之間的關(guān)聯(lián)關(guān)系,因此應用與復雜疾病的易感基因的鑒定、新藥研發(fā)等生物醫學(xué)領(lǐng)域。
加權基因共表達網(wǎng)絡(luò )構建(weighted gene co-expression network,WGCNA)算法作為一種高效、準確的生物信息學(xué)、生物數據挖掘方法,理論不斷完善,應用日漸廣泛。該算法基于高通量的基因信使RNA(mRNA)表達芯片數據,被廣泛應用于國際生物醫學(xué)領(lǐng)域。WGCNA算法首先假定基因網(wǎng)絡(luò )服從無(wú)尺度分布,并定義基因共表達相關(guān)矩陣、基因網(wǎng)絡(luò )形成的鄰接函數,然后計算不同節點(diǎn)的相異系數,并據此構建分層聚類(lèi)樹(shù)(hierarchical clustering tree),該聚類(lèi)樹(shù)的不同分支代表不同的基因模塊(module),模塊內基因共表達程度高,而分屬于不同模塊的基因共表達程度低。最后,探索模塊與特定表型或疾病的關(guān)聯(lián)關(guān)系,最終達到鑒定疾病治療的靶點(diǎn)基因、基因網(wǎng)絡(luò )的目的。
圖1. 利用WGCAN篩選疾病顯著(zhù)性共表達網(wǎng)絡(luò )模塊的過(guò)程(a基因表達相似性聚類(lèi)圖(下面的橙色條帶代表表達量,上面是根據表達量對基因的聚類(lèi));b參數β選擇(兩圖中橫軸均代表權重參數β,左圖中縱軸為網(wǎng)絡(luò )中連接點(diǎn)個(gè)數取對數log(k)和節點(diǎn)出現的概率的對數值log(p(k))的相關(guān)系數的平方,右圖中縱軸代表平均連通度;c.權重共表達網(wǎng)絡(luò )聚類(lèi)結果,圖中不同顏色代表不同的聚類(lèi)模塊,左側為模塊特征向量的距離;d. 模塊中基因顯著(zhù)性GS均值及誤差分布)
圖2. WGCNA模塊中與疾病顯著(zhù)相關(guān)的網(wǎng)絡(luò )模塊