當前位置:首頁 > 技術交流 > 最新應用

技術交流

掃描二維碼
或添加“GeneGroup003
獲取更多最新資訊

商城訂購

掃描二維碼
或添加“生物通ebiobuy
手機下單,快人一步

GSEA基因集富集分析—高階篇

版權所有,轉載請聯系基因市場部
2019-03-19

上期介紹了GSEA數據分析的基礎原理,闡述了為什么要做GSEA分析,以及我司的優化的GSEA數據分析的亮點,接著一段視頻欣賞重磅升級的GSEA數據網頁版的效果!



貝晶升級的GSEA數據分析

亮點一

GSEA分析所有圖形的分辨率都是出版級別, 適用于任何高影響因子的雜志。

亮點二

我司GSEA圖相比Broad Institute圖增加了陰影區域標示零假設分布,這樣更容易比較看出p-value的顯著性,便于用戶更直觀比較數據結果的準確性。

 

亮點三

結合GSEA檢出的差異功能集,后續還可以進行其它數據分析,進一步解讀轉錄組下游功能,如在差異基因集中做轉錄因子分析;并提取轉錄因子顯著富集結果進行激酶底物富集分析,匯總推測得到的Kinase(激酶), TF(轉錄因子), 在結合DEG(差異基因),以及DEG之間的PPI(蛋白質網絡互作)調控關系, 并把它們之間的關系以Arc Diagram圖展示(如下圖)。

http://img.xiumi.us/xmi/ua/1eAiE/i/13ac852cdfe0119291c13b17d860310e-sz_91701.jpg?x-oss-process=style/xmorient

 

亮點四

貝晶的結果都以html網頁版的形式展出,輸出為出版級別的矢量圖(svg),結合第三方矢量圖編輯軟件(inkscape等),用戶可以把各組樣本靈活組合成圖,修改樣本名稱,以及在總的熱圖中挑選自己關注的基因組合成新的熱圖,并保存為不同的圖片格式。

 

最后對GSEA中幾個關鍵的概念做個介紹:

ES

富集得分 (ES, enrichment score). 它反應基因集成員s在排序列表L的兩端富集的程度,它反映的是將全部芯片數據或測序數據按表達量大小排序后,在此序列的前部或后部一個功能基因集富集的程度。當 ES 值為正,表示某一功能基因集富集在排序序列的前方,當 ES 值為負,表示某一功能基因集富集在排序序列的后方。

計算方式是,從基因集L的第一個基因開始,計算一個累計統計值。當遇到一個落在s里面的基因,則增加統計值。遇到一個不在s里面的基因,則降低統計值。每一步統計值增加或減少的幅度與基因的表達變化程度(更嚴格的是與基因和表型的關聯度)是相關的。

NES

ES標準化處理的值,為什么要做標準化處理:因為各個功能基因集中所包含的基因數不同,而且不同的功能基因集與要分析的目標基因列表也不同,因此在比較數據集在不同功能基因集中的富集程度時,需要對ES進行標準化處理。

 

LEADING EDGE

領頭亞集。領頭亞集中的基因是指對ES 值貢獻最大的基因集合。當 ES 為正值時,領頭亞集位于 ES值對應排序序列之前,反之,則位于 ES 值對應排序序列之后。領頭亞集的出現可說明這些基因在通路中有富集,且這些基因在通路中有共同的表達趨勢。

 

 

具體情況請聯系身邊的基因人或直接撥打電話021-67285083


歡迎關注“基因快訊”官方微信

滬公網安備 31010402003540號 滬ICP備13000399號-1

欧美色图第1页_AV天堂网