Gene co-expression(基因共表达)是一种使用大量基因表达数据构建基因间的相关性,从而挖掘基因功能的一类分析方法。
在共表达分析中,有两种有效的策略Guide-genes 和Non-targeted:image.png Guide-genes策略是,先找到感兴趣的基因/通路的共表达基因,进行可视化,然后再加入另外的基因,看两次加入的基因之间存在怎样的关系,以此来基因的关系。 Non-target策略中检测module的方法image.png module的检测是基因共表达网络分析中非常重要的一步,一般有两种方法:top-down(A) 和 bottom-up(B) Pearson’s correlation coefficient(PCC)有很多方法可以进行相关系数的计算,PCC是其中普遍使用的一种。 image.png 在共表达网络构建中,PCC可以对一对基因在不同样本中的表达值的趋势进行检测、定量。PCC取值在-1到1之间,PCC=-1时,表示这两个基因具有完全相反的表达趋势;PCC=1时,表示这两个基因的表达趋势是相同的。 PCC值的cutoff正常情况下,在低PCC值(绝对值)的区域中表现的高网络密度(network densities:a ratio of the observed number of links to all image.png 而高PCC值(高于0.55-0.66)下的network densities则具有比较高的显著性,当然它的node(基因)会更少。 样本数据的选择两个基因的共表达表现的是在所选择的样本数据情况下的两个基因的关系(比如,样本选择的都是在胁迫条件下的,则共表达关系表现的是胁迫条件下,两个基因所表现出来的。如果是随机选择的样本,则得到的共表达关系是普遍适用的一类关系),所以样本的选择对基因共表达分析有很大的影响。
随机样本条件下样本数目大小的影响(基因芯片数据)在不同物种中样本(随机样本)数目与network densities的关系不大一样,在拟南芥中,关系如图 image.png 表明,在拟南芥中network density在样本(随机样本)数>100时,值越来越小,但是变化也越来越小。所以随机样本数越多,越能摆脱某种条件的影响,而表现真实随机条件下的网络。也可以知道,在到达某个阕值后,network density的大小变化不大。 不同物种间的基因共表达比较分析不同物种间的基因共表达关系具有robust:一个确定的module中的基因,在不同物种间具有相似的共表达关系。可以使用这种关系,进行模式物种与非模式物种之间的比较分析,将模式物种的研究优势,带动到非模式物种上。 基因共表达网络的后续分析在得到基因共表达网络,并取得共表达基因后,需要进行进一步的分析,因为基因共表达只能反映RNA层面上的情况。 文献Aoki K, Ogata Y, Shibata D. Approaches for extracting practical information from gene co-expression networks in plant biology[J]. Plant & cell physiology. 2007;48(3):381-90.Usadel, B.Obayashi, T.Co-expression tools for plant biology: opportunities for hypothesis generation and caveats.Plant Cell Environ.2009;32(12):1633-51. |
|
来自: Amazing427 > 《生信相关》