生信碱移 自定义你的WGCNA基因集功能表型
此教程将分享ssgsea自定义基因集联合WGCNA的简单套路 加权基因共表达网络分析(WGCNA),是一种广泛使用的数据挖掘方法,尤其适用于基于变量之间的成对相关性研究生物网络。在基因相关性的基础上,它允许定义模块(基因集群),研究共表达模块之间的关系,并比较不同网络的网络拓扑(差分网络分析)。同时,WGCNA可以作为一种特征选择方法,分析表型与基因模块之间的潜在联系,以帮助筛选出与特定表型相联系的基因网络。 单样本 GSEA(ssGSEA)是基因集富集分析的扩展,计算样本和基因集每一对的单独富集分数。每个ssGSEA 富集分数,代表特定基因集中的基因在样本中协调上调或下调的程度。 简单理解, 基因集就是多个基因的集合而已,一个基因集中的基因往往代表着某种生物学特征。打个比方,一个KEGG通路注释“P53信号途径”中的基因构成的集合便称可以作基因集。 ▲ p53信号途径 在实际分析中,通过输入表达矩阵, ssGSEA将由“样本-基因-表达”的 表达矩阵形式(即:行名为基因,列名为样本编号,对应填充值为表达量)转化为“样本-通路(基因集)-ssgsea打分”的打分矩阵(即:行名为基因集对应生物学功能名称,列名为样本编号,对应填充值为ssgsea打分)。ssgsea得出的得分将作为表型,并进行WGCNA分析。 ▲ 简单理解 示例文件:后台回复 “ afssgseawgcna ” ,即可获得示例文件与代码 输入文件 1、表达矩阵: 2、样本分组,第一列为样本编号(需要与表达矩阵中一致),第二列为样本信息(千万注意,需要进行排序:正常组C放前面、疾病组放后面) 3、每个通路对应的基因信息,gmt文件(可以自行准备,或者在GSEA等基因集存储数据库获得) 4.参数设置(如下图) 部分图表展示 最近赶忙见谅各位 就分享到这里了 大家实战试试 END |
|