方法类型 | 网络类型 | 代表性方法 | 优点 | 缺点 |
边际相关分析 | 无向 | Pearson相关、Spearman等级相关、Kendall tau(R:base);局部相似性分析(Linux:ELSA);WGCNA(R:WGCNA) | 易于实施;可用的非参数选项 | 由于混杂因素,可能会出现虚假结果 |
降维方法 | 通常是无向的 | PCA(R:
base);CCA(R:CCA);PLS(R:pls);CIA(R:ade4); 稀疏CCA, 稀疏多重CCA(R:PMA); 稀疏PLS (R:spls); 稀疏CIA(R:pCIA); 内核PCA,内核CCA(R:kernlab) | 可用于构建连接功能模块的网络 | 可解释性较差,因为每个节点代表多个(如果不是全部)特征 |
基于回归的方法 | 有向或无向 | 线性和广义线性模型(R:base);线性和广义线性混合模型(R:nlme、lme4);正则化回归:Lasso、ridge、elastic net(R:glmnet)、SCAD、MCP(R:ncvreg)、Group lasso、group elastic net、group SCAD、group MCP(R:grpreg);正则化多元回归:图引导融合套索(R: GFLASSO)、remMap (R: remMap)、降阶回归(R: rrpack) | 易于合并协变量;有大量的统计方法和软件工具可供使用 | 需要将每个特征指定为响应变量或预测变量 |
图形模型 | 无向 | 图形套索(R:glasso,huge);邻域选择(R:huge);联合图形套索(R:JGL);条件图模型协变量调整图模型(R代码:caPC) | 条件依赖性比基于边际相关性的方法更有效地捕获直接的生物相互作用 | 大多数方法假设多元正态分布 |
贝叶斯网络 | 有向 | CONEXIC(Linux:CONEXIC); QTLnet(R:qtlnet);贝叶斯网络先验(MATLAB:BNP);搜索和评分方法、基于约束的方法(R:bnlearn) | 与因果关系更直接相关的链接;整合先验知识的能力;处理遵循不同分布类型的数据的可能性 | 不能很好地扩展到海量数据集 |
网络整合 | 无向 | GeneMania(Cytoscape/Web:GeneMANIA); SNF(R:SNPtools); DCA(MATLAB:Mathup | 通常实施起来很简单;从多个网络借用信息的能力 | 必须可靠地估计作为方法输入的各个网络;假设存在共同的生物学机制 |