【原】MR | 第10期. 孟德尔随机化主要分析方法汇总

新用户4064dVjo 2023-09-07 发布于北京

展开全文

在上一期的推送中，我们以 [BMJ. 2019] 为例（详见参考文献），给大家详细介绍了线性和非线性的MR（第9期. 把手重现BMJ线性＋非线性孟德尔随机化）。实际上，MR可以分为多种类型，根据研究目的的不同，我们会选择不同的MR方法去解决我们提出的科学问题。不同的分类标准会对应不同的MR方法，如按照暴露和结果的数据是否来源于相同的样本可以将MR分为单样本MR和双样本MR；按照研究的暴露数目可以MR分为单变量MR和多变量MR。今天我们将分别介绍单样本MR、两样本MR和多变量MR (单变量MR非常常见，也容易理解，我们分享的BMJ研究就属于单样本MR，故本期不单独介绍单样本MR)。

1. 单样本研究

与上期介绍的线性MR一致，在具有个体水平数据的单样本研究中，可以使用两阶段最小二乘法（2SLS）进行因果效应估计。

在第一阶段，暴露对遗传变异和相关协变量进行回归。在第二阶段，根据第一次回归的暴露预测值和相同的协变量对结局进行回归。

Tips：一般而言，建议仅将年龄、性别、基因组主成分和技术性协变量(如招募中心)作为协变量。

2. 两样本研究

2.1 定义：选择来自相同人群的两独立样本的GWAS数据，包括遗传变异与风险因素及结局的关联结果，如暴露因素的GWAS研究和结局变量的GWAS研究。也就是说数据集有两个来源：其中遗传变异和暴露变量的关联在第一个数据集中被估计，而遗传变异和结果变量的关联会在另一个数据集中被估计。

2.2 举例：探讨某种饮食因素是否会增加心血管疾病的风险，其中饮食因素【暴露因素】的GWAS数据来自队列（对应样本A），而心血管疾病【结局变量】的GWAS数据来自另一个独立的队列（对应样本B）。从样本A中获得与饮食因素关联的SNP，并使用样本B的心血管疾病数据来估计因果效应。

2.3 分析方法：如果两个样本都有个体水平的数据，同样可以使用2SLS方法。但在大多数文献和日常分析中，两样本研究通常使用汇总数据（可以完全基于公开且免费的GWAS汇总结果进行分析）。对于汇总数据，如果仅使用一个遗传变异体作为工具，则因果效应估计值仅为变异体-结局关联与变异体-暴露关联的比值。有多个变量作为工具，最常用的方法是逆方差加权(inverse-variance weighted, IVW)方法。

2.4 两样本MR主要步骤如下（详见下图）：

（1）读取暴露因素GWAS数据

（2）读取结局GWAS数据，提取上述的工具变量的SNPs

（3）暴露因素与结局的GWAS数据进行预处理，使其格式统一

（4）采用选中的MR方法进行分析

MR默认使用五种方法（ MR Egger，Weighted median，IVW，Simple mode ，Weighted mode ），但我们可以额外指定方法,使用mr_method_list()查看当前支持的统计方法。在MR函数中，method_list参数指定添加想要使用的方法即可，代码如下：

res <- mr(dat)
res
mr_method_list()##查看mr支持的MR分析方法
mr(dat, method_list = c("mr_egger_regression", "mr_ivw"))#可以选择自己想要的方法

(5）结果可视化a) 散点图b) 森林图c) 漏斗图

（6）分析中用到的R包：TwoSampleMR

3.多变量孟德尔随机化

3.1 定义：多变量孟德尔随机化，如同其名字，是指将多个表型作为暴露，使用多变量MR逆方差加权的方法，探讨其与结局的关系。

3.2 适用情况：

（1）很难找到基因变异(SNP)只与某一特定暴露相关，但是可以找到其与一系列相互关联的暴露相关；比如与HDL-C相关的SNP，也与LDL、总胆固醇等相关

（2）暴露相关的SNP，很多都与某个或者某几个混杂因素相关

3.3 多变量MR的核心依赖于一些基因变异与某些暴露的相关性比与其他暴露的相关性更强。

3.4 优点：（1）可以同时考虑多个变量的影响，而不是仅仅研究单个变量。（2）可以帮助研究者了解不同变量之间的相互作用，以及它们对实验结果的独立和综合影响。（3）有助于混杂偏倚的控制。

3.5 分析中可能用到的R包：

方法学的介绍就告一段落了。下一期，我们将继续以[BMJ. 2019]文献为例，科学解读MR的结果。

大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话”栏目中提出，我们会尽快回复！

参考文献

Sun YQ, Burgess S, Staley JR, Wood AM, Bell S, Kaptoge SK, Guo Q, Bolton TR, Mason AM, Butterworth AS, Di Angelantonio E, Vie GÅ, Bjørngaard JH, Kinge JM, Chen Y, Mai XM. Body mass index and all cause mortality in HUNT and UK Biobank studies: linear and non-linear mendelian randomisation analyses. BMJ. 2019 Mar 26;364:l1042. doi: 10.1136/bmj.l1042. PMID: 30957776; PMCID: PMC6434515.