分享

logistic回归的OR值如何解读,我收藏的这篇文章分享给你

 神经内科护理学 2023-01-25 发布于北京
via:医学统计分析学习笔记
本文4914字〡18图
Hosmer DW和Lemeshow S合作发表了多篇有关logistic回归模型的研究文献,于1989年出版了《Applied Logistic Regression》一书,在SPSS软件二元logistic回归“选项”对话框中,可以看到“Hosmer-Lemeshow”(霍斯默-莱梅肖检验)用于模型拟合优度检验。
书中“The Low Birth Weigh Study”关于低出生体重婴儿影响因素的研究,可以作为学习logistic回归模型较好的数据案例,该研究的结局变量为是否分娩出低体重婴儿(<2500g),收集的自变量有:产妇年龄、体重、种族、妊娠期间是否吸烟、本次妊娠前早产次数、是否患有高血压、应激性等。
某研究者比较关注吸烟与出生低体重婴儿之间的关系:
如果存在关联,那么关联的强度或者影响有多大呢?
又该用什么统计量来表明?



1优势比概念


首先,我们将是否出现低体重婴儿按照产妇妊娠期间有无吸烟整理成四格表资料的形式,如下表所示,把这个研究看成一个病例对照,了解OR值计算的基本思路。

图片
在病例对照研究中
,OR值(Odds ratio)表示病例组某因素的暴露比值与对照组该因素的暴露比值之比,可以反映病例组某因素的比例为对照组的若干倍,在本例中可以分析吸烟和是否出现低体重婴儿之间的关联强度。

病例组(低出生体重)的暴露(吸烟)概率=30/59; 
病例组(低出生体重)的非暴露(未吸烟)概率=29/59;
病例组(低出生体重)的暴露(吸烟)与非暴露(未吸烟)的比值
(Odds)=(30/59)/(29/59)=30/29;

同理
,对照组(正常出生体重)的暴露(吸烟)与非暴露(未吸烟)的比值(Odds)=44/86;

OR=Odds(病例)/Odds(对照)
=(30/29)/(44/86)
=2.022

在SPSS软件【交叉表】统计的【Risk】(风险)中,可以输出优势比(OR值),如下图所示

图片

由产妇在妊娠期间是否吸烟(吸烟/不吸烟)的比值比可知:产妇妊娠期间吸烟出现低出生体重婴儿的危险是未吸烟的2.022倍,OR的95%CI(1.081,3.783),如下图所示

图片


2回归系数和OR值


logistic回归模型的回归系数和OR值关系密切,类似于线性回归,β0表示模型中所有自变量均为0时,In(Odds)的值;回归系数βj表示,在控制其他自变量时,自变量Xj每增加一个单位引起的In(Odds)的值的改变量。
根据logistic回归模型公式,可得:
图片

改写上述公式,变量Xj增加一个单位后与增加一个单位前优势比的对数等于βj
图片同时,自变量Xj增加一个单位后与增加一个单位前优势比的对数等于eβj
图片

如果我们将是否出现低体重婴儿作为因变量,妊娠期间是否吸烟作为自变量,进行logistic回归分析,求得的回归系数β为由不吸烟到吸烟优势比的对数,即In(2.022)=0.704,同时也有e0.704=2.022,结果如下图所示,OR值计算结果同交叉表“Risk”中一致:以未吸烟为参照,产妇妊娠期间吸烟出现低出生体重婴儿的危险是未吸烟的2.022倍。

图片


虽然OR值,在交叉表下【Risk】分析结果与单因素logistic回归分析时一样,但是我们采用多因素logistic回归分析是为了校正混杂因素或者筛选危险因素,分析校正后的OR值,此时交叉表【Risk】分析就无能为力了。

在logistic回归模型中,优势比可以作为估计效应大小(Effect Size)的指标,度量某自变量优势影响程度的大小,OR值的意义:

  • OR=1,表示该因素对疾病的发生不起作用;

  • OR>1,表示该因素是危险因素;

  • OR<1,表示该因素是保护因素;



3校正OR值


未校正混杂因素的OR称为粗优势比(Crud odds ratio),如下图所示,自变量只纳入产妇妊娠期间是否吸烟,此时妊娠期吸烟出现低体重婴儿的风险是未吸烟的2.022倍,OR的95%CI(1.081,3.783)。

图片

校正混杂因素作用后的OR称校正OR(Adjust odds ratio),如下图所示,自变量纳入产妇妊娠期间是否吸烟、产妇是否患有高血压,在校正高血压因素后,产妇妊娠期吸烟出现低体重婴儿的风险是未吸烟的2.038倍,OR的95%CI(1.081,3.843)。

图片

4OR值置信区间


logistic回归分析结果除了报告OR值,还应报告其置信区间,自变量Xj的置信区间计算公式如下:

图片
图片

产妇是否患有高血压为例,由b=1.230,Sb=0.618,按照上述置信区间估计公式,可计算OR的95%CI,e(1.230±1.96*0.618)=(1.02,11.48)。
在SPSS软件中,二元logistic回归的【选项】对话框“Exp(B)的置信区间95%”勾选后,如下如图所示,即可输出OR值置信区间。

图片


5如何在论文中展示OR值


在文献中,有表、图两种形式展示OR值以及95%CI,如下面几张图表,图1为表格式,在中文文献中比较常见;在SCI中很多使用森岭图展示,如图2、图3;也有部分文献使用图4,对调了横纵坐标的森岭图。

图片
JAMA. 2018;320(10):1017-1026. doi:10.1001/jama.2018.12498
图片
JAMA. 2006;296(3):301-309. doi:10.1001/jama.296.3.301
图片
JAMA. 2010;303(23):2377-2385. doi:10.1001/jama.2010.808
图片
JAMA. 2009;301(24):2553-2562. doi:10.1001/jama.2009.886

6OR值分析注意事项


2018年7月,在JAMA杂志上,Norton EC等发表了题为《Odds Ratios—Current Best Practice and Use》的文章,作者认为logistic回归模型较容易计算OR值、可以调整风险因素、分析关联强度,因此被广泛应用,但是存在下面三个局限:
(1) The interpretation of odds ratios is framed in terms of odds, not in terms of probabilities. Odds ratios often are mistaken for relative risk ratios.
(2) The magnitude of the odds ratio from a logistic regression is scaled by an arbitrary factor.
(3)There is no unique odds ratio to be estimated, even from a single study.

图片
JAMA, 2018, 320(1):84-85. doi:10.1001/jama.2018.6971

2017年5月,Norton ECDowd BE在《Health Services Research》在杂志上发表了题为“Log Odds and the Interpretation of Logit Models”的文章,作者认为OR值都是基于特定数据和模型得到的,不应跨研究比较(来自不同总体的样本),也不应在不同模型中比较(来自不同解释变量)

图片
HSR, 2017,5(31).doi: 10.1111/1475-6773.12712.
2001年,Holcomb WJ等在《Obstetrics & Gynecology》杂志,发表题为“An odd measure of risk: use and misuse of the odds ratio”的文章,以确定OR值在妇产科临床研究中应用频率、OR值估计的实质性差异,并评估这些差异是否导致对研究结果的误读。
结果:在151篇使用OR值的研究中,107篇合理使用。与RR值相比,OR值放大了效应。39篇(占比26%)将OR值误解成RR值,且无明确的理由。
结论:在妇产科临床研究文献中,OR值被广泛使用,且经常误解。此外,根据OR值的数理特征,得出的定量结论可能存在风险。

图片
Obstetrics & Gynecology,2001, 98(4):685-688. 
doi:10.1016/S0029-7844(01)01488-0.

在三篇文献中,作者都提到勿将OR值和RR值(相对危险度)混淆,当研究结果的阳性概率较小时,OR值的大小与发生概率比较接近,此时OR值可以反映RR值,RR值、OR值区别如下
RR值(Relative risk, RR)常用在队列研究中,表示暴露组的发病率或者死亡率(或者发病风险)与非暴露组的发病率或者死亡率(或者发病风险)之比,反映暴露组疾病风险是非暴露组的多少倍。
OR值(Odds ratio, OR)常用在病例对照研究或者横断面研究,表示病例组某因素的暴露比值与对照组该因素暴露比值之比,反映病例组该因素暴露比例为对照组的多少倍。


参考文献:
[1]方积乾.卫生统计.第七版.北京:人民卫生出版社,2018.
[2]张文彤,董伟.SPSS统计分析高级教程.第2版.北京:高等教育出版社,2013.
[3]Morris MC,Brockman J,Schneider JA,et al. Association of Seafood Consumption,Brain Mercury Level,and APOE ε4 Status With Brain Neuropathology in Older Adults[J]. JAMA, 2016, 315(5):489.
[4]Despriet DDG , Klaver CW , Witteman JCM , et al. Complement factor H polymorphism, complement activators, and risk of age-related macular degeneration[J]. American Journal of Ophthalmology, 2006, 142(4):0-717.
[5]Johansson, Mattias. Serum B Vitamin Levels and Risk of Lung Cancer[J]. JAMA, 2010, 303(23):2377.
[6]Hosmer DW, Lemeshow S. Applied logistic regression[M]. 1989.
[7]Norton EC, Dowd BE, Maciejewski ML. Odds Ratios-Current Best Practice and Use[J]. JAMA, 2018, 320(1):84-85.
[8]Norton EC, Dowd BE. Log Odds and the Interpretation of Logit Models[J]. Health Services Research, 2017,5(31),doi: 10.1111/1475-6773.12712.
[9]Holcomb WJ, Chaiworapongsa T, Luke DA, et al. An odd measure of risk: use and misuse of the odds ratio[J]. Obstetrics & Gynecology, 2001, 98(4):685-688.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多