分享

一文汇总三大回归的基本应用条件、诊断与处理方法(线性、logistic、Cox)

 妙趣横生统计学 2020-08-28
SPSS教程(35):线性、logistic、Cox模型的基本应用条件

这一讲是"手把手教你如何构建回归分析模型"的第1讲,是总结,是对之前介绍的线性回归、logistic回归、Cox比例风险模型的应用条件进行总结。这些条件是诸位开展回归分析首先需要考虑的问题。

三大回归分析对变量的基本要求

线性回归,一般应用于回归分析的Y,也就是结局变量(反应变量)是定量数据;logistic回归则可以是二分类、无序多分类和有序多分类、Cox比例风险模型结局变量两个,分别是生存时间(定量)与预后结局(二分类)。

自变量方面,三种方法有相似又不同的要求。

线性回归:总体上是LINE的要求,也就是线性、正态性、方差齐性、独立性。

线性:解释变量X和反应变量Y必须要有线性关系吗?不是!只有当X是定量数据或者等级数据(不设哑变量)时,才要求X与Y有线性的关系。当X是二分类或无需多分类,没有线性条件的要求。独立性:要求Y各观察值相互独立吗? 不是,是要求残差是独立的。正态性:要求Y各观察值正态分布吗?  不是,是要求残差正态分布。方差齐性:要求不同的解释变量X时,反应变量Y方差相等吗?没错,但是对于多因素回归分析,更加合理的理解是在不同Y预测值情况下,残差的方差变化不大。

logistic回归,具体来说,主要是两个条件,一个是独立性、一个是线性。同样独立性,要求观察值残差是独立的,而线性,则要求自变量X与应变量Y的logit(P)转换后成线性关系成立。

Cox回归,主要还是线性、独立性的条件,除此之外,还有个重要的条件是等比例风险假定的条件。

如何进行回归基本条件诊断呢?

线性回归分析,一般采用绘制X与Y的散点图,结合残差分析的方式来开展,诸位可以学习本推文相应的文章:

线性回归时,你还不会做残差分析?来看基本教程!

logistic回归,一般需要借助交互效应来查看线性问题,而独立性情况则需要主观判断,相应学习文章如下
Logistic 回归简明教程:原理、SPSS操作、结果解读与报告撰写

特别是线性问题,可以看看代表性文章的说法
构建logistic回归模型很简单?高分SCI文章的做法远远比你想的多

Cox回归,同样,我对相应的条件进行了介绍
生存分析COX回归,小心你的数据不符合应用条件

回归的应用条件不满足怎么办?
三种回归都需要线性条件的成立。线性条件如果不成立,可以对自变量进行分组并进行哑变量设置,也可以尝试进行指数化处理,比如e^x, 或者x^2等,也可以采用利用LOESS、限制性立方条样图的的方式开展非线性回归。

独立性问题同样在三种回归均有要求。如果观察值之间不独立,是为聚集性数据,则建议考虑随机效应模型,比如线性混合模型、广义线性混合模型、多水平模型等。

线性回归有正态性和方差齐性的条件,若方差齐性条件不成立,则可考虑加权最小二乘法方法开展线性回归,若正态性不成立,可以考虑对因变量Y进行数据转换比如log转换、Box-Cox转换,或者直接对定量的因变量转换为分类结局而后开展logistic分析。

Cox回归有等比例风险的前提假设,如果等比例风险的前提假设不成立,则一般建议采用限制性平均生存时间来代替中位生存时间时间来开展生存分析的描述与比较。
--本文毕--

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多