分享

思维导图—医学统计学方法选择

 阮朝阳的图书馆 2020-07-28
本文2232字〡20图〡预计阅读5分钟
医学统计方法的选择应以研究问题为导向,从研究目的出发,综合考虑研究设计类型、变量类型与数据特征、样本量大小以及统计学方法适用条件。

统计学方法和统计分析软件只是帮助我们实现研究目的的工具,因此需要着重培养三个思维:研究设计思维、统计分析思维、流行病学思维,在应对研究问题和数据时能够意识到用何种方法去统计分析,并能够很好的处理和规避易错问题,求得可靠的研究结论,使得结论具备内部真实性与外部真实性。

本次笔记采用思维导图软件Mindmaster,整理了医学统计学方法选择策略,在后期将会不断更新、完善,欢迎各位学友提出宝贵建议。

点击该链接思维导图—医学统计方法选择 ,即可下载《医学统计方法选择》思维导图PDF版。
01
单变量定量资料
对于单变量定量资料,首先要明确资料为单样本还是多样本(两个及以上组别);其次明确研究设计类型,成组、配对或者重复测量设计;接下来明确数据的分布特征,即是否为正态分布;多组样本,还需要关注方差齐性问题,统计思维导图如下所示:

△ 单变量定量资料的统计分析

对于单变量定量资料着重关注四点:分组≥2K、样本独立性、正态性、方差齐性。

如下 表1.1 和 表1.2 的区别在于:前者为两独立样本资料,后者为配对设计资料。

表1.1 的研究目的比较放疗、化疗治疗肺癌患者的血清 Sil-2R 水平差异,如果两组数据均符合正态分布且方差相等考虑采用两独立样本 检验;如果两组均为正态分布但方差不等则用 t' 检验;如果呈现偏态分布则用 Wilcoxon 秩和检验(或者Man-Whitney 检验)

表1.2 的研究目的比较放疗前后肺癌患者的血清 Sil-2R 水平变化,如果放疗前后血清 Sil-2R 水平的差值符合正态分布,则考虑用配对样本 检验,偏态分布则考虑用Wilcoxon符合秩和检验

表1.3表1.4 的区别在于:前者为完全随机设计,后者为随机区组设计。
表1.3 的研究目的比较三种不同喂养方式下大白鼠体重差异,如果三组数据服从正态分布且方差相等,考虑用单因素方差分析;如果偏态分布或者方差不等,考虑采用 Kruskal-Wallis 检验。

表1.4 的研究目的比较三种方案处理后大白兔血中蛋白减少差异,如果数据服从正态分布且方差相等,考虑采用随机区组方差分析;如果偏态分布或者方差不等,考虑采用 Firedman 检验。

表1.5表1.6 的区别在于:前者为单因素重复测量设计,后者为多因素重复测量设计。如果数据符合正态分布且等方差,可考虑分别采用单因素、多因素重复测量方差分析;如果不符合正态分布或者方差不相等,则考虑用混合模型。


表1.7 为诊断试验研究,病理诊断为金标准,欲比较新方法的诊断价值,可考虑ROC曲线分析。

需要注意的是,虽然正态性、方差齐性是检验、F 检验的两个前提假设,但是统计方法具有一定耐受性,只要不是严重的偏态或者方差相差很大,可以考虑采用检验、F 检验。对于偏态分布的资料,可采用变量转换(比如取对数、Cox-Box转换等)使得资料接近正态分布,但是对于专业上非正态分布的资料(如住院日、住院费用等),首先考虑采用非参数检验。

02
单变量定性资料

对于单变量定性资料,首先明确分组变量分析变量,其次变量属性是否相同、是否有序;接下来明确设计类型,是否为配对设计。

△ 单变量定性资料的统计分析

首先明确分组指标与分析指标,表2.1 的分组指标为疗法,分析指标为疗效;表2.2 的分组指标为食盐摄入情况,分组指标为是否患冠心病。比较两组疗效或者患病差异情况均可考虑采用四格表卡方检验。

2.3 2.4 的区别在于:前者的疗效为二分类变量,后者的疗效为有序变量,对于疗效差异比较,前者考虑采用列联表卡方检验,后者考虑采用 Kruskal-Wallis 检验

表2.5表2.6 均为配对设计,前者为 2x2 四格表资料,后者为 RxR 列联表资料。比较两种检验方法差异情况,前者考虑采用 McNear 检验,后者考虑采用 McNear-bowker 检验。如果比较两种检验方法一致性,前者考虑采用 Kappa 检验,后者考虑采用加权Kappa 检验

表2.7 分组指标为年龄(且为有序变量),分析变量为淋巴结是否转移,属于二分类资料,如果比较不同年龄组淋巴结转移差异情况,考虑采用列联表卡方检验,如果要分析随着年龄增加淋巴结转移是否存在趋势性,可考虑采用趋势性卡方检验。

对于单变量定性资料应区分分析目的,差异性分析还是关联性分析;此外,对于列联表资料要关注理论频数大小,采用合适的检验方法。

03
双变量资料
双变量分析主要包括简单相关(Pearson相关或者Spearman相关)和简单线性回归分析。

分析两个变量XY间的相关性时,若变量服从二元正态分布(或者近似正态)考虑采用 Pearson 相关;变量不服从二元正态分布考虑 Spearman 相关;等级变量考虑 Kendall 相关

分析两个变量的依存关系时,即变量Y  如何随着X 变化,若变量服从L(线性)I(独立)N(正态)E(等方差)适用条件,可考虑采用简单线性回归分析。

△ 双变量资料的统计分析

04
多变量资料
多变量资料(即多个自变量X,一个因变量Y),研究自变量与因变量之间的关系,依据因变量类型,常采用“三大回归”分析:多重线性回归、Logistic回归、Cox回归,思维导图如下所示:

△ 多变量资料的统计分析

表4.1表4.2 表4.3 的区别在于:表4.1 的因变量(Y)为定量变量,表4.2 和 表4.3 的因变量(Y)均为分类变量,且表4.3 存在时间效应。

若研究自变量(X)对因变量Y的影响,表4.1 可考虑采用多重线性回归,表4.2 和 表4.3 可考虑分别采用 Logistic回归 和 Cox回归。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多