分享

【1012】到底做相关?还是方差分析呢?

 松哥精鼎统计 2020-10-23
导读

松哥统计说






    统计方法选择15字口诀:  “方法看变量、设计看类型、目的定乾坤”。到底应该采用何种统计分析方法,说到底最最核心的是你的研究目的是什么?

    而从统计学的角度,我们利用统计学为科研服务的最终目的也就3种:

初级统计:说一说

    也就是说,利用统计帮我们发现事物的特征与属性。初级说一说是后续各种统计分析的基础,没有说一说,就没有后续统计分析的基础。

    但是初级说一说的价值很基础,属于现象发现级别。初级统计(说一说)对于新发事物价值较大,如本次新冠病毒(COVID-19),由于新发,一切未知,所有发现都是全新的。因此价值巨大,所以新冠病毒描述性的文章都发了高分文章。

但如果你研究的是常见病,通过初级描述,想发高分,基本就别考虑了。


中级统计:比一比


    人类是最善于分类的动物,总喜欢把事物分为三六九等,搞阶级对立,描述属性特征之后,总是根据分组进行差异性比较,这就是中级统计比一比。

    中级比一比的目的,就是为了确证组间的差异,从而探索这种差异的产生的背后的原因。

    而此时如果是描述性研究的分组比较,如果有差异只能发现差异这种现象,不能说明差异产生的原因。

    而如果是试验性/实验性(干预性)研究,则能很好的说明差异产生的原因。

    可品,可细品!

    描述性研究的差异性分析和干预性研究的差异性分析。前者统计分析的力度远远低于后者,原因就在于误差控制的水平不同。所以临床研究最好的试验设计就是RCT,就在于误差控制的力度级别最高。

高级统计:找关系

    再谈统计学的格局:初级统计说一说是小学生的水平,中级比一比(出爱心分析)是中学生的水平,而高级找关系才是大学生的水平!

   差异性分析就是为了分清谁高谁低,谁好谁坏!总认为世界就是二元的一样,总要分清是非。

    如果境界再高一级别,我们就会希望探索事物背后之间的关系,从而达到万物为我所用之目的!

    如新冠病毒,如果中学生水平,只会看到病毒是坏的,对我们造成痛彻心扉的哀痛!但是对于大学生,则也能看到阳光的一面。

    比如此次疫情是不是极大提高了老师的网络教学水平和技术;是不是对我们国家的网络服务能力极大提升;是不是再次考验的国家疫情防控能力;是不是再次彰显了中华民族疾控防控力度(与国外相比);是不是再次考验了人性;是不是向歪果仁再次证明了中国特色制度的优越。

    高级找关系就是在繁杂的数据世界中,找到变量之间的数量关系(规律),从而可以利用规律,为我所用,如天气预报,就改变了“有钱难买早知道”这一千古定律!


    高级找关系是统计学的大成,非三日之功可达!

统计终极目的

    其实就是一句话:发现事物背后的规律!如果复杂一点:在控制误差的情况下,发现事物背后的规律!


松哥统计谈






    我们再回到前面的咨询:


    到底该采用什么统计方法呢?首先要看研究者的目的。而结合临床角度,研究目的无非就是病因、诊断、治疗和预后四个,这四个目的都可以通过我们上面3级统计帮助实现。

    对于本例:CT分级(1、2、3、4)和白细胞计数(×10^9/L),两指标均为根据研究目的选择的受试对象,身上的属性特征变量。
    
     正常统计套路可如此!

先描述(数据探索)

1.CT分级:(1)做频数表,(2)看构成比,(3)看缺失值。
2.白细胞计数:(1)做直方图或分布曲线,(2)正态性检验,(3)探索性异常值分析;(4)看缺失值;(5)考虑用均数±标准差,还是M(Q)描述。

第一步必须做,做到心中有数。

看目的,选方法

  1. 如果想知道:不同CT级别组的WBC是否有差异,则可以用单因素方差分析(条件:独立、正态、方差齐)。

  2. 如果想知道:CT级别越高,是不是WBC越高或越低,可以用趋势性方差分析。

  3. 如果想知道:CT与WBC之间的相关性,那就做做Spearman相关。但是相关只是共现关系(一见钟情),犹如鸡肋,相关基本是找关系的前奏。

  4. 如果想利用CT分级诊断是否白细胞异常?如果专业上有此目的的话,那么就做诊断试验的ROC。

  5. 如果想知道通过CT去预测WBC,或者WBC预测CT(这个得看专业了,松哥统计的,不懂专业目的),那则可以考虑回归分析了。



    整理不易,欢迎点亮再看!

---统计思维与理论系列---

【1011】这篇文章凭啥这样分组呢?

【1010】常用统计分析方法选择图解

【1009】P<0.05也别理直气壮,统计也会犯错,还分犯I类和II类错误?

【1008】文章鉴析:这篇文章或许有10处不适!

【1007】R×C卡方的Fisher确切概率法为什么会有卡方值

【1006】大小优指标如何同时制作ROC曲线[经验技巧]

【1005】统计方法与统计思想谁重要?

【1004】别说相关太简单,且听松哥说相关

【1003】正态分布10种鉴别方法汇总【荐藏】

【1002】连续变量变成等级变量后,原来有意义的变量变得没意义了?

【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢

------------------------------


整理不易,感谢点亮再看!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多