分享

当我们谈论统计时,我们在谈论些什么

 zjshzq 2021-07-14

数据统计分析一般遵循以下思路:


(1)先确定研究目的,根据研究目的选择方法 

不同研究目的采用的统计方法不同,常见的研究目的主要有三类:

一类是差异性研究,即比较组间均数,率等的差异,可用的方法有t检验,方差分析,卡方检验,非参数检验等。

二是相关性分析,即分析两个或者多个变量之间的关系,可用的方法有相关分析。

三是影响性分析,即分析某一结局发生的影响因素。可用的方法有线性回归,logistics回归,COX回归等。

(2) 明确数据类型,根据数据类型进一步确定方法

定量资料可用的方法有t检验,方差分析,非参数检验,线性相关,线性回归等。

分类资料可用的方法有卡方检验,对数线性模型,logistic回归等。

(3)选定统计方法后,利用统计软件具体实现统计分析过程

例如在SAS中,不同的统计方法对应不同的命令,只要选定方法,便可以通过对应的命令辅之以相应的选项实现统计结果的输出。

(4)得出统计学结论

一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计结论不同于专业结论,最终还需要结合实际做出合理的专业结论。

关于定量资料和定性资料


定量资料和定性资料的结果展示:

发表论文时,需要将统计描述的结果合理的展示在文章中,以便让读者对你的数据有大致的了解。不管是统计描述指标还是图表,其应用都有一定的条件限制。

对于定量资料:

如果符合正态分布或者略偏态分布,一般可采用“均数标准差”的形式,而如果数据严重偏离正态分布,均数和标准差已经反映不出原数据的趋势,最好采用“中位数(四分位数间距)“的格式来描述。

目前不少文章根本无视数据分布,一律采用'均数加减标准差',似乎均数标准差能反映一切。有的文章中标准差远远大于均数,明显不符合正态分布,此时的均数和标准差已经不能给读者提供有效信息了。

对于分类资料:

分类资料的描述很简单,不用考虑分布的问题,仅是简单的列出频数和比列即可。但关于百分比的列法必须注意。

标准差与标准误:

标准差是针对原始数据而言,而标准误是针对原始数据基础上的统计量而言的。如果标准误比较大,提示可能抽样误差较大,也就是说样本的代表性较差,抽取的样本有偏。在后面的回归分析中,结果一般都会给出标准误,如果标准误大,最可能的原因就是样本不足,导致抽样误差太大。

文章来源:大话统计

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多