分享

如何结合SPSS与在线统计分析平台来撰写论文?

 妙趣横生统计学 2023-07-04 发布于江苏

郑老师开发的风暴统计是一款优秀的智能在线免费统计分析平台!功能涵盖一键导出三线表、样本量计算、差异性分析(t检验、值和检验、卡方检验等)、logistic回归、线性回归等,但是在数据整理模块比较薄弱。

数据整理的可以考虑Excel和常见统计软件SAS、SPSS、R,SAS数据整理非常强大,但是需要一定的门槛,R语言需要编程基础,估计一时三刻也学不会;

对于初学者,一般我们建议还是通过SPSS来整理更合适,它虽然是傻瓜式操作,但是相对来说过程清晰,我们能够知道每一步的步骤。

接下来主要从两方面为大家介绍:SPSS进行数据整理、风暴统计进行数据分析。

一、SPSS进行数据整理

首先,我想一般情况下,数据一开始的形式,经常是EXCEL的格式,基本格式如下:

1.首行是变量名,一般是英文或者拼音,不建议用汉字。
2.从第二行开始,每一行都代表着一个研究对象的所有变量信息。
3.每一列都代表所有人一个变量的变量值
4.一般建议,CSV和excel中的变量值,建议用数字表示,比如男性=1,女性=2;血型(1、2、3、4),这种做法比较灵活,而且可以保证数据集在各统计软件通行无阻。对于数据集赋值不清者,请列一份变量赋值表
5.缺失值默认处理,一般是空白代替,不要写NA
6.除非特殊字符串(比如姓名),数据库不要出现汉字或者英文字符串,会导致后续分析被卡。

关于数据整理的内容,主要围绕下面四部分展开:

1. 修改变量和变量值的属性
2. 数据转换
3. 打标签
4. 变量值打标签
5.结果导出

1. 修改变量和变量值的属性

在SPSS“变量视图”中,你会发现,有些变量“类型”明明是数值,怎么全部显示字符串呀?

遇到这种情况请大家谨慎处理下这一堆的数据,如果你确认这个变量(比如这里的age,或者常见的BMI、性别等)都是数值型体现在数据库,那么要把字符串变成数值。但是,如果变量值本身含有字符串,千万不要贸贸然变成数字。

还有这里。很多导入的数据都默认为“名义”,所谓名义就是无序分类数据。一般情况下只有字符串的情况下,才是名义变量。如果上面你已经改为数字型数据,那么在这里不要填“名义”,一般下拉菜单,选择“标度”。

2.数据转换

在很多情况下,可以将定量数据转换为定性数据(二分类、多分类),有序数据转换成二分类。这是因为不同的数据,有不同的统计策略:
·定量数据——t检验
·转换为等级数据——秩和检验
·转换为二分类数据——卡方检验

这里更推荐“重新编码为不同变量”,会产生新变量,而不改变原有变量。

3. 打标签

对变量打标签:很多时候变量名是英文字母,难以辨认变量是什么,需要对变量进行解释,那么在“标签”列,就可以进行中文注释,说明情况。

4. 变量值打标签

对变量值打标签:上面说过,我们很多分类变量,其变量值一般也用1234构成,但是1234 如果意思不知道怎么办嘛?就需要在“值”这一列对分类变量值注释。  

5.数据导出

数据导出格式更加推荐csv形式,这种格式对缺失值处理以空白代替,而非NA代替

这里有个注意,导出的数据,可以以值标签的名义导出,也可以以原始值的名义导出。

什么时候用值标签,什么时候用原始数据值呢?

一般情况下,都推荐原始数据值,方便后续对数据集进行修改。除非,你在SPSS数据库已经完全整理好了你的变量值,尤其是分类变量值,并做好了分类。

、风暴统计进行数据分析

它的网址是www.medsta.cn(在电脑端浏览器打开,"风暴智能统计"模块)

浏览器输入medsta.cn即可medical statistics缩写)

本平台上线的所有工具都是免费的, 目前的功能包括:
样本量计算| 正态性检验 t检验 | 方差分析 
秩和检验 | 卡方检验 | 差异性分析带统计量
线性回归分析 | logistic回归 |逐步回归法 
批量单因素分析 先单后多 临床预测模型 

导出数据集以后,就可以利用风暴统计进行统计分析了!一篇文章最少不了的就是基线表,利用风暴统计平台,3分钟生成word版三线表!还有文献中常见的logistic回归、线性回归等都可以一站式搞定。

一般学过统计的朋友都知道,我们开始医学论文数据分析包括统计描述、差异性分析与回归分析。等下各位可以看看它怎么实现的?

1.风暴统计平台,也有数据整理转换的功能,比如变量值打标签、定量变量转为定性变量,目前存在于部分模块。

2. 统计分析

2.1 开始统计分析前,非常重要的步骤,是开展一些探索性的分析

探索性数据分析,包括正态性检验、定量数据统计描述、定性数据统计描述、t检验、方差分析、卡方检验、秩和检验。

这些方法是帮助大家对数据的分布、及采用的一些统计学方法有个初步的认识!尤其是哪些数据是正态的、哪些是偏态的,尤其重要。

2.2. 研究群体特征和分布差异性(统计描述+差异性分析)

1)首先进入风暴统计网站的“风暴智能统计”模块,点击“一键生成规范三线表”,这里更推荐大家使用“带统计量版本”,因为进行卡方检验时,可以自动检验变量适用于卡方检验还是fisher法,无需像SPSS一样,自行挑选结果,更加快捷方便。

2)导入数据集(目前支持10 M 以内的csv格式),点击左侧“一键三线表”,指定不同的变量类型。这个版本,可以自动检验分类变量使用卡方法或fisher法!并在“statistic”注明了检验统计量。

4)导出word版结果,结果直接呈现三线表形式,包括表名与表头一步到位。如需细节打磨,word形式方便进行编辑!

2.3.  回归分析

完成基线表格后,还可以利用风暴统计网站进行logistic回归、线性回归具体操作流程详见其他文章。还有Cox回归、网状meta、孟德尔随机化等更多功能在开发中,欢迎大家多多关注!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多