分享

【1074.】一文了解主流统计软件

 松哥精鼎统计 2020-10-23
缘起

      著名科幻作家赫伯特.乔治.威尔斯在1903年就预言:“在未来社会,统计学思维将像阅读能力一样成为社会人士必不可少的能力”。

      马寅初:学者不能离开统计而研究,实业家不能离开统计而执业,政治家不能离开统计而施政。

      而对于全民创新创造的今天,如果不会统计,确实会感到有一种缺一条腿的感觉。

      如何学习统计,松哥还是很有经验,说简单点就是:统计原理+实战。

      原理能懂即可,而无需非要知道如何推导而来,对于绝大多数工作人士而言,要弄清楚统计的来龙去脉,不是三两天就可以的。

      实战指的就是利用软件进行分析,会操作,会解释,会整理表格发表。本期做一专辑,专门讲解常见主流的统计软件!

1.SPSS





      SPSS是1968年三位美国斯坦福大学的学生创建,是世界上第一款商业统计软件,历经数十载的涤荡,长盛不衰,至今依旧是当今世界用户数量最多的一款统计软件。

      SPSS被誉为世界上最为简单的统计软件,采用窗口式菜单操作,友好到爆,绝大多数功能无序编程,仅通过鼠标操作即可实现,绝对是非统计学专业人士学习的统计的绝佳标配。

      统计学习有三难“难教,难学,难应用”,而SPSS有三易“易学、易用,易普及”。SPSS学习难度只有☆☆,如果SPSS学习都让您觉得无力驾驭,那松哥就请你放弃统计,让自己活得开心点吧!就不要再尝试后面的其他软件了!

2.Stata





       Stata软件1985年才创立,也是一个综合性能的软件,但更侧重于计量经济学。因此对于生物医药很少用它。但是,当系统评价与Meta分析在医学中熊熊燃烧的时候,因为Stata中有一个Meta analysis的模块。该而该模块实现Meta分析的综合能力强大,因此,很多生物医药领域的人,因为该模块开始关注Stata。

      Stata主要通过编程操作,因此增加了学习的难度,相对于SPSS较难学习,难度系数☆☆☆。

       从统计分析功能而言,可以实现的分析远远超过SPSS!但也不能低估SPSS,SPSS基本能够胜任约85%常用的主流统计分析方法。

3.SAS





     SAS是1976年,一对犹太人夫妇创建,一直被美国FDA认可,因此,在生物医药领域,尤其是临床试验数据分析中,独占鳌头!

       在美国,有这么一句话:如果你学会了SAS,你将永远不会失业。话虽然说的有点绝对,但是事实也确实如此。统计分析师的社会需求越来越来。再加上近年大数据的概念的时代加持,社会对统计分析师的需求已经呈现一种饥渴状态。今天是2020年07月09日,对于刚参加完高考的学子,松哥也建议报考与统计相关的专业,至少未来10-20年,方向不会错!

      SAS操作也是编程为主的软件,而且软件界面颜值也不高,软件学习难度☆☆☆☆,松哥建议对于依旧还处于学生状态的研究生,如果学校也正好开设SAS课程,松哥建议你好好学习一下。毕竟年富力强,毕竟学习能力还在,如果已经工作,并且前期也没啥基础,想自学SAS,那就洗洗睡吧!

      枕边也许可以放上一本SAS教材,这样可以解决失眠的烦恼!

4.R





      1995年R才开始创立,其前身是1985年创立的S语言。R语言非常年轻,正直年少轻狂的年纪,很难驾驭。软件操作几乎全部通过编程实现,相对于前面的4款软件,R语言的学习难度☆☆☆☆☆。

      如果无人领路,直接自学R语言,和慢性自杀无异!R软件很难驾驭,因此有人开发了一款R studio的软件,通过该软件,即可以实现R语言的统计分析,但尽管如此,R的学习也依旧很复杂!

     上面3款软件都是收费软件,唯有R语言是免费的,而且是开源的,每一个R的用户都可以成为R语言的开发者。因此,R的更新速度非常快!

      R统计牛叉,作图开挂,高级用户对R爱不释手,但对于初级小白,就是望洋!捶胸顿足。

      R统计分析是通过调用R包实现,目前R语言已经有16024个包(时间2020-07-09)。这对于初学者,有时想找到自己想要用的包都有点困难!

      R在使用过程中,经常会出现已经发布的R包无法使用的情况,也确实让不少玩家难受不已!

5 Python





      Python 是一种解释型、面向对象、动态数据类型的高级程序设计语言。Python 由 Guido van Rossum 于 1989 年底发明,第一个公开发行版发行于 1991 年。
      在Python开发领域流传着这样一句话:人生苦短,我用Python,这句话出自Bruce Eckel,原文是:Life is short,you need Python。 在众多软件中,其更具互联网+的属性,对于处理大数据分析的能力较佳。
      

总结





      如果您是非统计学专业,建议您玩玩SPSS帮助您能发表文章就可以了;如果您是医药CRO公司的,建议您还是狠狠心把SAS啃下来;如果您基础好,学有余力,那就去学习R和Python.。

---统计思维与理论系列---

【1073.】WHAT!计算机随机序列竟然是伪随机

【1072.】单因素Logistic回归变量筛选,你还在用表表达,看看人家如何可视化的,审稿人看了能不开心吗?

【1071.】SCI论文中回归模型样本量确定标准,建议阅读

【1070.】性别和吸烟是专业公认的危险因素,为啥多因素分析性别没意义了?

【1069.】数值变量应该以何种形式进入模型

【1068.】多项分类变量进入模型的正确姿势

【1067.】这种随意拆分的错误不能犯

【1066.】SCI统计方法写作秘籍

【1065.】这篇SCI论文10个统计问题辨析

【1064.】以前认为概念无所谓,其实松哥错了

【1063.】松哥,我发现一处SCI统计错误,非常荒谬!

【1062.】分类变量哑变量设置后,参照到底如何选择?

【1061.】这篇SCI的诊断试验结果看不懂,他到底是咋比的

【1060.】如何向统计老师咨询统计问题的正确姿势

【1059.】生存分析单因素筛选的困惑

【1058.】4种最常用的统计设计解读

【1057.】SPSS统计软件学习终身不忘之必杀技

【1056.】回归家族的书剑恩仇录,高手进阶必经之路

【1055.】单因素是危险因素,多因素却保护因素了,想逆天吗?

【1054.】这种文章统计套路您一定要学,不管你什么专业通杀

【1053.】这个空白对照到底要不要加?

【1052.】同一肝癌患者,同时接受CT、超声和磁共振,如何分析?

【1051.】来自临床真实问题,有点意思,松哥荐读!

【1050.】知道两组数据的样本量均数标准差,怎么算合并统计量呢?

【1049.】meta分析软件Revman5.3卡死解决方案

【1048.】P>0.05,本身就是没意义还是样本量不够?

【1047.】两因素方差分析,如何判断哪个因素对结果影响较大?

【1046.】带基线数据数值变量如何进行统计分析辨析

【1045.】统计学习之最大困惑!!

【1044.】松哥为啥我318样本量统计分析出来确实400样本量?

【1043.】这两个是啥图?区别和联系

【1042.】变量之间到底是单项转化还是双向转化

【1041.】统计水平自我评估表

【1040.】基线分析的3个终极目的

【1039.】统计小白的学习路径

【1038.】SCI论文中Logistic回归模型“门当户对”原则,松哥心得推荐给您

【1037.】被我们忽视的生存分析区间删失数据

【1036.】Logistic回归文章的SCI审稿人意见解读

【1035.】统计学上的2K效应,你发现了没?

【1034.】正态分布的3个基因密码,聆听大自然心跳的代码!

【1033.】生存分析K-M法与COX回归结论不一致怎么办?

【1032.】异常值的处理只有删除?

【1031.】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法

【1030.】SCI审稿人让我控制2个单因素无意义的变量?

【1029.】量表评价是信度重要还是效度重要?

【1028.】Meta分析要解决的首要任务

【1027.】文章材料与方法中统计方法如何描述

【1026.】这个到底是啥统计设计?一起来看看!

1025.聚类分析稳定性判别的经验总结

【1024.】“参数检验与非参数检验”哪个更好?

【1023.】干预前后数据统计分析方法

【1022.】听完四个小故事,你就明白主成分分析是啥意思了!

【1021.】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?

【1020.】等级与等比,可得分清楚!

【1019.】频率与概率,如胶又似漆!

【1018.】终于发现不用学习,顿悟统计的方法

【1017.】倾向性评分后数据,应该采用配对设计还是成组设计?

【1016.】统计必学的4个核心思想

【1015.】加权最小二乘回归是什么鬼?

【1014.】平行性检验到底应该啥时候做?

【1013】统计的4维空间(一维一层天)

【1012】到底做相关?还是方差分析呢?

【1011】这篇文章凭啥这样分组呢?

【1010】常用统计分析方法选择图解

【1009】P<0.05也别理直气壮,统计也会犯错,还分犯I类和II类错误?

【1008】文章鉴析:这篇文章或许有10处不适!

【1007】R×C卡方的Fisher确切概率法为什么会有卡方值

【1006】大小优指标如何同时制作ROC曲线[经验技巧]

【1005】统计方法与统计思想谁重要?

【1004】别说相关太简单,且听松哥说相关

【1003】正态分布10种鉴别方法汇总【荐藏】

【1002】连续变量变成等级变量后,原来有意义的变量变得没意义了?

【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢

------------------------------

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多