分享

医学研究人员为什么要学习R语言

 妙趣横生统计学 2019-12-08

 关于R语言,估计越来越多的人都听说过、感受过、甚至尝试过。也有各种各样的培训班,不乏付费的学习者。然后接触的人都说,R语言太难了!需要编程、需要强大逻辑思维能力、需要更丰富的统计学知识。但是在这里,我还是要呼吁,让R语言取代SPSS,成为你们首选的统计分析工具吧。

01

什么是R语言

R语言是用于统计分析、绘图的语言和操作环境。R是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

       

诸位大概都知道,统计分析领域常用的语言包括SPSS、SAS、Stata,因素,它们统称为统计分析软件。R语言也是一种数据分析工具。

R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种交互式实现。它的一些主要特征是:

       第一,它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。

       第二,R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。

       第三,R语言其实就是一种环境平台。它提供平台,而统计分析研究和计算机研究人员可以将各自通过编程形成的统计分析方法以打包(package)的方式放在R语言平台上,供一般的统计分析者直接使用。我们可以不懂统计分析原理,但是我们可以通过写一句命令就可以让软件调用统计分析包帮我执行某一个统计分析。

       第四,R语言的开放性, 它的更新速度比一般统计软件,如,SPSS,SAS等快得多。最新的统计分析方法,最复杂的方法都能在R语言上发现。

       第五,由于它比SPSS、SAS、Stata,注重于编程,相对来说学习起来具有一定难度,但它属于傻瓜式的编程。你能想到的所有统计相关的工作,R都可以非常简洁的用几行命令帮你完成。

02


医学研究者为什么要学习R语言

     统计学在医学研究中占据及其重要的地位。诸位都清楚,若要将医学研究做出成绩来,必须要学统计、会统计,能够掌握统计软件分析,处理分析数据并形成学术报告。因此,掌握一个或多个统计软件对医学研究大有裨益。一般来说,医学生最耳熟能详的统计软件包括三傻软件(SPSS)、二傻软件(SAS)和一傻软件(Stata)。最常见的是的是SPSS,属于非常傻瓜式软件,但功能齐全,完全可以应付大多数医学研究的数据分析任务;SAS和Stata属于初级编程软件,具有一定的难度,掌握的群体规模不大。既然SPSS都可以完成统计分析任务,我们为什么还要学习复杂的R语言呢?

    作为一名医学统计学教师,我列出以下几点学习R语言理由:

 · 首先,最最要的是,它是免费的。SPSS软件、SAS、Stata都是收费的,且十分昂贵,难以承受价格。不妨思考下,你们的研究所、医院、学校有购买SPSS吗?购买Stata吗?购买SAS吗? 估计大多数的回答是否!所以我们都是在侵权。在中国特有的版权文化下,我们大部分医学研究人员的的统计软件都是来自于网络而非厂商,而成本几乎为零。这种忽视知识产权的行为,应不能支持。所有医学研究人员应重视版权的问题,支持知识产权。所以,应该要支持R语言。

  · 其次,它的功能及其强大,且非常灵活。因为R语言本身为统计而生。所以你能想到的所有统计相关的工作。通过几十年的发展,R语言已经有1万多个专业人员制作的统计分析包,你想做的几乎所有事情都可以用现有的R包来辅助完成。不仅如此,最新的统计进展,往往R语言能够最先实现。其它大多数统计软件则需要公司的统计分析人员按部就班的进行编程、整合、然后进行软件迭代,这就是R语言的灵活性。 

   · 第三,R另一个杀手锏就是其强大的绘图功能R可以绘图,绘制各种各样的图,绘制各种各样高质量的图,绘制可以直接出版的图。完善的统计学功能再加上强大的绘图功能,就是你学习的最大理由。对于医学研究来说,你能够列举绘制图形优美的软件吗?SPSS、SAS,两个最常用的软件,却是制图最难看的统计软件;医学研究比较最常见的Graphprism,其实也好不到哪里去,我本人经常为图形汉字的乱码而懊恼。

   · 第四,医学研究本身需要一个简单的统计分析功能即可,R语言的学习仍有很大的困难,为什么还要大费周章呢。诸位都清楚,撰写统计报告也是人力密集型工作,因为常见软件的分析结果无法直接复制黏贴到统计报告中,必须要挑选合适的数值一个一个填充到绘制好的统计表(三线表)里。有没有减少精力的做法?当然有!R语言有一个强大的功能便是,帮你直接绘制出三线表、填好数据,统计报告结果一步到位这将是医学研究人员“爱上R语言”的最大动力。

如何构建回归模型系列推文

1.真实世界数据分析(1): 为什么是回归方法
2.困扰多年的问题:如何筛选自变量建立多因素回归模型
3.真实世界数据分析(3):基于DAG方法进行自变量的筛选
4.真实世界研究(4):简单案例分析中介变量的影响
5.先单因素后多因素----回归分析自变量筛选的常见方法
6.真实世界数据分析(6):自变量筛选的Change-in-Estimate法介绍

统计小食系列推文

(1)数据不是正态分布还能做t检验吗? 
(2)当正态、偏态、率的数据狭路相逢,如何绘制规范医学论文表格
(3)基本统计研究七宗罪,你犯了几条?来投个票吧
(4)方差分析后两两比较,究竟应该用哪种方法?
(5)再论“数据不是正态时,是否可以采用t检验?”
(6)“我的研究是基于量表的调查,如何计算样本量?”
(7)两组均数比较,可以用方差分析吗?谈谈结果一样的那些统计方法。
(8)趋势性检验还不会做?来看看最基本的趋势性检验方法
(9)临床研究基线均衡性比较除了用P值大小来反映,还可以用这种方法!




点击关注我们


了解更多医学论文写作方法、真实世界研究统计分析方法,请关注公众号:“医学论文与统计分析”或“medicalstat”

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多