分享

R语言开讲第一课

 迷途中小小书童 2018-11-20

1. 什么是R?

R是免费的,开源的,全面的统计研究平台,提供了各式各样的数据分析技术,R拥有顶尖的绘图功能


2.为什么要学习R

(1)大数据冲击各行各业,在数据背后隐藏了重要价值,我们想挖掘出来这些有用的东西,需要R语言的帮助,比如,找到与肿瘤转移有关的核心基因,找到预测生存的biomarker,这些数据挖掘一方面可以帮我们发现有价值的信息,另外可以帮我们把临床每天产生的大数据转化成SCI,并指导临床诊治的进步,生物信息分析可以帮我们博士开题,帮我们成功的开启一个国家自然基金课题,一个好的课题是不能没有生物信息分析的,而最适合我们搞医学和生物的工具就是R.

(2)招聘的时候优先,很多课题组,包括中科院、北大、清华、复旦等的实验室,都喜欢即会实验又会编程的高级人员,或者你精通编程,即使不会实验也可能有一个好的未来。

大数据时代,各行各业需要,但是在我学习的过程中,我发现,会R并且都医学的人很少,所以医学大数据处理的人才奇缺,今天我作为医生,从菜鸟开始学习R,跟我一起,赠送所有代码和讲解,并且可以提供线下服务。






学习R很有用哎,年薪30万,还有户口,你动心了没有?


3.逐渐入门,由浅入深

R主要做数据分析-6

数据采集----数据存储----数据统计----数据挖掘-----数据可视化----进行决策

数据挖掘:data mining,又称资料勘探,数据采矿。一般是指从大量数据中通过算法搜索隐藏与其中的信息的过程,属于探索未知。

数据统计:一般需要了解数据的分布,计算标准差,方差,偏度等。

数据可视化:这是R的强项,也是SCI的基本要求。

4. 为什么要选择R语言

做数据分析有很多语言,我们为什么要选择R语言呢,R语言基于S语言,R语言是自愿者共同开发,所以是免费的,并且不停有新的R包产生,R的开发人之一他并不是计算机专家而是生物学家,所以R最开始是用来做生物统计的。这个作者后来开发了非常著名的Bioconductor包,专门用来做生物计算,可以完成大量的生物数据分析。所以R是用于统计计算和统计绘图的优秀工具,掌握了R语言就可以完成统计分析数据挖掘的大部分工作。

5. R语言的特点

R非常方便做统计计算,比如数据量很大的时候求和,求方差标准差比较麻烦,但是用R一个函数就可以搞定的。



复杂的统计学算法同样很简单的实现,t检验,χ2检验,方差分析,回归分析,相关性分析等等。

R具有强大的绘图功能,R输出的图片在SCI中可以直接用的。

R仍然具有强大的扩展功能,可以开发新的R包。

R的官网:https://www./



网站包含了大量的R扩展包,可以通过CRAN下载R的扩展包,R语言在国内积累了大量用户。

R的缺点:R有很多扩展包,有很多类似功能或者重复功能,需要找到自己需要的,另外R不是很容易上手,需要一些时间。

4. R软件的安装

今天的任务,我们先把软件安装上。

首先要看自己的系统,windows系统,mac系统,linux系统

这里我们只举例windows系统。

先登录R的官网,点击CRAN,



会出现R的很多镜像站点,我们选择China的镜像站点即可,



看到镜像站点的下载链接,选择windows版本


点击base



点击Download R 3.5.1 for windows,R32位和64位版本是同一个安装包,并且你安装的时候可能不是这个版本,因为R一直在更新,但是方法是一样的。

下载完成之后就可以安装了,与windows系统其它软件安装一样的,点击下一步就可以了。安装后会在桌面上显示两个R的图标,双击任何一个都可以打开R软件。



当然这个界面还是需要简单的设置一下。

太晚了,明天我们继续吧!


目前大家先把R包安装好,还未涉及代码,后期涉及代码,我们会有免费赠送偶~!!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多