分享

R语言包,掌握这10个就够了!(含资源下载)

 world663 2018-01-08



作者:解螺旋.麦子

如需转载请注明来源:解螺旋·医生科研助手


导语

初入R语言大门的同学,可能会听说各种包。本来只想做一种运算,可能会有人跟你说,可以用XX包里的OO函数,还可以用OO包里的XX函数,还可以用……这到底是什么鬼?今天带大家来认识一下。


前面我们介绍了R语言基础入门《R语言学习起来太费劲?那是你没找对领路人(Geek伪装指南)》,今天麦子给你推荐几款最实用的语言包。


R语言的包,常常听到各种名字,扩展包、程序包、软件包、函数包、算法包……不如单名一个“包(Package)”字来的简单粗暴。它就像R语言这个游戏里要用到的装备,种种装备都各自有特定的功能(功能就是函数嘛,所以函数的英文也叫function)。想做数据分析,要配备数据分析的包,想画图,要用画图的包,所以要在R这个战场上玩转数据,就得配上不同的装备。


当然安装R的时候会有一些自带的包,用它们来做简单的分析也足够了,但对于复杂一点的分析,或者想要画出好看一点、复杂一点的图,就要安装稍高级一点的包。


你要问装这么多包,占空间吗?电脑会不会吃不消?放心好了,这不是你要担心的问题,每个包也就几百KB到几MB。你要担心的也许是选择困难,因为R语言的官网上现在已有9562个包了,而且还在不断涌现……不过这也恰是R的魅力,各种包使它拥有极佳的扩展性,能满足你无穷无尽的探索欲,让数据处理变得越来越轻松,也越来越好玩。


但探索是比较高级的玩法了,这里我们筛选10个实用又有意思的包,先屯起来,将来慢慢学习(享用)~.~

包的下载安装方法

还记得上回讲的“展示区”吗?我承认这个名字是我瞎起的,同时我也说到了这个区的功能比较杂,上回只用到了Plots选项卡,这回我们要用的Packages也在这个区里。




选中这个选项卡之后点Install,在弹出的对话框中,Install from这一栏选择Repository,在下面的Packages输入包的名字,此处以ggplot2这个包为例,设好安装路径(一般就用默认的),点Install,就等着 自动下载安装就可以了。不过好像有时候要翻墙。




或者也可以从本地安装,即从网上下载回来之后,在Install from里选择另一个选项,Package Archive File,选择事先下载好的包装上。


安装完成后要载入,就是在编辑栏输入


library(ggplot2) 然后运行,就可以使用里面的函数了。


第三种方法比较Geek(撞壁),就是在编辑栏输入install.packages(‘ggplot2’)并运行,然而这不就是刚才第一种方法安装时,在控制台里自动跳出来的那串代码嘛……所以RStudio真的比裸R省了好多事~


就用代码的方法安装gridExtra包试试看吧:




一样是输了一半就会有弹窗提示。这里我没有像上边一样加上引号,但没关系,选中提示里的包,回车键之后就会自动加上(可能加的是双引号,反正都能用)。


此处注意:R语言是区分大小写的!每一个命令都是如此。不过如果输错了,也会智能的给个提示:




所以很放心哒。Ok,一切都准备就绪,来看看都有哪些实用的包,边看边装咯~

十大好用的包

一、数据可视化


ggplot2

ggplot2是最常用、最受用户们喜爱的作图工具包了,被誉为数据作图的标杆。它做出的图不仅漂亮,而且可以涵盖很多复杂的信息。网上也有大量关于它的教程,学习资源很丰富。


gridExtra

ggplot2的一个缺点就是不能像自带的graphics基础包那样,把几张图拼成一组图。而gridExtra就可以解决这个问题,把ggplot2做出来的漂亮的图组织到一张大图里。


lattice

lattice经常被拿来和ggplot2相提并论,这两者也是选择困难户的纠结点。ggplot2做出来的图更漂亮,但它入门难啊~lattice则适合入门选手,作图速度较快,还能进行三维绘图,这是ggplot2不具备的。


二、统计分析


lme4 (或者nlme)

如果你常做一些复杂的数据,实验分了好几个层,有好多亚组,亚组下面还有亚亚组,比如要做好几种细胞,检测好几个指标,每个指标还有不同的观察时间点……此时lme4包就可以比较轻松地把这些数据组织起来。nlme也一样,选一个就好。


forecast

比较适合分析时间序列数据。


zoo

forecast里有很多好用的内置函数,但有时候还需要更简单易用的计算移动平均、移动标准差的函数,这时zoo会是个很好的补充。


spatstat

空间分析神器,比如某种疾病发病率在地理空间上的分布特征等等。


三、数据整理


dplyr

dplyr可以很好地把数据随意分解、整合。这个包可能也比较难上手,但熟悉之后,就像老司机开车一样形成本能。


四、生物信息学


Bioconductor

对于做基因组或芯片分析、阵列、基因流等等的小伙伴,Bioconductor是个好选择。它还有个很活跃的用户社区,可获得及时反馈,每年更新2次,还有丰富的学习资源,比如http://www./help/course-materials/这里的一系列教程。


五、展示


knitr

虽然一开始说到的数据可示化也是展示的一种,但这里要说的是,通过更丰富的方式来展示其他多种内容。除了数据分析成果,还有分析过程中各种代码、运行过程、文本说明等,都可以通过knitr生成网页、PDF、幻灯片等形式展示出来。比较适用于教学、报告等场合。


shiny

shiny包也像knitr一样可以做出漂高的网页,此外还可以快速搭建动态的交互网页App。它一大优势就是不需要学习其他网页编程语言(CSS、JS等),纯靠R。


stringr

字符串处理神器。可在作图、网页编辑、数据清洗等操作中起到很好的辅助作用,对字符串进行拼接、匹配、变换等。


以上都是一些比较出名、经常用到的包,尤其是ggplot2、lattice和dplyr,可以先装上以备不时之需。但偶尔还会要用到一些函数,不在你安装过的包里,而且还不知道在哪个包,怎么办?就是在Packages选项卡旁边的Help里搜索,返回的结果中看到“一串字母::你搜的函数”,前面那串字母就是包的名字啦,比如这个Kest函数就是在spatstat包里,下载、安装、载入就可以用了~




参考资料:

My 10 Favorite R Packages and the Cool Things You Can Do with Them

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多