继续今天的学习:今天介绍R包的安装,R语言的特点就是有大量第三方的扩展包,扩展包包括各行各业内容,金融数据,购物网站交易数据,生物数据等等。可以通过CRAN Task Views 查看R包的分类。 比如Enviromentrics环境数据,Finance金融数据,Genetics遗传数据,Machine learning机器学习等,根据自己研究方向到相应类目下寻找需要的R包,我搞医学生物学那么我去Genetics看看哈。 BioConductor可能会伴随我们后半生啦,它也是R语言的作者之一开发的。这些包扩展了R的功能,但是新手找到合适的包不是特别容易,因为R包实在太多了。我们先掌握基础的R学习,然后实践中在你的科研方向选择适合你自己的包。 1.R扩展包的安装 ①在线安装:自动解决包与包的依赖关系,install.packages(“vcd”),第一次安装R包会显示镜像站点列表,选择一个镜像站点即可。 安装好了vcd包,一定要加引号 那么包安装到哪里了呢,就是库的概念,使用.libPaths()函数显示R库library的位置 ②源代码安装:这个需要将要安装的包及其依赖包都下载,但是对于初学者这个操作比较复杂,这里略过,有兴趣的朋友自学吧,如果包的依赖关系很复杂我觉得我的逻辑思维能力还不够用。 更新R包,update.packages() 本来想演示一下,然后惹祸啦。 使用R包,首先安装好这个包,如果我们以前安装过,这次就不用再安装,但是每次使用之前我们要调用R包,调用的函数有library(),require() 而R的基础包,在R打开的时候就已经加载了,这个我们就不需要加载了。 R软件包组成:提供了默认函数和数据集。我们在Rstudio中可以看到函数来自哪个包。 Rstudio的可视化和提示性非常强,我们可以看到print()这个函数来自base包。 base:基础功能相关的函数 datasets:存放R内置的数据集,后面我们会经常用到 grDevices:绘图相关函数 graphics:基于base图形的R函数 stats:与统计相关的函数 methods:R对象定义的一般方法和类 splines、stats4、tcltk等基础包。 这些基础包不需要记住,但是我们了解对以后有好处,比如遇到问题不需要考虑是否因为没有安装这个包啊。 如果想了解一个包,我们可以通过help()命令查看该包的帮助文档 在右下方的help窗口会出现该包的帮助文档。 用library(help=”vcd”)查看包的信息 每个包里面有很多函数,我们要使用哪个函数的时候就要先安装所在的包,怎么查看这个包里都有什么函数呢? ls(“package:vcd”) 每个包里面有很多函数,我们要使用哪个函数的时候就要先安装所在的包,怎么查看这个包里都有什么函数呢? ls(“package:vcd”) 因为包已经被移除了,无法调用,如果需要使用,要重新安装的。 现在我遇到了一个问题,因为处理数据,数据量也非常大,有多大呢,我用的流量一周是20个G,并且这是一个真实的故事,那么电脑的性能不够,有时候影响我的进度,你知道的我是工作起来比较拼的,所以考虑换一台电脑,但是之前安装的R包很多很多,那么在新电脑上,我们就需要批量移植,以前我们会想到去寻找拷贝,以后不要哦,代码可以搞定的。 Installed.packages(),列出安装的R包,然后用下标访问数据框的第一列,install.packages()[,1] 然后将所有R包的名字赋值给Rpacks,然后将这个文件保存在Rpackage.data中。 然后在另外一个电脑中下载这个文件,这些就是要安装的R包,然后批量安装这些包,应用for循环。 如果有已经安装的R包,R会自动跳过。 今天其实涉及到了几个R包和函数,我整理一下放在平台,大家多练习,编程这个东西就是孰能生巧的,我自己练的也不够,不过一起加油吧! |
|